版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中心极限定理定理一:如果总体正态分布,则从总体中抽取容量为n的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否为正态,只要样本容量足够大,样本均数的分布也接近正态分布.定理2:定理3:中心极限定理定理一:如果总体正态分布,则从总体中抽取容量为n问题从某市随机抽取小学三年级学生60名.测得平均体重为28公斤,标准差为3.5公斤。试问该市小学三年级学生的平均体重是多少?
某教师用韦氏成人智力量表测量了100名高三学生,平均智商为115。那么我们是否能根据此信息了解该校所有高三的学生的平均智商呢?问题从某市随机抽取小学三年级学生60名.测得平均体重为28公第六章参数估计
第一节推断统计概述第二节参数估计原理第三节总体均数估计第四节相关系数的区间估计第六章参数估计第一节推断统计概述第一节概述一、统计推断(一)定义
由样本资料去推测相应总体情况的理论与方法(二)内容
根据推测的性质不同而分为参数估计与假设检验第一节概述一、统计推断参数估计点估计内容假设检验区间估计参数检验非参数检验Z检验t检验F检验Q检验符号检验符号秩次检验秩和检验中位数检验参数点估计内容假设区间估计参数非参数Z检验t检验F检验Q检验二、推断统计的有关问题1、样本代表性:2、推断错误有一定限度:随机抽样样本的规模小概率事件二、推断统计的有关问题随机抽样样本的规模小概率事件思考题一
某医学教授想研究吸烟与肺癌的关系,他抽取了500名患肺癌的吸烟男子,得出吸烟的人都患肺癌,或者说患肺癌的人都吸烟。对不对?为什么?另一位教授随机抽取了10名吸烟者,男女各半,结果10位吸烟者都没有患肺癌.他得出吸烟与患肺癌无关.对不对?又为什么?思考题一某医学教授想研究吸烟与肺癌的关系,他抽取了500名思考题二从长沙市随机抽取小学三年级学生60名.测得平均体重为28公斤,标准差为3.5公斤。试问北京市小学三年级学生的平均体重是多少?可不可以用推断统计?如果样本增加到600名,可不可以?为什么?思考题二从长沙市随机抽取小学三年级学生60名.第二节、参数估计的原理定义:根据样本的统计量去估计总体参数。包括点估计和区间估计。第二节、参数估计的原理定义:根据样本的统计量去估计总体参数。一、点估计(一)意义
含义:直接用样本统计量的值作为总体参数的估计值无偏估计量:恰好等于相应总体参数的统计量。
例8-1;假设某市六岁男童平均身高110.7cm,随机抽取113人测得平均身高110.70cm.总体的平均数,标准差是多少一、点估计(一)意义(二)良好点估计的条件无偏性:一致性:有效性:充分性无偏估计量的变异性问题。统计量是否充分反应全部总体信息。(二)良好点估计的条件无偏性:无偏估计量的变异性问题。统计量如从某市四个区的六岁儿童中随机抽取四个样本,对每个样本的身高求平均数,分别为100,108,122,115cm。试问该市所有六岁儿童的平均身高?如从某市四个区的六岁儿童中随机抽取四个样本,对每个样本的身高根据中心极限定理2,该市所有六岁儿童的平均身高为112.5cm根据中心极限定理2,该市所有六岁儿童的平均身高为112.5c二、区间估计(一)、定义与原理定义:按一定概率要求,根据样本统计量估计总体参数可能落入的范围的一种统计方法原理:样本分布理论二、区间估计(一)、定义与原理(二)置信度、显著性水平、置信区间和置信限置信度又称作置信系数定义:被估计的总体参数落在置信区间内的概率.符号:D。常用值:0.95和0.99(二)置信度、显著性水平、置信区间和置信限置信度又称作置信系显著性水平定义:是指估计总体参数落在某一区间时,可能犯错误的概率。符号:常用值:0.05和0.01显著性水平定义:是指估计总体参数落在某一区间时,可能犯错误的置信区间定义:特定可靠性程度下估计总体参数所在的区间范围。如果总体正态分布,总体均数区间估计的公式置信区间定义:特定可靠性程度下估计总体参数所在的区间范围。区间估计公式(总体正态分布)
()时,置信区间为,
()时,置信区间为,
即:即:区间估计公式(总体正态分布)
置信限:就是总体参数所落区间的上下界限。即置信下限置信上限置信标准误标准误(中心极限定理3)样本的标准差去估计总体的标准误标准误标准误(中心极限定理3)样本的标准差去估计总体的标准误
在某次测验中有10个正误判断题,试问在置信系数0.95时,能猜对多少题?置信度取0.95解:在某次测验中有10个正误判断题,试问在置信系数0.95时,结果解释:猜对2-8题的可能性为95%,猜对2题以下,8题以上的可能性为5%。结果解释:猜对2-8题的可能性为95%,猜对2题以下,8题以同步练习某研究者随机抽取30个高一学生的期中考试成绩,算出平均数为75,标准差为8,他想知道高一的总体平均成绩大概是在哪一个区间.置信度为0.99同步练习某研究者随机抽取30个高一学生的期中考试成绩,算出平高一的平均成绩为71.16~78.84.作此推断的把握为99%,也就是说犯错误的可能为1%高一的平均成绩为71.16~78.84.作此推断的把握为99
置信区间和置信系数的关系置信区间越大,置信系数越高;区间越小,置信系数越低。置信系数提高,置信区间必然加大,这种加大的区间本身就会降低估计的精确性,置信区间变窄,置信系数降低,估计的结果的真实性就令人怀疑。最佳估计值既要求置信区间适度,又要求置信系数较高。
置信区间和置信系数的关系置信区间越大,置信系数越高;点估计与区间估计的比较定义:点估计:直接以样本统计量(数轴上的一个点)作为总体参数的估计值区间估计:按一定概率要求,根据样本统计量估计总体参数可能落入的范围的一种统计方法。也就是说整体参数所落的有把握的范围。点估计与区间估计的比较定义:点估计:直接以样本统计量(数轴
相同点:都是用样本的统计量估计相应总体的参数。区别:点估计的总体参数是以数轴上的一个点来表示;区间估计的整体参数是以数轴上的一段距离来表示相同点:比较:点估计本身不能给出估计的误差及其可靠性的有关信息。区间估计能给出这些信息,所以区间估计比点估计更可靠。比较:思考题某心理学学生给初一班施测韦氏智力测验,得到20人的智商分数如下。他认为有10人没有参加测试,因而无法得到该班学生的平均智商,请问你能帮他解决吗?1151201009513011010010512010090858510010813010012011090思考题某心理学学生给初一班施测韦氏智力测验,得到20人的智商第三节总体均数估计估计总体平均数的步骤:1、计算样本2、计算3、确定置信水平或显著性水平并查表4、计算置信区间5、解释总体平均数的置信区间第三节总体均数估计估计总体平均数的步骤:一、正态估计法,
2已知1、前题条件:
总体正态,n不论大小一、正态估计法,2已知1、前题条件:2、使用正态分布统计量Z
标准误:D=0.95时,
D=0.99时,
2、使用正态分布统计量Z标准误:D=0.95时,D=0.9例:已知总体正态分布,,从这一总体中,随机抽取的两个样本,分别计算出,试问总体参数的0.95与0.99置信区间。例:已知总体正态分布,,从这一总体中,随解:1、条件分析:总体正态,已知,用正态法
2、计算标准误解:1、条件分析:总体正态,已知,用正态法2、计算3、确定置信水平并查表,置信度为0.95,置信度0.99,4、计算置信区间的样本估计3、确定置信水平并查表,4、计算置信区间D=0.95时
D=0.99时
D=0.95时D=0.99时的样本估计D=0.95时
D=0.99时
的样本估计D=0.95时D=0.99时5、解释:用样本1估计,总体的平均数落在73.6-82.4之间的可能性为95%,超出这一范围的可能性为5%。用样本2估计,总体的平均数落在76.7-80.3之间的可能性为95%,落在75.7-81.3的可能性为99%。
5、解释:用样本1估计,总体的平均数落在73.6-82.4之(二)、分布法,未知1、前提条件:总体正态分布,n不论大小,2、使用t分布统计量D=0.95时
D=0.99时
(二)、分布法,未知1、前提条件:总体正态分布例:总体正态,未知,,,,,,,试问总体平均数0.95的置信区间是多少?例:总体正态,未知,,解:1、条件分析:总体正态,未知,小于30,只能用分布2、计算标准误3、计算自由度解:1、条件分析:总体正态,未知,4、确定置信水平为0.95,查表得5、计算置信区间6、解释:总体平均数有95%的可能落在71.96~84.04之间。4、确定置信水平为0.95,查表得5、计算置信区间6、解释:1、条件分析:总体正态未知,>30,可用分布法与近似正态分布法
2、计算标准误3、计算自由度1、条件分析:总体正态未知,2、计算标准4、确定置信水平为0.95,查表得5、计算置信区间6、解释:总体平均数有95%的可能性落在75.9-82.1之间。4、确定置信水平为0.95,查表得5、计算置信区间6、解释:(三)
近似正态估计法1、前提条件:总体非正态,,不论方差已知或未知只能用近似正态法总体正态,未知,,可用分布法与近似正态法(三)近似正态估计法1、前提条件:D=0.95时
2、使用正态分布统计量Z标准误:D=0.99时
D=0.95时2、使用正态分布统计量Z标准误:D=0.99
例:某校100名学生参加化学效标参照测验(已知总体分布为偏态),其平均成绩为52.1分,标准差为9.7分,试问以95%的置信度进行估计该校所有学生的化学平均成绩会落在什么范围?例:某校100名学生参加化学效标参照测验(已知总体分1、条件分析:总体分布为非正态,未知,>30,只能用近似正态估计法。2、计算标准误3、确定置信水平为0.95,查表得1、条件分析:总体分布为非正态,未知,2、计算标准误4、计算置信区间5、结果解释:该校的平均成绩有95%的可能落在50.2~54.0之间。4、计算置信区间5、结果解释:该校的平均成绩有95%的可能落课堂练习已知某总体为正态分布,其总体标准差为10。现从这个总体中随机抽取n1=20的样本,其平均数分别80。试问总体参数μ在0.95和0.99的置信区间是多少。课堂练习已知某总体为正态分布,其总体标准差为10。现从这个总1、条件分析:总体分布为正态,且总体方差已知,用正态法进行估计。2、计算标准误3、确定置信水平为0.95,查表得1、条件分析:总体分布为正态,且总体方差已知,用正态法进行估D=0.95时
D=0.99时
4、计算置信区间D=0.95时D=0.99时4、计算置信区间解释:总体均数μ落在75.61-84.39之间的可能性为95%,超出这一范围的可能只有5%。而作出总体μ落在74.22-85.78之间结论时的正确概率为99%,犯错误的可能性为1%。解释:总体均数μ落在75.61-84.39之间的可能性为95现从某年级的数学成绩中(假设总体正态)随机抽取12名学生的成绩为93,70,90,92,69,95,82,83,88,81,84,77,试估计该年级的总体平均数在95%置信度时的区间。现从某年级的数学成绩中(假设总体正态)随机抽取12名学生的成1、条件分析总体为正态,总体方差未知,且样本容量小于30,用分布估计法
2、计算样本均数和标准差1、条件分析总体为正态,总体方差未知,且样本容量小于30,用3、计算标准误5、计算置信区间4、确定置信水平为0.95,查表得3、计算标准误5、计算置信区间4、确定置信水平为0.95,查答:该年级学生的平均成绩有95%可能为78.26~89.80分,有99%可能为76.02~91.32分。答:该年级学生的平均成绩有95%可能为78.26~89.80假设从某市随机抽取小学三年级学生60名,测得其体重平均为28公斤,标准差为3.5公斤。试问该市小学三学生的平均体重大约是多少?假设从某市随机抽取小学三年级学生60名,测得其体重平均为28区间估计方法比较区间估计方法比较(一)积差相关系数的抽样分布四、相关系数的区间估计1、,r的分布呈负偏态,,r的分布呈正偏
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国建筑玻璃行业发展分析及发展趋势预测与投资风险研究报告
- 2024-2030年中国婴儿用家具行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国在线招聘服务行业市场现状供需分析及市场深度研究发展前景及规划战略投资分析研究报告
- 2024-2034年中国无机化工新材料行业市场运行态势及投资战略咨询研究报告
- 2024-2034年中国新型动力电池市场运营态势分析及投资前景预测报告
- 2024-2034年中国手机内部元器件行业市场发展监测及投资战略咨询报告
- 2024-2034年中国幼儿教材行业市场现状分析及竞争格局与投资发展研究报告
- 2024-2034年中国宽带式砂光机行业市场深度分析及发展趋势预测报告
- 2024-2034年中国实罐码垛机行业发展概况及行业投资潜力预测报告
- 2024-2034年中国天然橡胶轮胎行业发展监测及投资战略咨询报告
- 《白酒团购营销方案》课件
- 机电题库2024(矿安益考试平台题库)
- 《园林艺术》课程标准
- 药店进销存流程管理
- 《中学生物学教学论》课程教学实施方案
- 中医师劳动合同
- 出国留学商业计划书
- 杭州良渚万科玉鸟集-修改
- 小学数学毕业测试题及答案三-小学数学六年级下册-升学模拟试卷-人教课标版-
- 供暖老旧管网问题分析报告
- 新灌装设备总结汇报
评论
0/150
提交评论