




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章抽样分配
1一般统计推论分成估计与检定两大领域,估计又分成点估计与信赖区间两种,27.1
估计与误差
生态学家认为南极海域的蓝鲸存量滨临绝种边缘,因此想知道现在的蓝鲸存量有多少?在这个问题中,蓝鲸存量就是我们感兴趣的『参数』3参数(蓝鲸存量)是多少?可能方法之一是将南极海域的水抽光后,数一数就可数出有多少尾蓝鲸较可行的方式是透过统计的手法获得资料再做推估
4例7.1、南极海域蓝鲸存量的估计
南极海域蓝鲸捕获量愈来愈少捕鲸协会想研究南极的蓝鲸存量有多少?
5方法1
捕获量比较法如第一次捕捉到270尾,第二次捕捉到243尾,少了10%。则估计为原有270/0.1=2700尾,但现在则有2187尾。
6
7方法2记号法设第一次捕捉到鲸鱼150尾,做记号后放回。第二次再捕100尾,其中有6尾有记号。则估计鲸鱼存量为:89估计与误差
10例男生比率某大学共有学生6672人,某教授想了解此大学中男生所占的比例。便在某角落观察经过的学生,看到100位中有40位女生、60位男生,因此他估计全校男生比率是0.6。11事实上,全校学生中有男生3091人、女生3581人,因此母体参数男生比例是
=3091/6672
0.46,而此教授估计男生的比例是0.6。12抽样误差其差距0.14有二种来源:一是由于抽样误差造成,如在同一角落多看几次(每次都是100人),所得男女生比例也会有不同。这种由于样本抽样所造成的误差,称之为“抽样误差”,是“随机性”,也是先天存在的。要获得抽样误差的数据,这要重覆做很多次(如几千次、几万次才能得到)。13假设此教授后来又观察了10天,每天都在同一角落观察100位学生,如果看到10次的男生人数分别如下:58506261465055525351由此10次算出平均数是54人,所以估计男生比例是0.54它与我们原先估计的男生比例是0.60,两者相差,
0.60-0.54=0.06即为抽样误差。14方法偏差
此教授在这个角落观察过往的学生,这种抽查方式也有可能造成偏差,也许这个角落离男生宿舍较近,男生经过的比例偏高,此为偏差的来源。如果每位学生(不论男女生)经过此角落机会均等,则看到男生的比例应是母体的比率0.46。事实上,因男生经过此角落的机会较大故造成看到男生的比例为0.54。此两者的差异0.54-0.46=0.08,即为方法偏差。150.60(估计值)=0.46(参数)+0.08(方法偏差)+0.06(抽样误差)
167.2样本平均数的分配
随机抽样得到一组资料x1,...,xn后,我们最常计算的两个统计量是样本平均数样本标准差S虽然资料是从同一母体抽样,但每次抽出的n个样本会不同,因此算出的样本平均数、标准差S也会不一样,所以我们称、S是“随机变量”17既然每次抽样算出的、S不同,我们有必要了解、S的抽样分布长象是如何?18抽样分配
19全国成年男人(约600万人)的
平均身高是多少公分?
2021600万人身高直方图22第一组抽样100位的身高资料
23样本平均数=168.8,标准差s=6.3。如果以这样的结果做母体平均数的估计,则估计误差是
-=169.5-168.8=0.7(公分)24第二组抽样100位的身高资料
25样本平均数=171.3,标准差s=6.8。如果以第二组抽样的平均数=171.3,当做所有全国成年人平均身高的估计,则估计误差为
-=169.5-171.3=-1.826随机变量由上面两次抽样结果,我们知道每次抽样的资料会变动(故称xi为“随机变量”)而得到的样本平均数也随之变动
(故也是随机变量)因此估计误差也是不确定的27抽样分布
28图7.3
全国成年男人抽样100位平均身高X的分布
010020030040050060070080090010001100120013001400166.4166.8167.2167.6168.0168.4168.8169.2169.6170.0170.4170.8171.2171.6172.0172.4
次数
29(1)此直方图应像对称的钟形(即常态分配)。(2)此直方图的中心点(也就是直方图最高的部份)仍然是在169.5附近。(3)此直方图比原先600万位身高所画直方图更集中在中心点附近,即这些的标准差较原先母体Xi的标准差小。(4)这10,000个平均数的标准差是0.653比原先的母体(600万人的身高)的标准差6.5小很,大约是原来的1/10。301.误差在1公分之内的机会
?抽样误差312.估计误差在1.3公分之内的机率?
抽样误差323.控制估计误差在1公分之内而对的机会有95%时,那应取多少样本呢?
信赖度33全国成年女生610万人其身高分布
010020030040050060070080090010001100136140144148152156160164168172176180184188192196200
次数(单位:千人次)
34图7.5
全国成年人身高分布
01002003004005006007008009001000110012001300136140144148152156160164168172176180184188192196200
所有成年人的平均身高是
m=164.21,标准差
s=7.8831。
次数(单位:千人次)
35367.3
大数法则37中央极限定理常态分配在理论上有很多好的结果,统计学上常假设资料是常态分配,例如常听到常态分班、常模、常态曲线等等这些假设的依据是什么呢?就是中央极限定理的功劳
38中央极限定理
39中央极限定理40(1)「不论原母体是什么分配」,不管母体资料是连续型或离散型、对称或不对称、右偏或左偏,甚至是单峰或多峰都无所谓,只要样本数n“足够大”,分配就会变成像钟形的常态分配。41(2)抽样样本数不论是多少个,代表资料“中心点”的样本平均数的期望值与原母体分配的期望值都相同
4243(i)常态母体
44(ii)右偏母体
45(iii)均匀母体
46(iv)二项分配母体
47
7.4样本数的决定
48误差界限
所需抽样样本数n
49例95%信心水平e≤1
50例95%信心水平e≤0.5
51(1)误差要求愈小,则所需样本数就要愈大。如上例中误差e=1,当要求误差降低到e=0.5,则样本数需要增加到4162.3=650位。(2)信赖度愈大(即愈小),则样本数也要愈多。(3)标准差
愈大,则要求的样本数也愈多。52(4)实务上,通常是不知道的。因此需要用其他方式对做大约的估计。例如以主观估计=7.2,或是由主观认为全国最高为200公分,最低150公分,全距是50公分,但全距大约是8,因此由8=50,得
=6.25。另外也可先抽几个样本(例如10个),算出样本标准差S,以此做的估计,然后再由(7.9)式,求出样本数n
。537.5样本变异数的分布与卡方分配
5455卡方分配
56卡方分配密度函数
57图7.11
卡方分配密度函数图
58如果不是标准常态
而是一般的常态平方和所组成是否也是卡方配呢?59答案
不是
60不是标准常态而是一般的常态平方和所组成
61样本变异数的分布
62答案
:是
其自由度变成n
-1,这是因为参数被估计值取代,因此牺牲了一个自由度
6364样本变异数的分布不是常态
而是右偏的卡方分布
6566例7.2、如果从标准常态母体中每次抽4个,得x1,x2,x3,x4,再计算这样重覆做10000次,得到10000笔数据试画其直方图
676869卡方分配查表
70图7.13
之几何意义
71查附表
72卡方分配的应用
卡方分配主要用在检定
(检定定义在第八章)它可用来检定资料是否适合某种分配
(适合度检定)或是检定一组常态分配资料其变异数是否等于某数。73另外当母体标准差未知时,如要对母体平均数m做统计推论,更需要用到样本变异数的分配由卡方分配才导出7.6与7.7节所要讨论的t分配与F分配。747.6t分配
75“自由度k的t分配定义
76自由度n
-1的t分配
77自由度k的t分配的密度函数
78图7.14t分配密度函数图
798081注
(i)t分配是对称图形,它的形状与常态分配相似,不过往两边下降速度较常态分配缓慢。(ii)当自由度k愈大时,
t分配就愈接近标准常态分配。
82t分配查表
8384查t
附表
85注
867.7F分配
87F分配的密度函数
88图7.17F分配图
899091F分配查表
9293查F分配表
94第七章摘要951.欲估计母体的参数
需要抽样(一般不做普查,原因费时费力),抽样的估计值与母体参数不会相同会有误差,其关系式为估计值=参数+方法偏差+抽样误差
962.方法偏差
方法偏差是人为的疏忽应避免,例如方便的资料等所造成的偏差。抽样误差是自然的因素虽非人为的,但也可由对资料的认知降低误差,例如以分层随机抽样取代简单随机抽样就能降低抽样误差
97抽样样本数的决定
984.了解中央极限定理的意义、应用及其重要性
995.以身高资料说明的抽样分布会接近常态
100标准误与标准差的关系
1017.与常态分配相关之分配,包括卡方分配、分配、分配。了解各种分配定义及分配图长像与用途,但初学者不用强记密度函数
1028.卡方卡方是标准常态分配的平方,其自由度为平方和的个数,但每个标准常态间必须独立
1039.分配与分配间的关系:
10410.t分配
是用在母体标准差未知时,的分布(7.20式)
105(第14讲)考场作文开拓文路能力•分解层次(网友来稿)江苏省镇江中学陈乃香说明:本系列稿共24讲,20XX年1月6日开始在资源上连载【要义解说】文章主旨确立以后,就应该恰当地分解层次,使几个层次构成一个有机的整体,形成一篇完整的文章。如何分解层次主要取决于表现主旨的需要。【策略解读】一般说来,记人叙事的文章常按时间顺序分解层次,写景状物的文章常按时间顺序、空间顺序分解层次;说明文根据说明对象的特点,可按时间顺序、空间顺序或逻辑顺序分解层次;议论文主要根据“提出问题-—分析问题——解决问题”顺序来分解层次。当然,分解层次不是一层不变的固定模式,而应该富于变化。文章的层次,也常常有些外在的形式:1.小标题式。即围绕话题把一篇文章划分为几个相对独立的部分,再给它们加上一个简洁、恰当的小标题。如《世界改变了模样》四个小标题:寿命变“长”了、世界变“小”了、劳动变“轻”了、文明变“绿”了。2.序号式。序号式作文与小标题作文有相同的特点。序号可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”……从全文看,序号式干净、明快;但从题目上看,却看不出文章内容,只是标明了层次与部分。有时序号式作文,也适用于叙述性文章,为故事情节的展开,提供了明晰的层次。3.总分式。如高考佳作《人生也是一张答卷》。开头:“人生就是一张答卷。它上面有选择题、填空题、判断题和问答题,但它又不同于一般的答卷。一般的答卷用手来书写,人生的答卷却要用行动来书写。”主体部分每段首句分别为:选择题是对人生进行正确的取舍,填空题是充实自己的人生,判断题是表明自己的人生态度,问答题是考验自己解决问题的能力。这份“试卷”设计得合理而且实在,每个人的人生都是不同的,这就意味着这份人生试卷的“答案是丰富多彩的”。分解层次,应追求作文美学的三个价值取向:一要匀称美。什么材料在前,什么材料在后,要合理安排;什么材料详写,什么材料略写,要通盘考虑。自然段是构成文章的基本单位,恰当划分自然段,自然就成为分解层次的基本要求。该分段处就分段,不要老是开头、正文、结尾“三段式”,这种老套的层次显得呆板。二要波澜美。文章内容应该有张有弛,有起有伏,如波如澜。只有这样才能使文章起伏错落,一波三折,吸引读者。三要圆合美。文章的开头与结尾要遥相照应,把开头描写的事物或提出的问题,在结尾处用各种方式加以深化或回答,给人首尾圆合的感觉。【例文解剖】话题:忙忙,不亦乐乎忙,是人生中一个个步骤,每个人所忙的事务不同,但是不能是碌碌无为地白忙,要忙就忙得精彩,忙得不亦乐乎。忙是问号。忙看似简单,但其中却大有学问。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦乐乎,却并不简单。人生如同一张地图,我们一直在自己的地图上行走,时不时我们眼前就出现一个十字路口,我们该向哪儿,面对那纵轴横轴相交的十字路口,我们该怎样选择?不急,静下心来分析一下,选择适合自己的坐标轴才是最重要的。忙就是如此,选择自己该忙的才能忙得有意义。忙是问号,这个问号一直提醒我们要忙得有意义,忙得不亦乐乎。忙是省略号。四季在有规律地进行着冷暖交替,大自然就一直按照这样的规律不停地忙,人们亦如此。为自己找一个目标,为目标而不停地忙,让这种忙一直忙下去。当目标已达成,那么再找一个目标,继续这样忙,就像省略号一样,毫无休止地忙下去,翻开历史的长卷,我们看到牛顿在忙着他的实验;爱迪生在忙着思考;徐霞客在忙着记载游玩;李时珍在忙着编写《本草纲目》。再看那位以笔为刀枪的充满着朝气与力量的文学泰斗鲁迅,他正忙着用他独有的刀和枪在不停地奋斗。忙是省略号,确定了一个目标那么就一直忙下去吧!这样的忙一定会忙出生命灵动的色彩。忙是惊叹号。世界上的人都在忙着自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜为回报。那么人呢?居里夫人的忙,以放射性元素的发现而得到了圆满的休止符;爱因斯坦在忙,以相对论的问世而画上了惊叹号;李白的忙,以那豪放的诗歌而有了很大的成功;张衡的忙,因为那地动仪的问世而让世人仰慕。每个人都应该有效率的忙,而不是整天碌碌无为地白忙。人生是有限的、短暂的,因此,每个人都应该在有限的生命里忙出属于他的惊叹号;都应在有限的生命里忙出他的人生精彩篇章。忙是万物、世界、人生中都不可缺少的一部分。作为这世上最高级动物的我们,我们在忙什么呢?我们要忙得有意义,有价值,我们要忙出属于我们的精彩。我们的忙不能永远是问号,而应是省略号和感叹号。忙就要忙得精彩,忙得不亦乐乎。解剖
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 混凝土施工现场质量管控方案
- 高考语文阅读理解真题分析
- 专利申请进展管理年度计划
- 建筑施工环保监测方案设计
- 市政桥梁安全监测及维护方案
- 物业公司节假日值班安排方案
- 医护人员岗位职责与敬业精神演讲
- 一年级音乐基础知识点总结
- 建筑施工合同管理规范与实例
- 电力公司设备维护检修计划
- 高考物理力学专题复习指导方案
- 2025年少先队大队委笔试试卷及答案
- 证券业反洗钱培训课件
- GJB3165A-2020航空承力件用高温合金热轧和锻制棒材规范
- 2025年执业药师考试题库大全-附答案
- 退换货方案及措施
- 2025年食药监局考试题库
- 密室逃脱消防应急预案
- 伟星PPR培训课件
- 2025年协作机器人产业发展蓝皮书-高工咨询
- 《2024中国低空物流发展报告》
评论
0/150
提交评论