




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学原理,主讲:李晓辉,第一节统计量第二节大数定律与中心极限定理第三节由正态分布导出的几个重要分布第四节常用的抽样方法第五节抽样分布,第五章抽样与抽样分布,第一节统计量,统计量(statistic):描述样本特征的概括性数字度量,根据样本数据计算的一个随机变量,是对总体分布特征推断的工具。,设X1,X2,Xn为总体X的样本,如果样本的函数g(X1,X2,Xn)是一个随机变量,并且不包含任何未知参数,则称g(X1,X2,Xn)为统计量。,几个常用的统计量:,1.样本均值:,2.样本方差:,3.样本标准差:,第二节大数定律与中心极限定理,一、大数定律,大数定律(lawsoflargenumbers)也称大数法则,它是阐述大量同类随机现象的平均结果稳定性的规律。,辛钦大数定理,设随机变量X1,X2,Xn相互独立,服从同一分布,且具有数学期望EXi=(i=1,2,n)则对任意0,有,定律表明:只要随机变量独立同分布,即使不存在有限方差,其数学期望仍可由n个随机变量的算术平均值作为其近似值。,二、中心极限定理,在统计学中,论证随机变量和的极限分布是正态分布的一系列定理统称为中心极限定理(centrallimittheorem)。,独立同分布中心极限定理,设X1,X2,Xn是独立同分布的随机变量序列,且存在有限的数学期望EXi=和方差DXi=2(i=1,2,n),那么当n时,,中心极限定理为均值的抽样推断奠定了理论基础。不论总体服从何种分布,只要期望和方差存在,对这一总体进行重复抽样,当样本量充分大,样本均值就趋于正态分布。,棣莫佛拉普拉斯中心极限定理,定理表明,当n很大,np和n(1-p)(n是试验的次数,p是试验中事件A发生的概率)也都不太小时,二项分布可以用正态分布去近似。,第三节由正态分布导出的几个重要分布,由样本统计量对未知总体分布进行推断,必须知道统计量所服从的分布。本节介绍几个重要的常用统计量分布:2分布,t分布,F分布。,一、分位数,设X为随机变量,对给定的概率(10),若实数F满足不等式,则称F为随机变量X分布概率为的上侧分位数。,若实数T/2满足不等式,则称T/2为随机变量X分布概率为的双侧分位数。,标准正态分布的上侧分位数,Z,0,Z,标准正态分布的双侧分位数,/2,/2,Z,0,-Z/2,Z/2,设X1,X2,Xn是取自标准正态总体的样本,则随机变量服从具有n个自由度的2分布,记为,c2-分布(2-distribution),不同自由度的c2-分布,c2,n=1,n=4,n=10,1.变量值始终为正2.通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称3.期望E(2)=n,方差D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V服从自由度为n1+n2的2分布,c2-分布性质和特点,t-分布(t-distribution),设XN(0,1),Y2(n),且X与Y相互独立,则称,服从自由度为n的t分布,记为tt(n),t分布的性质:(1)与正态分布一样,是对称的,但比正态分布要平一些。(2)自由度充分大时,t分布近似于正态分布。自由度趋向无穷大时,t分布就是标准正态分布。(3)t分布的均值为0,其方差为n/(n-2)。,设X2(m),Y2(n),且X与Y相互独立,则称服从自由度m和n的F分布,记为,F-分布(Fdistribution),不同自由度的F分布,右偏分布,第四节常用的抽样方法,通常有以下几种抽样方法:简单随机抽样分层抽样系统抽样整群抽样多阶段抽样,一、简单随机抽样,对总体未作任何处理,按随机原则直接从总体中抽出若干单位构成样本.,抽取样本的具体方法:,抽签法:将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。,随机数表法:将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。仅适用于规模不大、内部各单位标志值差异较小的总体,直接抽选法,先将总体按某一标志分层,然后从各层中按随机原则抽取样本单位组成样本。,二、分层抽样,实质上是分组法与随机原则的结合。,例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。,样本在各层间的分配方法:,等比例分配法:按各层单位的比例分配样本单位。,类型抽样的优点:,能提高样本的代表性;组织起来较为方便;,先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。又称机械抽样或等距抽样。,三、系统抽样,系统抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。,按无关标志排队,按有关标志排队,排序和所研究标志数值大小无关。如调查居民生活水平时,按姓氏笔划排队。,排序和所研究标志数值大小有密切关系。如居民收入调查,按银行存款多少排序。,根据样本抽选的方法不同,可分为:,随机起点系统抽样,半距起点系统抽样,对称起点系统抽样,(总体单位按某一标志排序),(总体单位按某一标志排序),(总体单位按某一标志排序),系统抽样的好处:,1.可以使抽样过程大大简化,减轻抽样的工作量;,2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。,按有关标志排队系统抽样,实际上是一种特殊的分层抽样。,将总体全部单位分为若干“群”,然后以群作为抽样单位,从总体中抽取若干群作为样本,并对中选群的所有单位进行全面调查。,例:总体群数R=16样本群数r=4,样本容量,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,四、整群抽样,五、多阶段抽样某公司要进行全国性的产品售后服务满意度调查时,通常是先抽几个省,然后从抽中的省中抽取若干个城市,从抽中的城市中,再抽取若干个县、村,最后再抽到户,这种抽样方式就是多阶段抽样。,第五节抽样分布,一、抽样分布概念,样本统计量取值的概率分布,叫抽样分布(samplingdistribution)。是推断统计中用样本推断总体时的重要理论依据。,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的概率分布推断总体均值的理论基础,二、样本均值的分布,总体服从正态分布N(,2),该总体的任何容量的样本均值x也服从正态分布,x的期望值为,方差为2/n。即xN(,2/n),从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n(30)充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,样本均值的抽样分布趋于正态分布,任意分布的总体,样本均值抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,样本均值正态分布,样本均值正态分布,样本均值非正态分布,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为,三、样本比例的分布(proportion),在重复选取容量为n的样本时,由样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业品牌病虫害防控策略分析报告
- 南京鼓楼市中考数学试卷
- 医疗废物处理流程改进分析报告
- 菌渣有机肥开发分析报告
- 冷冻水产品线上渠道分析报告
- 2025年肠类制品项目合作计划书
- 七彩联盟11月数学试卷
- 全国一百所名校数学试卷
- 去哪里找数学试卷
- 泸州小学毕业数学试卷
- 第16课 探索国家出路与挽救民族危亡的努力(课件)-【中职专用】《中国历史》魅力课堂教学三件套(高教版2023•基础模块)
- 全国大学英语四级考试考试大纲(2023修订版)
- 防范工贸行业典型事故三十条措施解读
- 幼儿园食谱营养计算表
- 2025届甘肃省平凉市中考物理试题试卷含解析
- DL∕T 1881-2018 智能变电站智能控制柜技术规范
- 中国慢性冠脉综合征患者诊断及管理指南2024版解读
- 学校食堂餐饮服务投标方案(技术标 )
- 中建技术总工(技术负责人)竞聘报告
- 延期交房违约金赔付委托书
- 知识题库-人社练兵比武竞赛测试题及答案(六)
评论
0/150
提交评论