版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计量及其抽样分布目前一页\总数五十九页\编于二十点第6章统计量及其抽样分布6.1统计量6.2关于分布的几个概念6.3由正态分布导出的几个重要分布
6.4样本均值的分布与中心极限定理6.5样本比例的抽样分布6.6两个样本平均值之差的分布6.7关于样本方差的分布
目前二页\总数五十九页\编于二十点了解统计量及其分布的几个概念了解由正态分布导出的几个重要分布
理解样本均值的分布与中心极限定理掌握单样本比例和样本方差的抽样分布学习目标目前三页\总数五十九页\编于二十点6.1
统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量
6.1.4充分统计量
目前四页\总数五十九页\编于二十点设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础统计量
(statistic)目前五页\总数五十九页\编于二十点一组样本观测值X1,X2,…,Xn由小到大的排序
X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,称X(1),X(2),…,X(n)为次序统计量中位数、分位数、四分位数等都是次序统计量次序统计量目前六页\总数五十九页\编于二十点6.2
关于分布的几个概念6.2.1抽样分布6.2.2渐进分布6.2.3随机模拟获得的近似分布
目前七页\总数五十九页\编于二十点样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布
(samplingdistribution)目前八页\总数五十九页\编于二十点6.3由正态分布导出的几个重要分布6.3.12分布6.3.2t
分布6.3.3F
分布目前九页\总数五十九页\编于二十点2分布目前十页\总数五十九页\编于二十点χ2
分布的使用如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从χ2
分布方差就可视为若干随机变量值的平方和样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方差之比,服从自由度为n-1的χ2
分布目前十一页\总数五十九页\编于二十点由阿贝(Abbe)
于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)
分别于1875年和1900年推导出来设,则令,则Y服从自由度为1的2分布,即
当总体,从中抽取容量为n的样本,则2分布
(2
distribution)目前十二页\总数五十九页\编于二十点分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称期望为:E(2)=n,方差为:D(2)=2n(n为自由度)可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布2分布
(性质和特点)目前十三页\总数五十九页\编于二十点c2分布
(图示)不同容量样本的抽样分布c2n=1n=4n=10n=20目前十四页\总数五十九页\编于二十点t
分布目前十五页\总数五十九页\编于二十点t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出
t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布目前十六页\总数五十九页\编于二十点t分布图示xt
分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z目前十七页\总数五十九页\编于二十点T
分布的图形目前十八页\总数五十九页\编于二十点T
分布的使用目前十九页\总数五十九页\编于二十点F
分布目前二十页\总数五十九页\编于二十点F分布两个都服从χ2
分布的变量之比的分布规律。可以设想为两个方差之比方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)目前二十一页\总数五十九页\编于二十点由统计学家费希尔()
提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布
(F
distribution)目前二十二页\总数五十九页\编于二十点F分布两个都服从χ2
分布的变量之比的分布规律。可以设想为两个方差之比方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)目前二十三页\总数五十九页\编于二十点F分布
(图示)
不同自由度的F分布F(1,10)(5,10)(10,10)目前二十四页\总数五十九页\编于二十点F分布的图形此处的n和m分别相当于n1、n2目前二十五页\总数五十九页\编于二十点F分布的使用应用很广泛,可用来检验两状态总体方差是否相等,检验回归方差是否有代表性,在方差分析和多元统计中都是重要的检验手段。目前二十六页\总数五十九页\编于二十点三种抽样分布的对比χ2分布可视为关于方差的分布规律。t分布中的两个变量,一个服从正态分布,另一个服从χ2分布。可视为均值与方差之比的分布规律。F分布的变量都服从χ2分布,可以设想为两个方差之比的分布规律。这些“分布”都说明变量的规律,某些具有相同特征的变量具有什么样的共同规律。现实中,按图索骥,依样画葫芦。目前二十七页\总数五十九页\编于二十点三种抽样分布综述为什么要使用统计方法?因为要了解事物的数量特征几乎惟一的方法是抽样,随机抽样抽样可以有很多结果,众结果的随机性规律是正态分布为什么要导出三大抽样分布?因为要了解的数量特征的性质不同,比如,可能要了解样本方差的规律若干个变量都服从正态分布,每变量有不同取值,计算每组取值中各值的平方,再加起来,该总和服从χ2
分布每次抽样的误差与平均误差之比服从t分布两个样本的方差之比服从F分布什么是分布?骰子点数服从均匀分布,身高服从正态分布。分布就是各种情况发生概率的全体组合。目前二十八页\总数五十九页\编于二十点6.4样本均值的分布与中心极限定理目前二十九页\总数五十九页\编于二十点抽样分布抽样分布从总体种抽出容量相同的样本,计算统计量的值,然后按统计量的值所编制的频数分布。抽样分布的作用:根据抽样分布研究统计量的性质对统计推断方法进行评价目前三十页\总数五十九页\编于二十点
抽样分布:样本统计量所有可能值的概率分布。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量分布的形状及接近总体参数的程度STAT目前三十一页\总数五十九页\编于二十点知道这些“分布”有什么用?从现象上看,事物非常复杂,但其中某些内容具有某种意义上的相同性质(比如7条鱼与7天之间都有7这个数量)从逻辑上看,可以在某些限定条件下构造许多模型,即数量关系(此处都用“等于”关系),这些关系的总和都符合逻辑,现实中事物如果符合那些限定条件,则其本角度的其他特征(可视为进一步的发展结果)都会服从逻辑模型所表述的变化规律统计分布类型就是:在某些限定条件下,考察不同类型的个别数量现象在总体上具有什么样的分布特征,熟知的如正态分布。这些模型的结果告诉我们各种情况出现的可能性。目前三十二页\总数五十九页\编于二十点抽样分布分布的特征值:均值和标准差样本主要统计量:平均数比率(成数)方差STAT《统计学》第四章抽样估计目前三十三页\总数五十九页\编于二十点在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布目前三十四页\总数五十九页\编于二十点样本均值的抽样分布
与中心极限定理=50
=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x
的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)目前三十五页\总数五十九页\编于二十点中心极限定理
(centrallimittheorem)当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为
2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x目前三十六页\总数五十九页\编于二十点学生ABCDEFG成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布样本均值样本均值样本均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数443211二者均值相等样本均值的平均数总体的平均数目前三十七页\总数五十九页\编于二十点平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的。STAT目前三十八页\总数五十九页\编于二十点
AnexampleAdieisthrowninfinitelymanytimes.LetXrepresentthenumberofspotsshowingonanythrow.一个骰子被投掷了无数次,用X表示每一次出现的点数.TheprobabilitydistributionofXisx123456p(x)1/61/61/61/61/61/6E(X)=1(1/6)+2(1/6)+3(1/6)+………=3.5V(X)=(1-3.5)2+(2-3.5)2+……………….=2.92目前三十九页\总数五十九页\编于二十点Supposewewanttoestimatemfromthemeanofasampleofsizen=2.Whatisthedistributionthatcanfollow样本平均的分布是什么样?目前四十页\总数五十九页\编于二十点11.52.02.53.03.54.04.55.05.56.06/365/364/363/362/361/36E()=1.0(1/36)+1.5(2/36)+….=3.5V(X)=(1.0-3.5)2(1/36)+(1.5-3.5)2(2/36)...=1.46目前四十一页\总数五十九页\编于二十点111666Noticethatissmallerthansx.Thelargerthesamplesizethesmaller.Therefore,tendstofallclosertom,asthesamplesizeincreases.目前四十二页\总数五十九页\编于二十点Simulationofdicetossingn=2n=5n=10Mean=3.494 Stand.Dev.=0.544Mean=3.486 Stand.Dev.=1.215Mean=3.495 Stand.Dev.=0.749目前四十三页\总数五十九页\编于二十点Thevarianceofthesamplemeanissmallerthanthevarianceofthepopulation.样本平均数方差小于总体方差123Also,Expectedvalueofthepopulation=(1+2+3)/3=2Mean=1.5Mean=2.5Mean=2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expectedvalueofthesamplemean=(1.5+2+2.5)/3=2Comparethevariabilityofthepopulationtothevariabilityofthesamplemean.Letustakesamplesoftwoobservations目前四十四页\总数五十九页\编于二十点TheSamplingDistributionoftheSampleMean样本平均数分布目前四十五页\总数五十九页\编于二十点抽样推断的理论基础
大数定律大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。其一般意义是:在随机试验过程中,每次试验的结果不同,但大量重复试验后,所出现结果的平均值总是接近某一确定的值。
中心极限定理
第一,如果总体很大,而且服从正态分布,样本平均数(或成数)的分布也同样服从正态分布。第二,如果总体很大,但不服从正态分布,只要样本容量足够大(n≥30),样本平均数(或成数)的分布趋近于正态分布。第三,样本平均数(或成数)的平均数,等于总体平均数(或成数)。
目前四十六页\总数五十九页\编于二十点目前四十七页\总数五十九页\编于二十点目前四十八页\总数五十九页\编于二十点STAT《统计学》第四章抽样估计样本均值4547.55052.55557.560出现次数1123445离差-15-12.5-10-7.5-5-2.50样本均值62.56567.57072.575出现次数443211离差2.557.51012.515学生ABCDEFG成绩30405060708090离差-30-20-10010203020=s目前四十九页\总数五十九页\编于二十点中心极限定理
(centrallimittheorem)x的分布趋于正态分布的过程目前五十页\总数五十九页\编于二十点6.5样本比例的抽样分布目前五十一页\总数五十九页\编于二十点总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为
比例
(proportion)目前五十二页\总数五十九页\编于二十点在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年北京社会管理职业学院单招职业技能测试题库含答案详解(完整版)
- 2026年内江职业技术学院单招职业适应性考试题库及一套参考答案详解
- 2026年内蒙古化工职业学院单招职业倾向性测试题库及答案详解(典优)
- 2026年保定理工学院单招综合素质考试题库及答案详解(易错题)
- 2026年北海康养职业学院单招职业技能考试题库带答案详解(a卷)
- 2026年克拉玛依职业技术学院单招职业技能测试题库带答案详解
- 2026年厦门华天涉外职业技术学院单招职业技能测试题库附参考答案详解(研优卷)
- 2026年厦门华天涉外职业技术学院单招职业技能考试题库带答案详解ab卷
- 2026年内蒙古化工职业学院单招职业倾向性测试题库及一套完整答案详解
- 2026年信阳涉外职业技术学院单招职业倾向性测试题库及完整答案详解
- 智能网联汽车感知技术与应用 课件 项目1 智能网联汽车感知技术概述
- 2026年1月上海市春季高考数学试题卷(含答案)
- 2026年沈阳职业技术学院单招职业技能考试题库及答案详解一套
- 2025年本科院校基建处招聘笔试预测试题及答案
- 2023年高考历史真题新课标卷及解析
- 歌颂内蒙古的诗歌
- uom理论考试题库及答案2025
- 2025年文字排版与设计考试试题及答案
- 不良资产差额配资合作协议6篇
- 新能源充电桩施工方案
- 2015-2024年十年高考地理真题分类汇编专题03 地球上的大气(原卷版)
评论
0/150
提交评论