变量分布特征的描述续+抽样分布9课件_第1页
变量分布特征的描述续+抽样分布9课件_第2页
变量分布特征的描述续+抽样分布9课件_第3页
变量分布特征的描述续+抽样分布9课件_第4页
变量分布特征的描述续+抽样分布9课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本科课程陈宜治系列课件统计学课件制作:陈宜治 作业订正3、1)平均每个企业利润额=203.70(万元); (2)全公司平均资金利润率=13.08%。4、(1)全厂总合格率、平均合格率和平均废品率分别是92.17%、97.32%和2.68%;(采用几何平均法) (2)全厂总合格率、平均合格率和平均废品率分别是97.31%、97.31%和2.69%;(采用调和平均法) (3)全厂总合格率、平均合格率和平均废品率分别是97.38%、97.38%和2.62%。(采用算术平均法) 3.方差、标准差的性质(1)常数的方差为0(2)若为常数,则(3)标准差是计算标准化值的依据 标准得分,标准统计值(六)离散

2、系数(Coefficient of Variation) 1.定义:离散系数也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。 2.计算公式V和Vs分别表示总体离散系数和样本离散系数。离散系数用于对不同组别数据的离散程度进行比较时,离散系数大的说明该组数据的离散程度也就大,离散系数小的说明该组数据的离散程度也就小。相对标准差城市人均年收入(元)收入标准差(元)标准差系数甲城市60001502.5乙城市120001801.5例3.25:甲乙两个城市的居民年收入情况如表所示,试比较两城市居民收入分配的均衡性。从表中前三栏数据来看,乙城市不仅人均年收入两倍于甲城

3、市,而且收入的差距也似乎显著于甲城市。但通过计算标准差系数,乙城市的实际收入差距相对于它的平均收入来说,比甲城市要低的多。或者说,以居民对收入收入差距所承受的压力而言,甲城市要比乙城市高得多。第三节 分布形状的描述 偏度系数峰度系数一、分布形状和形状指标变量分布的偏斜程度和尖陡程度 分布形状形状指标反映变量分布具体形状,即左右是否对称、偏斜程度与陡峭程度的指标 对称性陡峭性(一)利用算术平均数与众数或中位数的离差求偏 度系数二、偏度系数 1.偏度系数的变动范围为(-3,3)2.当 0时,为正值,变量分布属于正偏 当 0时,为负值,变量分布属于负偏 当 =0时,变量分布属于对称分布3. 的绝对值

4、越接近于3,表明变量分布的偏斜程度越严重; 的绝对值越接近于0,表明变量分布的偏斜程度越轻微(二)利用四分位数求偏度系数 2. 的绝对值越接近于1,表明变量分布的偏斜程度越严重; 的绝对值越接近于0,表明变量分布的偏斜程度越轻微1. 的变动范围为(-1,1) 3.计算公式若 0,表示变量分布正偏;若 30,大样本), 趋于正态分布2、中心极限定理当样本容量足够大时(大样本) ,抽样分布趋于正态分布小样本从任意分布的总体中抽样大样本若正态总体方差未知且n较小,则 服从于自由度为n-1的 t分布任一总体但n较小, 服从于自由度为n-1的 t分布3、t分布定理(二)样本成数的抽样分布定理1、二项分布

5、定理从一个数学期望为p、方差为 的是非变量(0-1分布)总体中随机重复地抽取容量为n的样本,那么样本中含有 个某类变量值的概率为: 2.超几何分布定理 从一个数学期望为p、方差为 的是非变量(0-1分布)总体中随机不重复地抽取容量为n的样本,那么当 同时 时,样本中含有 个某类变量值的概率为:从一个数学期望为p、方差为 的是非变量(0-1分布)总体中随机抽取容量为n的样本,当n足够大 ( nP5, n (1-P)5 ),样本成数p趋于正态分布 或E(p)=P 3.中心极限定理正态分布是最重要、最常用的抽样分布,由于抽样一般都是大样本,因此可以根据正态分布理论,根据样本统计值来推断总体参数。第二

6、节 抽样误差(sampling bias) 一、抽样中的误差构成抽样中的总误差可以简单地分为两类,一类是抽样误差,一类非抽样误差。抽样误差 偶然性代表性误差非抽样误差 系统性代表性误差 观测性误差抽样误差:是由于抽样的非全面性和随机性所引起的偶然性误差,即因抽样估计值随样本不同所造成的误差。特点:随着样本容量的增大而趋向于0,不可避免但可以加以控制由随机抽样的偶然性因素以外的原因所引起的误差。超过一定程度就会使抽样估计失去意义,减少和控制它十分重要。非抽样误差:总误差抽样误差非抽样误差二、抽样误差的表现形式指样本估计量与总体参数之间数量上的差异,仅指由于随机抽样的偶然性因素使样本不足以代表总体

7、而引起样本指标与总体指标间的差异(即偶然性误差)抽样误差有三种形式:实际抽样误差抽样标准误差(抽样平均误差)抽样极限误差 (一)抽样实际误差是抽样估计值与总体参数真值之间的绝对离差,表示为由于随机抽样的偶然性,使样本结构不能与总体结构完全一致,从而产生估计误差成数估计的实际抽样误差是随机变量,不同的样本有不同的抽样实际误差;对于任何一个样本,其抽样实际误差都不可能测量出来均值估计的实际抽样误差(二)抽样标准误差(抽样平均误差) 是反映抽样误差一般水平的指标,实质含义是 指样本统计量抽样分布的标准差它能够反映样本指标与总体指标的平均离散程度,也能够说明样本指标代表性的大小。抽样标准误越大(小),

8、抽样分布越离散(集中),样本指标对总体指标的代表性越差(好),抽样估计的误差平均来讲就越大。对于固定的总体和样本容量n,在相同的抽样方法和抽样组织形式下,抽样标准误是一个唯一确定的值。所谓“抽样误差能够加以计算并控制”前例中,重复抽样下前例中,不重复抽样下说明不重复抽样的样本均值分布比重复抽样更为集中,其样本均值的代表性更好,不重复抽样的抽样误差小于重复抽样。所以实践中常用不重复抽样方法。上述公式在实际应用时有两个困难:实际中无法根据该公式计算出标准误,只能根据一套样本来计算其估计值 ,因此抽样标准误 是随机变量需计算所有可能样本统计量的值;需要知道总体参数(三)抽样极限误差是指以样本估计量估

9、计总体参数时所允许的最大误差范围 通常用 表示抽样极限误差的实际意义: 实际上就是对总体参数可允许取的最高值或最低值进行了限制。即希望总体参数落在样本估计量的 范围内抽样极限误差越大,抽样估计的精确度越低抽样极限误差取决于两个因素:1、抽样标准误,即抽样分布本身具有多大的标准差。当抽样方法和样本容量固定时,抽样标准误差是一个定值,反映抽样误差的一般水平。因此,抽样极限误差通常可以以抽样标准误差为标准单位来衡量,表示为抽样标准误差的多少倍。抽样标准误差越大(小),抽样极限误差就越大(小)2、抽样估计的概率保证程度(置信水平) 是指抽样估计结果的可靠程度,即抽样估计结果是准确的概率(可靠程度)有多大。通常表示为 ,其中 称为显著性水平 。 指的是总体参数处于区间 内的概率。 即总体参数不在区间内的概率。要求估计结果的可靠程度越高,则 越大。抽样极限误差、抽样标准误差与抽样概率保证程度三者的关系可以这样表示: 其中, 称为抽样概率度。可见,抽样极限误差分别与概率度和抽样标准误差成正比。 越高,抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论