




已阅读5页,还剩119页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学-6,P102(107):例5.1;例5.2例5.3,样本,个体哪个大?,定义5.1,抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。,定义5.2,定义5.3,定义5.4,从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯随机抽样。,从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。,一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。,参考定义5.5,5.6,5.7(P103104)。,见P109,分层抽样就是类型抽样或分类抽样。,分层抽样与整群抽样的区别在那里?,等距抽样就是系统抽样,整群抽样就是分区抽样,某大学的商学院相对今年的毕业生进行一次调查,以便了解他们的就业倾向。该学院有5个专业:会计、金融、市场营销、经营管理、信息系统。今年有1500名毕业生,其中会计专业500名,金融专业350名,市场营销专业300名,经营管理专业150名,信息系统专业200名。假定要选取180人作为样本,各专业应抽取人数:,会计专业名,金融专业名,市场营销专业名,经营管理专业名,信息系统专业名。,分层抽样还是整群抽样?,分层抽样与整群抽样的区别在那里?,(1)非随机分层,层内随机抽样;随机分群,群内全面调查(非随机)。(2)层间差异大于层内差异;群内差异大于群间差异。所以,事先对总体结构又一定认识时,可以用分层抽样;在总体没有原始资料可利用时,可以用整群抽样。,见P109,例:各种概率抽样的区别,非随机分层,层内随机抽样,(测量地层),例:各种概率抽样的区别,40m,随机,随机分群,群内全面调查(非随机),(计算植物样方),240m,10m,例:各种概率抽样的区别,什么是样本指标的分布?,什么是容量相同的所有可能的样本?,为何样本统计量是随机变量?,这是一个均匀分布,即每个元素出现的机会(概率)是一样的。,Y轴和x轴分别代表什么?,见P105(110),均值在那里?,1.25,为何概率为0.25?,例5.4(P105;p109),M是什么?n是什么?N是什么?,n变大的结果如何?,所有容量为n的样本数.,从这两张图中要明白:(1)为什么样本统计量是随机变量。(2)什么是样本均值的均值。,n变大,抽样分布方差越小。,样本均值的数学期望就是样本均值的均值。,图中那条曲线的均值更接近总体的均值?,在这张图中总体均值在那里?,用什么估计总体均值?,总体元素个数、样本容量、样本(组)所有可能取值,总体元素个数N(总体的所有个体),样本容量n(每一次取样的数量),容量为n的样本的所有可能取值(所有的Nn种可能都出现为止),重复抽样,修正系数(当N很大时修正系数趋于1),P109,注意标准差与标准误差的区别。,表5.1(P106),例5.4(P105;P109),样本均值的抽样分布、样本方差的抽样分布,总体的均值、方差,方差的样本分布均值的样本分布,方差抽样分布(均值、方差),均值抽样分布(均值、方差),.,f,D,D,D,D,D,D,D,D,D,D,D,注意:服从正态分布和服从卡方布分布的区别,n是什么?,此处红色曲线分布形成的均值是什么?,由样本标准差计算出来的卡方X2,由样本标准差0.0014mm计算出来的卡方值X2,样本均值的抽样分布、样本方差的抽样分布,总体的均值、方差,方差的样本分布均值的样本分布,方差抽样分布(均值、方差),均值抽样分布(均值、方差),.,f,D,D,D,D,D,D,D,D,D,D,D,样本均值的抽样分布、样本方差的抽样分布、,样本均值的抽样分布,样本方差的抽样分布,样本其他参数的抽样分布,N0/N,mk=E(Xk)原点矩,Ck=EX-E(X)k中心矩,定义5.9,定义5.10,定义5.11,定义5.12,用来估计总体参数时计算出来的估计量的具体数值,称为估计值。,在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。,第2点是什么意思?,这是什么意思?,n时,x与总体参数的真值间的误差趋于0;如果一个估计量不是一致性的,即便n,x仍然不能等于总体参数的真值,总体均值,1=(n-a)/(n-b),用某个x估计总体参数时,x不一定等于总体参数真值,但多个x的平均值一定等于总体参数的真值,无偏估计,误差|x-x|,为何只用一个样本估计,而不是用抽样分布估计?,定义5.13,定义5.15,定义5.14,随着样本容量的增大,点估计量的值越来越接近总体的参数。,A=总体参数,定义5.16,由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。,定义5.17,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。,置信水平1-,/2,/2,置信区间是统计量的取值范围;置信水平是概率。,Za/2是什么?,什么是将构造置信区间的步骤重复多次?,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。,这是什么意思?,置信水平是概率,是曲线下包含的面积。95%的置信水平就是有95%的区间包含了总体参数的真值。,点估计与抽样分布的关系,.,总体分布,抽样分布,以一定的概率出现,根据中心极限定理当n越大,样本(参数)的抽样分布越接近总体(参数)的真值。,误差,?,样本分布,区间估计与抽样分布的关系,抽样分布区间,x,抽样分布,x,f,.,总体分布,样本分布,z,标准正态分布,x,0,f,x,x,此处是总体的标准差,还是样本的标准差?,Z/2是什么?P117(125),置信下(上)限,风险值,置信水平,边际误差,误差范围,可靠性系数,临界值,这是什么?,P125,此处为总体标准差,未知时以样本标准差s代替。,1.求产品平均重量的范围,而不是平均重量.2.需要多大的范围.才能以概率为95%(0.95)的准确率包含真正的平均重量。,/20.025,查(1-0.025),(0.975-0.5),/20.025,查(1-0.025),(0.975-0.5),反查正态概率分布表,和上题的差别:没有总体标准差.,总体标准差未知,以样本标准差代替。,查0.95,查0.95,自由度为n1的t分布,查t0.025,XB(n,p),二项分布,p为成功率、比例等。,N(,2),自由度为n1的卡方分布,置信下限,置信上限,/2,/2,置信下限,置信上限,0,/2,/2,置信下限,置信上限,0,样本容量与抽样分布的关系,.,总体分布,样本分布,抽样分布,只用一个样本估计,而不是用抽样分布估计。,置信区间,置信水平1-,(1)如果确定了置信区间,就可以确定估计误差(边际误差)。,(2)如果确定了置信水平,就可以确定Z/2。,(3)如果确定了估计误差和置信水平,再知道总体标准差,就可以求一定误差范围内和一定置信水平下所需要的样本容量n。,如果只知道置信区间,能否确定Z/2?,此处是非标准正态分布的置信区间,不重复抽样时求样本容量n的公式(P123)。,3.,样本容量n与总体方差2之间的关系,=,x1=x2=x3=x4=x5=x,总体方差越小,需要的样本容量越小。,总体分布,样本分布,抽样分布,样本容量n与边际(估计)误差E的关系,x,x,x,x,误差越大,落入误差范围的样本(参数)越多,如果缩小误差,只有加大样本容量,使抽样分布变窄,才能使同样多的样本落入误差范围内。,1-,1-,1-,1-,n=nxx1-1-,nx1-=1-,x,x,x,x,误差越大,置信水平越大,同样的置信水平,要减少误差,就要加大样本容量误差,样本容量n与可靠性系数(Z或t)的关系,估计误差x,xZ/2(/n),置信上(下)限,置信区间,置信水平1-,x,x,/2,/2,x=x/2/2Z/2z,例1:某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一个,共抽出12个,测得长度(单位:mm)数据见Excel中A2:A13。假定零件长度服从正态分布,试以95%的置信水平估计该企业生产的螺丝钉平均长度的置信区间。,样本抽样分布的标准差,如果总体标准差已知,计算可直接使用,B8改为Z值;C8改为“NORMSINY(1-C6/2)”,C5改为“=/SQRT(C2)”.,样本均值抽样分布的标准差,例2:某厂对一批产品的质量进行抽样检查,采用重复抽样抽取样本200只,样本优质品率为85%,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026赛季足球俱乐部球员全面身体素质提升合同
- 2025年新型太阳能热水器系统升级改造服务合同
- 2025年智慧社区绿色环保物业综合管理服务协议
- 2025年企业年度车辆无偿赠与接收管理合同
- 2025年农村住宅太阳能光伏发电工程承包合同
- 2025年度印尼煤炭出口代理佣金支付与质量控制管理协议
- 2025年度中小企业贷款合同风险控制与法律保障方案
- 2025年茶叶绿色种植技术培训与产业链合作框架协议
- 2025年度基础设施建设项目补偿贸易资金借款合同范本
- 2025年高校食堂管理与校园清洁服务全面优化合作协议
- 教师课堂管理方法和技巧课件
- 小学科学教师专题培训课件
- 伍德灯在寻找炎症性皮肤病变中的应用价值研究
- 新版药品管理法培训试题
- 合同的订立与有效性
- 钢结构长廊施工方案
- 临床检验专业医疗质量控制指标(2015版)
- 信保业务自查问题统计表
- 2023年大学试题(大学选修课)-创业:道与术考试历年真摘选题含答案
- 心理健康评定量表
- 河道修防工高级工试题
评论
0/150
提交评论