《总体均值估计》PPT课件.ppt_第1页
《总体均值估计》PPT课件.ppt_第2页
《总体均值估计》PPT课件.ppt_第3页
《总体均值估计》PPT课件.ppt_第4页
《总体均值估计》PPT课件.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 抽样调查与总体均值估计,主要内容 1、复习点估计 2、抽样误差 3、区间估计正常值范围 4、统计软件应用,参数估计在统计方法中的地位,参数估计的方法,总体均值估计,总体比例估计,可以估计的总体参数,点估计,样本值 (点估计),平均,比例,p,X,1、点估计(point estimate) :用样本均值数直接作为总体均数的估计值。 点估计是用相应样本平均直接作为其总体平均的估计值。 样本比例估计总体比例 如用 估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。,抽样误差,随机误差是由偶然的原因造成的误差。 抽样造成的误差不可避免,但可以控制和估计。如样本量越大则误差越小。,用EXCEL实验,从班级成绩中抽出样本计算平均值,与班级平均值的差异就是误差。,演示无偏估计的意义,用EXCEL对班级成绩多次抽样,计算每次抽样的平均值。 计算多次抽样的样本平均值的再平均。 发现离总的全班有平均值差异很小。,抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。 抽样误差:样本均值估计总体均值时产生的误差。,称为抽样误差,区间估计是按预先给定的概率(1)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidence interval, CI); 预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。 可信区间通常由两个数值即可信限/置信限(confidence limit, CL)构成。其中较小的值称可信下限(lower limit, L),较大的值称可信上限(upper limit, U),一般表示为LU。,用区间表示正常值,估计区间,男 女 年龄组 体重(千克) 身高(厘米) 体重(千克) 身高(厘米) 3.5岁 13.9-17.6 95.0-103.1 13.5-17.2 94.0-101.8 4.0岁 14.8-18.7 98.7-107.2 14.3-18.3 97.6-105.7 4.5岁 15.7-19.9 102.1-111.0 15.0-19.4 100.9-109.3 5.0岁 16.6-21.1 105.3-114.5 15.7-20.4 104.0-112.8 5.5岁 17.4-22.3 108.4-117.8 16.5-21.6 106.9-116.2 6.0岁 18.4-23.6 111.2-121.0 17.3-22.9 109.7-119.6 7.0岁 20.2-26.5 116.6-126.8 19.1-26.0 115.1-126.2 8.0岁 22.2-30.0 121.6-132.2 21.4-30.2 120.4-132.4 9.0岁 24.3-34.0 126.5-137.8 24.1-35.3 125.7-138.7 10.0岁 26.8-38.7 131.4-143.6 27.2-40.9 131.5-145.1 16岁:体重:年龄x2816公斤 身高:年龄x677101厘米,正常范围(normal range value),在临床医学上成年人血压的正常值范围是:收缩压90-139mmHg, 舒张压60-89mmHg; 脉压差正常范围是30-40 mmHg 。,中国人平均正常血压参考值(mmHg),人的血压正常范围(normal range value),网络搜索,化验的正常值,肝功能化验结果正常值如下: 用区间表示 ALT(谷丙转氨酶)正常值:男5-40 U/L, 女5-35 U/L。 AST(谷草转氨酶)正常值:8-40 U/L。 AST/ALT(谷草/谷丙)正常值:1.0-2.0。 GGT(谷氨酰转移酶)正常值:男 11-50 U/L, 女 7-32 U/L。 ALP(碱性磷酸酶)正常值:成人40-150 U/L。 TBILI(总胆红素)正常值:3.0-20.0 umol/L。 DBILI(直接胆红素)正常值:1.7-8.0 umol/L。 PT(凝血酶原时间)正常值:11-14秒。,IBILI(间接胆红素)正常值:3.4-13.5 umol/L。 PTA(凝血酶原活动度)正常值:80-100。 TP(总蛋白)正常值:成人坐立位:64-83 g/L; 成人卧位:60-78 g/L。 AFP(甲胎蛋白)正常值: 50g/L。 ALB(白蛋白)正常值:35-52g/L。 IgG(免疫球蛋白G)正常值:12.871.35g/L。 GLB(球蛋白)正常值:22-38 g/L。 IgA(免疫球蛋白A)正常值:2.350.34g/L。 ALB/GLB(白球比)正常值:1.3-2.5。 IgM(免疫)正常值:1.080.24g/L。 GLU(葡萄糖)正常值:3.9-6.1 mmol/L。 C3(补体3)正常值:1.140.27g/L。 BUN(尿素氮)正常值:2.9-8.2 mmol/L。,C4(补体4)正常值:553109mg/L。 CHE(胆碱性酯酶)正常值:5000-12000 U/L。 CK(肌酸激酶)正常值:24.0195.0。 CHOL(总胆固醇)正常值:3.356.45。 TRIG(甘油三酯)正常值:0.481.71。 CRE(肌酐)正常值:男 62-115 umol/L, 女 53-97umol/L。 URIC(尿酸):男 208-428 umol/L, 女155-357umol/L。 LDH-L(乳酸脱氢酶)正常值:109245。 T淋巴细胞亚群 CD3正常值:0.56-0.76。 T淋巴细胞亚群 CD4正常值:0.38-0.52 。 T淋巴细胞亚群CD5正常值:0.22-0.32。,点估计与区间估计,点估计是一个数值, 置信区间提供了更多的变化信息,点估计,置信下限,置信上限,置信区间宽度,区间估计 (interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%,一般公式,所有估计区间的一般公式,点估计 (临界值)(标准误差),点估计 (2)(标准误差),意义: 虽然不能知道某市全体成人脉搏均数的确切数值,但有95%的把握说该市全体成人脉搏均数在73.9次/分 - 75.1次/分之间,有99%的把握说该市全体成人脉搏均数在 73.7次/分 - 75.3次/分之间。 换句话说,做出该市成人脉搏均数为73.9次/分 - 75.1次/分的结论,说对的概率是95%,说错的概率是5%; 做出该市成人脉搏均数为73.7次/分 - 75.3次/分的结论,说对的概率是99%,说错的概率是1%。,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - 为是总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平 (confidence level),由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 总体参数以一定的概率落在这一区间的表述是错误的,置信区间 (confidence interval),置信区间与置信水平,Intervals and Level of Confidence,Confidence Intervals,Intervals extend from to,(1-)x100% of intervals constructed contain ; ()x100% do not.,Sampling Distribution of the Mean,x,x1,x2,总体平均的抽样估计,用样本均值,估计总体均值,抽样估计误差为,抽样误差,是无法直接求出得,,因为,是未知的,,换一个思考方法,是已知的,将求,的问题,转换为求,称为极限误差(边际误差),抽样误差的最大限,置信区间的半径。,假若已经求出极限误差,则,展开不等式得,得到了总体均值,估计区间,总体均值 =,样本均值,是的无偏估计,设总体的标准差为,由中心极限定理得,服从正态分布,由,得到极限误差,由中心极限定理,用样本标准差s代替 查正态分布表得到,可以计算极限误差,用代替时,严格地讲,统计量,服从自由度为n-1的分布,大样本时用正态分布近似计算,统计用的样本一般都 是大样本。大于。服从,EXCEL计算置信区间,影响区间宽度的因素,1. 总体数据的离散程度,用 来测度 样本容量n, 置信水平 (1 - ),影响 z 的大小,总体比例(成功率)的估计,有些社会随机现象中只有两个结果:成功与失败,成功 失败 射击 命中 不中 考试 及格 不及格 产品 合格 不合格 选举 同意 不同意,总体(或样本)中具有某种属性的单位与全部单位总数之比 不同性别的人与全部人数之比 合格品(或不合格品) 与全部产品总数之比 总体比例可表示为 样本比例可表示为,比例 (proportion),当样本容量很大时,样本比例的抽样分布可用正态分布近似 推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望 样本比例的方差,样本比例的抽样分布 (数学期望与方差),是非标志的标准差,是非标志的平均数为P。,由于标准差有良好的数学性质,相比较而言,它的应用最为广泛。,返回,由中心极限定理知:,例:某厂对一批产品的质量进行检验,抽样取200只,样品优质率85%,计算置信度95%时总体优质率估计区间,有人問皮爾遜他所記得最早的事,他說我不記得那時是幾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论