版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、MEDICAL SISTICS医学统计学参数估计Parameter Estimation医学公共卫生学院生物统计学系主要内容点估计区间估计两个要素均数区间的构建正确理解区间的涵义2015/9/152统计推断的内容参数估计(parameterestimation)假设检验(hypothesis test)2015/9/153参数估计由样本统计量估计总体参数 点估计(poestimation) 区间估计(erval estimation)2015/9/154参数估计之一:点估计用样本统计量作为总体参数的估计例如:用样本均数作为总体均数的一个估计2015/9/155点估计的缺陷 =?cm, =?cm
2、 x1,x2,x3,x4NX =143.37s = 5.23x1,x2,x3x10X =144.07s = 4.72x1,x2,x3x10X=142.72s = 9.2473x1,x2,x3x10n=10样本含量2015/9/156点估计直接用样本统计量作为总体参数的估计值方法简单,但未考虑抽样误差的大小在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随量值。而样本统计量随样本的不同而不同,属随机的。2015/9/157区间估计度(1- )用一个区间估计总体按一定的概率或度为1- 的可参数所在范围,这个范围称作信区间(confidenceerval, CI),又称置信区间 。这种估
3、计方法称为区间估计。2015/9/158区间的两个要素度(1-), 可靠性 一般取90%,95%。 可人为控制。精确性 是指区间的大小(或长短)兼顾可靠性、精确性2015/9/159均数的区间基础:抽样误差理论从正态分布总体中随机抽取一个样本,则t X t( n1)sXt值接近于0的可能性较大,远离0的可能性较小,出现太大的t值和太小的t值的可能性更小,根据t分布的性质,t有95%可能在-t0.05,v到t0.05,v之间。2015/9/1510均数的区间P(t , t t , ) 1 X t) 1 P(t , ,sX X t , sX ) 1 P( X t , sX总体均数的(1-)区间定义
4、为:X2015/9/1511影响区间大小的度度越大,区间越宽变异 变异越大,区间越宽样本含量 样本含量越大,区间越窄2015/9/1512当样本含量较大时,例如n100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作区间的近似计算。相应的100(1-)%为区间为:X2015/9/1513例4.1随机抽取12名口腔癌患者,检测其发锌含量 , 得 均 数 为 253.05g/g , 标 准 误 为27.18g/g,求发锌含量总体均数95%的可信区间。2015/9/1514附表2 t 界值表t-t0度概 率,P0.250.500.200.400.100.200.050.100.0250.
5、050.010.020.0050.00250.0010.0005单侧双侧0.010.0050.0020.001123451.0000.8160.7650.7410.7271.3761.0610.9780.9410.9203.0781.8861.6381.5331.4766.3142.9202.3532.1322.01512.7064.3033.1822.7762.57131.8216.9654.5413.7473.36563.6579.9255.8414.6044.032127.32114.0897.4535.5984.773318.30922.32710.2157.1735.893636.6
6、1931.59912.9248.6106.8696789100.7180.7110.7060.7030.7000.9060.8960.8890.8830.8791.4401.4151.3971.3831.3721.9431.8951.8601.8331.8122.4472.3652.3062.2622.2283.1432.9982.8962.8212.7643.7073.4993.3553.2503.1694.3174.0293.8333.6903.5815.2084.7854.5014.2974.1445.9595.4085.0414.7814.58711121314150.6970.695
7、0.6940.6920.6910.8760.8730.8700.8680.8661.3631.3561.3501.3451.3411.7961.7821.7711.7611.7532.2012.1792.1602.1452.1312.7182.6812.6502.6242.6023.1063.0553.0122.9772.9473.4973.4283.3723.3263.2864.0253.9303.8523.7873.7334.4374.3184.2214.1404.0732015/9/1515例4.1度n =12-1=11,经查表得t0.05,11=2.201,则本例 253.05 2.2
8、01 27.18 193.23( g g)X t0.05,11 sX 253.05 2.201 27.18 312.87( gX t0.05,11 sXg)即口腔癌患者发锌含量总体均数的95%区间为: 193.23321.87(g/g)。用该区间估计口腔癌患者发锌含量度为95%。总体均数的2015/9/1516例4.2某地120名12岁男孩身高均数为142.67cm,标准误为0.5477cm,计算该地12岁男孩身高总体均数90%的区间。2015/9/1517附表2 t 界值表t-t0度概 率,P0.250.500.200.400.100.200.050.100.0250.050.010.020
9、.0050.00250.0010.0005单侧双侧n0.010.0050.0020.001123451.0000.8160.7650.7410.7271.3761.0610.9780.9410.9203.0781.8861.6381.5331.4766.3142.9202.3532.1322.01512.7064.3033.1822.7762.57131.8216.9654.5413.7473.36563.6579.9255.8414.6044.032127.32114.0897.4535.5984.773318.30922.32710.2157.1735.893636.61931.59912
10、.9248.6106.8696789100.7180.7110.7060.7030.7000.9060.8960.8890.8830.8791.4401.4151.3971.3831.3721.9431.8951.8601.8331.8122.4472.3652.3062.2622.2283.1432.9982.8962.8212.7643.7073.4993.3553.2503.1694.3174.0293.8333.6903.5815.2084.7854.5014.2974.1445.9595.4085.0414.7814.58711121314150.6970.6950.6940.692
11、0.6910.8760.8730.8700.8680.8661.3631.3561.3501.3451.3411.7961.7821.7711.7611.7531.64492.2012.1792.1602.1452.1311.96002.7182.6812.6502.6242.6023.1063.0553.0122.9772.9472.57583.4973.4283.3723.3263.2864.0253.9303.8523.7873.7334.4374.3184.2214.1404.0732015/9/1518例4.2n=120100,标准正态分布代替t分布,u0.10=1.64142X14
12、2X. 0 u.6710. 0 u.6710Xs1Xs1. . .6405477cm141.6405477cm143.即该地12岁男孩平均身高的90区间为:141.77143.57(cm),可认为该地12岁男孩平均身高在141.77143.57(cm)之间。152015/9/19均数之差区间的计算正常组肝炎组 1- 2 ?1=?2=?X 1 X 2 36.682015/9/1520与均数之差有关的抽样分布“均数之差”与“均数之差的标准误”之比,度v= n1+n2 -2的 t 分布。服从 1 2 X1 X 2t tn n 2s12X1 X 2样本含量较大时,服从标准正态分布。 1 2 X1 X
13、2t N (0,1)sXX122015/9/1521合并方差与均数之差的标准误合并方差(方差的平均)均数之差的标准误1 )22015/9/1522计算11 10.382 14 14.392 163.3679s2C12 15 2163.3679 ( 1 1 ) 4.95sX1 X 21215 2.060双侧t0.05,25(271.89 235.21) 2.060 4.95 26.48,46.882015/9/1523正确理解区间的涵义区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95的度是针对区间的构建方法而言的。以均数的区间为例,其涵义是:如果重复100
14、次抽样,每次样本含量均为n,每个样本均按X t0.05, sX区间,则在此100个构建区间内,理论上有95个包含总体均数,而有5个不包含总体均数。2015/9/152495%区间的含义-2-10122015/9/1525正确理解区间的涵义在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随量值。2015/9/1526下列说法正确吗?算得某95%的区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。度为95%。该区间包含总体参数,2015/9/1527区间与参考值范围的区别区间用于估计总体
15、参数,总体参数只有一个 。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。95%的区间中的95%是度,即所求区间包含程度为95%总体参数的95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。2015/9/1528标准差与标准误的联系都是变异指标。当n不变时,标准差,标准误ssXn2015/9/1529标准差与标准误的区别标准差描述原始数据的离散程度;标准误反映均数的抽样误差大小。2015/9/1530标准差与标准误的区别标准差衡量样本均数对原始数据的代表性,标准差越小,样本均数对原始数据的代表性越好;标准误衡量样本均数估计总体均数的精确性,标准误越小,样本均数估计总体均数精
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论