均数的抽样误差与总体均数估计2010精_第1页
均数的抽样误差与总体均数估计2010精_第2页
均数的抽样误差与总体均数估计2010精_第3页
均数的抽样误差与总体均数估计2010精_第4页
均数的抽样误差与总体均数估计2010精_第5页
免费预览已结束,剩余10页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样分布与参数估计亠悅尢兮么黑2住学陵抽样实验假设某市16岁女中学生的身高值分布服从均数 |1= 155.4cm,标准差7=5.3cm的正态分布,即 XN(1554, 532)。从该总体中以固定的样本含量W反复多次抽样,如 抽 1 ()()()()次。抽样X,S从同一总体中反复抽取 若干个样本,每个样本 的含fi均相等.这些样 本均数呈正态分布.总体中观 察单位个 数为N每个样本中观 察单位个数为 n正态总体2(1554532),固定样本量«=10抽样10000次林*个tt2600 rlOOOO个分巾149-7ISO*29151*IM»152*S43155-I2AI154-

2、2O2M155-2372156-IHVM157-1092I5H-434IS9j1 IHI6g26A*计200016001000COOJk0t» 1511521511561"15:)S»HO lUH本於Jfi(5 W03个样本均ft的分布n=10)10000个样均ttf (n=I0)韩木ZtX&小值最大值lUOOO155389t675149.554161.494样本均数的分布规律:(1)以固定的样本量H从正态总体Ng/)中反复抽样,所得 样本均JSx «从正态分布.(2)X的均数期望值为原正态分布的总体均数,即X T” (3)V 的标准差为:Sm

3、= 7s(X-X)V(-l)s* f 6 =l4n为避免与个体变的标准差混淆,称之为样本均数的标准误根据某次抽样可估计的样本均»的标准误S壬=s/J?, (样本均数标准误的估计值)(4) 抽样误差(sampling EFFor):由于存在个体变 异,抽样研究时样本统计量不1好等于总体参 数,这种误差是因抽样所致,称为抽样误差。抽样误差的大小与两个因素有关:总体中个体变异度;抽样时的样本含量 抽样误差在抽样研究中是不可避免的,但可以 估计抽样误差的大小。捕样总体N(“b2)£S从同一总体中反复抽取 若干个样本,每个样本 的含*均相等,这些样 本均数呈正态分布.S&总体

4、中观 察单位个 数为N每个样本中 观察眾位个 数为n样本均数的标准误样本均数的标准差(记为b_),反映的是样本均数 与其总体均数之间的离散程度,即X“的大小, 所以可将其作为描述样本均数抽样误差大小的指标, 称为样本均数的标准误。计算如下:(理论值) (估计值)对样本均数的变量变换任何正态分布都可转换为标 M = (X-Q/b准正态分布o.s-0.V300I丿=200210.322U0t - distribution服从正态分布的样本均数也可转换为标准正态分布M =(X-p)/b 元C未知时,以其估计值估计,W. S. Gosset 1908年发表于 Biometrickaf分布的特征为:1.

5、 以0为中心,左右 对称的单時分布-2. 分布曲线形态变 化与自由/»的大小有 关。自由度越小,Z 值越分散,曲线越低 平;自由度逐渐增大 时,则f分布逐渐逼 近标准正态分布.f 分布即为"分布。standard normal distributiont曲线r分布的分位数(单侧z界值)附表2f界值表自由概O.IU度单側0.250.20O.IU0,050.0250.UIU.<M)50.0025U,(M>11).000523 451.0000.8160.7650.7410.72713761.0610.9780.9410.9203.0781.8861.63S1.533

6、1.4766314 12.7(16 3I.X2163X>579.9255JU14.6IM4-052127321 318.309 636,6192.9202.3532-1322.0154.3033.1822.7762.5716.9654.5413.7473.365U<0897.4555-59S4.77J2232710.2157.1735.89331.59912.9246,8690.7180.906L4401.9432.4473.143X73743175.2085.9590.711(K«961.415b8952.5652.99«5.4W4.0294.7«5

7、5.4O80,7060.8X9k3971.K6U23(62.8963-355ajos4.5015.(M10.703l.«332.2622.K2132503.6904,2974-7810.700OJJ791.3721.8122.2282.7643J693.5814.1444.5«7(K6K6»Ji5913231/7212.0K02.5182-8313.1353.5273-8190,6X60*SX13211.7172,074232,819XIW3-7920.6«50,85K1.319L7142.0692.5002.«)7J,IU43.4853.76

8、80.6850.8571318un2.0642,4922.7973-09134673.7450.6840.H56b3161.7082.0602.4852.7K73.0783.4503.7250.6830.8541.1301.6972.0422.4572.7503.0303J853.6460,6790.M91,2991.6762.(M)9入4032.67K2.93732613.4960.677O&451.2901,6601,9842.3642,6262.8713.1743J900.6745 0.8416 1.28161.6449 1.96002J263237582J*0703.09023

9、.2905反"双 M0-500.400.200,10(k050.020.01O.(N)50.002仇 001中心极限定理:也称大数定理,从正态分布N(“b2)总体中以固定H抽样时,样本均数X的分布仍服从正态 分布N(“,<Tp正态分布推理:当样本含童W足够大时,即使从偏态分 布总体中以固定抽样,其样本均数的分布也近似服从 正态分布.0.05/2,1/ V,V '().05/2少X-“'o.O5/2卫 V QV O.O5/2.vvX“<'().05/2山$兄一无-A).O5/2.f*X <-“ V-X +/o.O3/2"S壬X + r

10、(W5/2$S壬 > / > X 0.05/2.1X o.()5/2,v S又VM V X + Fo.O5/2,"S工统计推断统计分析包括统计描述和统计推断抽样研究:样本信息=总体特征厂总体参数的估计统计推断:4三.总体均数的估计(一)点(值)估计(point estimation )(二)区间估计(interval estimation )按照一定的概率估计总体参数可能所在的一个范围, 称为区间估计,1-a:可信度,通常取95%或99% .总体参数的可信区间(confidence interval, Cl)总体均数的区间1 古计 1、当b未知且较小时,由于二予洋服从f分

11、布,可按 t分布原理估计总体均数的可信区间。I -a由于即 p(-r V X-QI和刀S故总体均数(1-a) x100%的可信区间为X t a S 乂 , X + G S 乂k尹亍"丿2、当b未知但足够大时(n >100 ) , r分布近似“分 布,可以界值代替f界值,估计总体均数的可佶 区间总体均数的区间估计/ k TT J3、当b已知时,可按正态分布的原理,估计总体均 数的可信区间。/ 、乂X+ 2 2 )IM 例 某地抽取正常成年人20()名,测得其血清胆固醇的 均数为3.64 mmol/L,标准差为1.20mmol/L»估计该 地正常成年人血清胆固醇均数的95%可信区间。=1.20/7 = 0.0849(3.64±196x0.0849)t (3.47, 3.81) 该地正常成年人血清胆固醇总体均数的95% 可信区间为(3.47, 3.81 )miTiol/Lo(3.64± 1.96x1.20) 1.288 5.99295%的可信区间的理解:(1)可信区间有95%的概率包含所要估计的 总体参数。(2)从正态总体中随机抽取100个样本,也估 计100个可信区间,平均约有95个可信区间 包含了总体参数O|?|(3)实际工作中只能根据一次抽样结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论