统计描述(第二部分).ppt_第1页
统计描述(第二部分).ppt_第2页
统计描述(第二部分).ppt_第3页
统计描述(第二部分).ppt_第4页
统计描述(第二部分).ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 参数估计 统计推断 统计推断statisticalinference 如 样本均数样本标准差S样本率P 如 总体均数总体标准差总体率 内容 参数估计 estimationofparameters 包括 点估计与区间估计2 假设检验 testofhypothesis 统计推断 第一节样本均数的标准误 如 样本均数样本标准差S样本率P 如 总体均数总体标准差总体率 抽样误差 samplingerror 由于个体差异导致的样本统计量与总体参数间的差别 一 抽样试验 从正态分布总体N 5 00 0 502 中 每次随机抽取样本含量n 5 并计算其均数与标准差 重复抽取1000次 获得1000份样本 计算1000份样本的均数与标准差 并对1000份样本的均数作直方图 按上述方法再做样本含量n 10 样本含量n 30的抽样实验 比较计算结果 抽样试验 n 5 抽样试验 n 10 抽样试验 n 30 1000份样本抽样计算结果 3个抽样实验结果图示 例7 1假设正常男子红细胞计数服从的正态分布总体 从该总体中重复进行100次抽样 每个样本的含量为10 结果见表7 1 书本P105 由表7 1可见 从同一总体中随机抽取样本含量n 10的若干样本 各样本算得的样本均数并不等于相应的总体均数 且各样本均数也不完全相同 这种由于随机抽样而造成的来自同一总体的样本均数之间及样本均数与相应的总体均数之间的差异 称之为均数的抽样误差 由于样本均数与相应的总体均数之间存在着差异 由数理统计推理可知 从正态总体中随机抽取样本含量为n的样本 每抽取一个样本可计算一个样本均数 重复100次抽样可得到100个样本均数 这些样本均数服从均数为 方差为的正态分布 其中为样本均数的总体标准差 计算公式为 为了与反映个体差异的标准差 或 相区别 样本均数的标准差用表示 统计上通常将统计量 如样本均数 样本率p等 的标准差称为标准误 standarderror SE 所以 样本均数的标准差又称为样本均数的标准误 是反映样本均数抽样误差大小的指标 特点 总体标准误的大小与总体标准差成正比 与样本含量的平方根成反比 即当样本含量n一定时 标准差越大 即样本的个体差异越大 标准误就越大 样本均数的抽样误差就越大 标准差越小 标准误就越小 即样本均数抽样误差就越小 当一定时 n越大 就越小 n越小 就越大 故影响抽样误差大小的主要因素是样本含量 作为总体参数 常数 通常是未知的 因而 在实际工作中常用样本标准差S来估计 抽样实验小结 均数的均数围绕总体均数上下波动 均数的标准差即标准误与总体标准差相差一个常数的倍数 即样本均数的标准误 StandardError 样本标准差 计算 例7 1 例7 2 从正态总体N m s2 中抽取样本 获得均数的分布仍近似呈正态分布N m s2 n 二 总体均数的估计 一 总体均数的点估计 pointestimation 与区间估计 参数的估计 点估计 由样本统计量直接估计总体参数 区间估计 在一定可信度 Confidencelevel 下 同时考虑抽样误差 统计学中的统计推断包括两个重要的方面 一是利用样本统计量的信息对相应总体参数值做出推断 如用样本均数估计总体均数 用样本标准差S估计总体标准差等 称之为点估计 另一个是利用样本统计量来推断我们是否接受一个事先的假设 称之为假设检验 本章只讨论参数估计 假设检验将在下一章中讨论 而参数估计又分为点估计与区间估计 1 点估计总体均数的点估计 pointestimation 就是用样本均数来直接地估计总体均数 这种方法比较简单 由于没有考虑到抽样误差 只适合大样本资料的统计推断 2 区间估计总体均数的区间估计 intervalestimation 是利用样本信息给出一个区间 并同时给出重复试验时该区间包含总体均数的概率 1 可信区间的涵义从总体中作随机抽样 对于含量为n的每个样本而言 都可以算得一个区间 以95 的可信区间为例 意味着在同一总体中作100次重复抽样 可得100个可信区间 平均有95个可信区间包含总体均数 估计正确 只有5个可信区间不包含总体均数 估计不正确 或对于某一个区间而言 它包含总体均数的可能性为95 而不包含总体均数的可能性仅为5 因此在实际应用中 以这种方法估计总体均数犯错误的概率仅为5 2 可信区间具有两个要素 1 准确度 accuracy 即可信区间包含的概率的大小 一般而言概率越大越好 2 精密度 precision 反映区间的长度 区间的长度越窄 估计的精密度越好 反之越差 1 总体标准差未知时 用样本标准差S作为的估计值计算标准误 按t分布原理 例7 4 3 可信区间的计算 2 总体标准差已知或总体标准差未知但n足够大 按正态分布原理 当 足够大时用 作为估计值 例7 5 第二节率的标准误 一 率的抽样误差与标准误由于抽样造成的样本率之间及样本率与总体率之间的差别称为率的抽样误差 率的抽样误差大小可由率的标准误来衡量 如果总体率 未知 用样本率p估计 二 样本率的分布若 数理统计证明 从这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论