




已阅读5页,还剩105页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
研究总体与从中抽取的样本之间的关系是统计学的中心内容 对这种关系的研究可从两方面着手 一是从总体到样本 这就是研究抽样分布的问题 二是从样本到总体 这就是统计推断问题 总体与样本之间的关系 抽样调查根据调查其抽取部分调查单位的准则不同可分非概率抽样和概率抽样 1 非概率抽样 抽取调查单位的原则是根据主观判断或其它操作的方便 非概率抽样的优点 成本低 花时短 回答率高缺点 不能做统计推论 非概率抽样的结果是否有代表性与主观本身的水平有很大关系 一 非概率抽样和概率抽样 2 概率抽样 原则 随机原则 随机原则 在抽选调查对象时 规定了一定的程序 以保证每一个单位都有同等入选的机会 从而避免了主观因素的影响 优点 可以作统计推论 二 样本统计量 在简单随机抽样中 样本具有随机性 样本的参数 s2等也会随着样本不同而不同 故它们是样本的函数 记为T x1 x2 xn 称为样本统计量 统计量的概率分布称为抽样分布 Sampledistribution 三 三种不同性质的分布 一 总体分布 二 样本分布 三 抽样分布 总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布 一 总体分布 populationdistribution 一个样本中各观察值的分布也称经验分布当样本容量n逐渐增大时 样本分布逐渐接近总体的分布 二 样本分布 sampledistribution 样本统计量的概率分布 是一种理论分布在重复选取容量为n的样本时 由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值 样本比例 样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息 是进行推断的理论基础 也是抽样推断科学性的重要依据 三 抽样分布 samplingdistribution 抽样分布的形成过程 samplingdistribution 抽样分布 是根据 机率 的原则而成立的理论性分布 它可以表明 由同一总体中反复不断抽取不同样本时 各个可能出现的样本统计值的分布情况 抽样分布Samplingdistribution 从已知总体中随机地抽取含量为n的样本 研究所得样本的各种统计量的概率分布即所谓的抽样分布 三 抽样分布 一 样本平均数的抽样分布 一 原总体标准差已知时的样本平均数的分布1 原始总体与样本平均数抽样总体设有一个总体 总体平均数为 方差为 2 总体中各变数为x 该总体称为原总体 现从这个总体中随机抽取含量为n的样本 样本平均数记为 的期望值与总体均值相同 而方差缩小为总体方差的1 n 一 样本均值的分布 一个正态总体中的抽样分布 总体服从正态分布N m s2 样本均值的抽样分布仍为正态分布 即 一 原总体标准差已知时的样本平均数的分布 样本平均数的抽样总体 样本平均数构成的总体称为样本平均数的抽样总体 其平均数记为 方差记为 抽样总体参数和原总体参数有以下关系 例 设某村有5户人家 以下是总体家庭人口的统计表 表1 某村家庭人口统计表 则有 总体均值 4 5 6 7 8 5 6人总体标准差 1 4总体方差 2 现从总体 N 5 中 作样本容量n 2的简单随机抽样 它可能选出的样本有5 5 25种可能选出的全部简单随机样本 续表 经过整理 得出样本平均家庭人口数的抽样分布如下表 平均家庭人口数的概率分布图 样本的平均值仍等于总体平均值6 样本的平均值 4 0 1 4 5 2 8 0 1 25 6可见样本的均值平均数等于总体均值 2 样本均值的方差 所有可能出现的样本均值的方差 比较及结论 1 样本均值的均值 数学期望 等于总体均值2 样本均值的方差等于总体方差的1 n 设有均值u 方差的分布总体 如随机抽取所有可能容量为n的样本 则样本平均数的抽样分布将随着n的增大而渐渐接近于以下正态分布N 30为大样本n 30为小样本 样本均值的数学期望样本均值的方差 统计抽样误差是指平均误差 等于样本均值的标准差重复抽样不重复抽样 样本均值的抽样分布 数学期望与方差 3 抽样总体标准误standarderrorofmean即样本平均数的标准差 意义 反映了抽样误差的大小 即精确度的高低 也反映了代表 的可靠性 性质 和总体标准差 成正比 而与样本含量n的平方根成反比 某一总体 是一定的 所以只有增加样本含量才可以降低标准误 估计的标准误 standarderrorofestimation 当计算标准误时涉及的总体参数未知时 用样本统计量代替计算的标准误 称为估计的标准误以样本均值的抽样分布为例 当总体标准差 未知时 可用样本标准差s代替 则在重复抽样条件下 样本均值的估计标准误为 4 中心极限定理 centrallimittheorem 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的数学期望为 方差为 2 n 即 x N 2 n 4 中心极限定理 centrallimittheorem 中心极限定理 设从均值为 方差为 2的一个任意总体中抽取容量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为的正态分布 中心极限定理 centrallimittheorem 的分布趋于正态分布的过程 抽样分布与总体分布的关系 总体分布 正态分布 非正态分布 大样本 小样本 样本均值正态分布 样本均值正态分布 样本均值非正态分布 中心极限定理的应用 例 某厂商声称其生产的电瓶具有均值为60个月 标准差为6个月的寿命分布 质检部门为检验该厂的说法是否正确 随机抽取50个该厂生产的电瓶进行寿命实验 1 假定该厂商声称是正确的 试描述50个电瓶的平均寿命的抽样分布 2 假定该厂商声称是正确的 50个样本的平均寿命不超过57个月的概率是多少 例题答案 50个电瓶平均寿命近似服从正态分布 正态分布的均值为60 方差为62 50 0 72 标准差为0 85 N 60 0 852 例1 随机抽取某大学的学生100名 平均体重58kg 根据过去材料知道大学生体重的标准差为10kg 求抽样误差为多少 解 已知n 100 30 10SE 1kg 例2 某学院1000名学生 其平均身高是168cm 标准差为22 5cm 现从学生中随机抽出100名 求其样本平均数大于1 70m的概率 解 已知n 100 22 5u 168SE 2 25即 168 22 5 10 P x 170 p z 170 168 2 25 p z 0 889 0 5 0 889 0 5 0 313 0 186答 样本平均数大于1 70m的概率为18 6 总体方差已知的均值抽样分布总结 如果样本相当大 N 30 不管原分布如何 抽样分布接近正态分布 抽样分布的均值就是总体的均值 抽样误差就是抽样均值的标准差 如果N足够大 不知道总体的标准差时 可用样本的标准差作为总体的标准差 均值的抽样分布接近正态分布 因此任何两值之间的样本均值次数所占比例可以知道 二 原总体标准差未知时的样本平均数的抽样分布 t分布 t distribution 总体 未知时 抽样总体S估计 第一 T分布的几个重要概念 从一个正态总体中抽取的样本统计量的分布样本平均数和样本方差S2是描述样本特征的两个最重要的统计量 如果原总体的平均数为 标准差为 那么样本平均数抽样总体 平均数为 标准差为 为样本平均数抽样总体的标准误差简称为标准误 标准误表示平均数抽样误差的大小 反映样本平均数与新总体平均数之间的离散程度 经计算得出两个重要结论 抽样的样本平均数的平均数等于总体平均数 即 抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根 即 4 t 分布 不要求 设有服从正态分布的随机变量x 正态分布的标准化公式为 对于总体方差 2已知的总体 根据公式可以知道样本平均数在某一区间内出现的概率 公式为 附 服从标准正态分布 假如 2未知 而且样本容量又比较小 n 30 时 标准化公式可变换为 它不再服从标准正态分布 T分布类似于正态分布 也是一种对称分布 它只有一个参数 就是自由度所谓自由度是指独立观测值的个数 应为计算标准差时所使用的n个观测值 受到平均数x的约束 这就等于有一个观测值不能独立取值 因此自由度为df n 1 服从具有n 1自由度t 分布 第二 一个重要的t统计量 t分布由标准正态分布 2分布构成 T分布的计算已列成表格 应用时可根据需要由t值 自由度查概率 也可以由概率 自由度查t值 1 T分布的密度函数为 2 t分布曲线的特点 t分布受自由度的制约 每一个自由度都有一条t分布曲线 t分布密度曲线以t 0为中心 两边对称 且在t 0时 分布密度函数取得最大值 与标准正态分布曲线相比 t分布曲线顶部略低 两尾部稍高而平 df越小这种趋势越明显 df越大 t分布越趋近于标准正态分布 当n 30时 t分布与标准正态分布的区别很小 3 t分布概率分布函数 2倍左尾概率 2倍右尾概率 两尾概率 4 查t分布表 附表4 对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表4 即t分布表 该表第一列为自由度df 表头为单尾概率值 而表尾为两尾概率值 表中数字即为临界t值 例如 当df 15时 查附表4得两尾概率等于0 05的临界t值为 2 131 其意义是 P t 2 131 P 2 131 t 0 025 P t 2 131 P 2 131 t 0 05 5 样本标准误 定义为样本标准误或均数标准误 其中s样本标准误是平均数抽样误差的估计值 二者的 第三样本标准差S与样本标准误的区别1 样本标准差S是反映样本中各变数变异程度大小的一个指标 它的大小反映了对该样本代表性的可靠性 在应用中 对于大样本资料 常用说明考察对象的优良性与稳定性 2 样本标准误是样本平均数的标准差 它是抽样误差的估计值 其大小说明了的精确性 反映了代表 的可靠性 在应用中 对于小样本资料 常用表示考察指标的优良性与抽样误差的大小 第四t分布的双侧分位点 假定X t n 给定 0 1 如果一个数c满足 P X c 则称这个数c是自由度n的t分布的双侧 分位点 数 记成t 2 n 对称分布的双侧 分位点就是上侧 2分位点 标准正态分布N 0 1 的双侧 分位点 记为 u 2 如 双侧0 05分位点u0 025 1 96 第五t 分布的特点 1 t分布为对称分布 关于t 0对称 只有一个峰 峰值在t 0处 与标准正态分布曲线相比 t分布曲线顶部略低 两尾部稍高而平 2 t分布曲线受自由度df的影响 自由度越小 离散程度越大 3 t分布的极限是正态分布 df越大 t分布越趋近标准正态分布 当n 30时 t分布与标准正态分布的区别很小 n 100时 t分布基本与标准正态分布相同 n 时 t分布与标准正态分布完全一致 总体 或样本 中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品 或不合格品 与全部产品总数之比总体比例可表示为样本比例可表示为 二 样本比例的抽样分布 一个正态总体中的抽样分布 一 比例 proportion 在重复选取容量为n的样本时 由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时 样本比例的抽样分布可用正态分布近似推断总体比例 的理论基础 二 样本比例的抽样分布 样本比例的数学期望样本比例的方差重复抽样不重复抽样 三 样本比例的抽样分布的数学期望与方差 二 样本比例的抽样分布 一个正态总体中的抽样分布 如果在样本容量为n的样本中 具有某一特征的个体数为X 则样本比例用表示 可用估计总体比例 当n充分大时 的分布可用正态分布逼近 三 样本方差的分布 一个正态总体中的抽样分布 对于来自正态总体的简单随机样本 则比值的抽样分布服从自由度为 n 1 2分布 即 三 样本方差的抽样分布 2分布设有一平均数为 方差为 的正态总体 现从该总体中独立地随机抽取n个随机变量x1 x2 xn 并求出其标准正态离差 记这n个相互独立的标准正态离差的平方和为 所设变量服从自由度为n的 2分布 记为若用样本平均数代替总体平均数 则随机变量服从自由度为n 1的 2分布 记为 查表 附表 例如查自由度为df 4 概率 0 05的值9 488 其含意就是df 4时 2大于9 488的概率为0 05 写作P 9 488 0 05 假定有两个正态总体 从第一个总体中随机抽取含量为n1的样本 并独立地从第二个样本中抽取含量为n2的样本 求出 s1和 s2 研究和的分布情况 一 概念 二 标准差已知时 样本平均数的抽样分布 两个样本均值之差的抽样分布 两个总体都为正态分布 即两个样本均值之差的抽样分布服从正态分布 其分布的数学期望为两个总体均值之差方差为各自的方差之和 两个样本均值之差的抽样分布 两个正态总体中抽样分布 三 标准差未知时 样本平均数的抽样分布 1与 2未知 但相等时 用两样本合并后的方差S代替 上式分母为平均数差的标准误 记为 n1与n2都等于n时 简化为 四 两个样本方差比的抽样分布从平均数和方差分别为 1 12 2 22 的两个正态总体中 抽出含量分别为n1 n2的样本 并分别求出它们的样本方差s12和s22 两个样本方差比的抽样分布 两个正态总体中抽样分布 两个 2分布除以各自自由度再相比 查F分布表 附表7P263 直线内插法 一个df值没有 自由度df1 df2下a的上侧临界值 Fdf1 df2 a下侧临界值 Fdf1 df2 1 a 1 Fdf2 df1 a 1 贝努里试验指只有两个可能结果的随机试验 在现实生活中许多随机现象只有两种结果 如 男 女 出现 不出现 合格 不合格等 关注的结果 成功 另一结果 失败 2 n重贝努里试验如果试验在相同的条件下重复n次 并且每次的试验结果相互独立 则称n重贝努里试验 大数定律 lawoflargenumbers 大数定律是一类描述当试验次数很大时所呈现的概率性质的定律 有些随机事件无规律可循 但不少却是有规律的 这些 有规律的随机事件 在大量重复出现的条件下 往往呈现几乎必然的统计特性 这个规律就是大数定律 若m是n次独立观察中事件A出现的次数 那么当次数n趋无穷大时 事件A出现的次数m与n的比值 频率 趋向于真实比值 概率 即当n充分大时 P A m n 大数定律 lawoflargenumbers 通俗地说 这个定理就是 在试验不变的条件下 重复试验多次 随机事件的频率近似于它的概率 简单地说 大数定理就是 当试验次数足够多时 事件发生的频率无穷接近于该事件发生的概率 比如 我们向上抛一枚硬币 硬币落下后哪一面朝上本来是偶然的 但当我们上抛硬币的次数足够多后 达到上万次甚至几十万几百万次以后 我们就会发现 硬币每一面向上的次数约占总次数的二分之一 这种情况下 偶然中包含着必然 必然的规律与特性在大量的样本中得以体现 3 二点分布 一次贝努里试验的概率分布 二项分布 n次贝努里试验的概率分布 4 二点分布是二项分布的特殊情况 5 二点分布 变量的取值只有两类 代码 0 1 分布列 6 二点分布的性质1 P 0 0P 1 02 P 0 P 1 q p 13 二点分布的期望与方差E 0 q 1 p pD E 2 E 2 02 q 12 p p2 p p2 7 二分变量中取值0和1 只表示定类变量的编码 这种变量又称虚拟变量 排列与组合 一 排列1 重复排列 2 非重复排列 3 全排列 例 任选5个数字 可组成多个编号 30人的班级 任意安排2人担任正副班长 有多少种排法 5种户型的住房 分给5人 有多少种分配方案 二 组合 例 家庭成员共8人 问有多少对人际关系 2人形成一对人际关系 且与方向无关 二项分布 一 二项分布1 与二点分布的区别将同样的实验或观察 独立的重复n次例 连续投掷硬币四次2 推广 3 二次分布的定义 n次实验中事件A出现次数 的概率分布 简写为 n 实验次数P A在每次实验中出现的概率 二项 指研究的变量的取值只有两个值 假定在总体中这两个值的个案数目相等 样本 一个个案 随机抽样 样本 两个个案 二项抽样分布可用多角线图来表示 当样本数量n 5时 概率分布如下 二项抽样分 N 样本大小r 成功数 注意 从图中可看到 当p Q 1 2的二项分布是对称的 从表中也可以看到这一点 只要p Q 1 无论p Q是何值 也存在相应的二项抽样分布特点 二 变量在某一取值区间的概率 1 A至多出现m次的概率2 A至少出现m次的概率3 A出现次数不少于a不大于b的概率 例 教师中吸烟的比例为50 随机抽查教师10人 求概率 1 全不吸烟2 1人吸烟3 至少2人吸烟4 2 4人吸烟 三 二项分布的数学期望 5 二项分布的方差等于6 查表方法 棣莫佛 拉普拉斯中心极限定理棣莫佛 拉普拉斯 deMovire Laplace 定理 即服从二项分布的随机变量序列的中心极限定理 它指出 参数为n p的二项分布以np为均值 np 1 p 为方差的正态分布为极限 例 根据生命表 年龄为60岁的人 可望活到下年的概率P 0 95 设某单位年龄为60岁的人共有10人 问 1 其中有9人活到下年的概率为多少 2 至少有9人活到下年的概率为多少 3 至多有9人活到下年的概率为多少 各个机率是可以相加的例如 N 5时 得到4个或5个成功的机会 p 4 5 p 4 5 0 156 0 031 0 187得到两个或以下是成功的机会时 p 2 p 0 p 1 p 2 0 031 0 156 0 313 0 50 总结 1 P Q 1 2 二项分布的图形是对称分布 2 P Q不等于1 2时 n值愈大 样本比例服从正态分布 当n 30时 即为大样本 p也叫成数 样本成数的抽样分布将随着n的增大而渐渐接近于以下正态分布 N p p 1 p n 总结 3 样本成数的期望值 p样本成数的标准差 成数可以看成是某种形式的均值 4 这些机率值在统计推论上具有重要意义 例1 某地资料 女性能活到75岁的概率为0 45 今随机抽取200名女性 问有半数以上活到75岁的概率是多少 解 P 0 45 n 200 np远大于5 所以样本服从正态分布 样本成数的标准差 0 035P p1 0 5 p p1 p SE 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第一单元 政治制度-统编版高二《历史》上学期期中选择题真题
- 2025四川大学华西医院健康管理中心妇科医师招聘2人考试笔试试卷【附答案】
- 工业废气催化燃烧技术在轻工行业的应用与市场前景报告
- 青海监狱面试题库及答案
- 2024年甘肃省林业和草原局下属事业单位考试真题
- 2025共同生产协议(合同样本)
- 2025房地产买卖合同范本
- 2025年北京租房合同的简化版本
- 2025年有偿保管合同范本
- 2025年连锁加盟合同范本
- 2024年典型事故案例警示教育手册15例
- DL∕T 853-2015 带电作业用绝缘垫
- DL5000-火力发电厂设计技术规程
- 中药郁金课件
- 农资创业项目计划书
- 环境标志产品技术要求 房间空气调节器(HJ 2535-2013代替HJ-T304-2006)
- 人工智能教育应用研究综述
- 生殖内分泌学
- 驾校教练员培训课件
- 冠寓公寓运营管理手册
- 人工智能 第2版 课件 AI12类脑智能
评论
0/150
提交评论