




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计2 2 1用样本的频率分布估计总体分布 用样本估计总体 在统计中 用样本的有关情况估计总体的相应情况大体上有两类方法 一 用样本的频率分布去估计总体分布 二 用样本的某种数字特征去估计总体相应数字特征 如平均数 标准差等 抽查某地区55名12岁男生的身高 单位 cm 的测量值如下 128 1144 4150 3146 2140 6126 0125 6127 7154 4142 7141 2142 7137 6136 9132 3131 8147 7138 4136 6136 2141 6141 1133 1142 8136 8133 1144 5142 4140 8127 7150 7160 3138 8154 3147 9141 3143 8138 1139 7142 9144 7148 5138 3135 3134 5140 6138 4137 3149 5142 5139 3156 1152 2129 8133 2试从以上数据中 对该地区12岁男生的身高情况进行大致的推测 情景导入 为此 需要对统计数据进行整理和分析 分析数据的一种基本方法是用图将他们画出来 或用表格改变数据的排列方式 128 1144 4150 3146 2140 6126 0125 6127 7154 4142 7141 2142 7137 6136 9132 3131 8147 7138 4136 6136 2141 6141 1133 1142 8136 8133 1144 5142 4140 8127 7150 7160 3138 8154 3147 9141 3143 8138 1139 7142 9144 7148 5138 3135 3134 5140 6138 4137 3149 5142 5139 3156 1152 2129 8133 2 根据以上数据可以画出频数分布表和频数分布图 从图表中可以清楚地知道数据分布在各个小组的个数 频率分布表和频率分布图 则从各个小组的数据在样本容量中所占比例的大小来表示数据分布的规律 画频率分布直方图的具体做法如下 1 求极差 最大值与最小值的差 160 3 125 6 34 7 2 决定组距与组数 将数据分组 组数 极差 组距 34 7 5 6 9 因此组距为5 组数为7 3 将数据分组 4 画频率分布表 125 45 130 45 130 45 135 45 135 45 140 45 140 45 145 45 145 45 150 45 150 45 155 45 155 45 160 45 55名12岁男生身高的频率分布表 一 频率分布表 4 画频率分布表 5 画频率分布直方图 二 频率分布直方图 1 频率分布表列出的是数据落在各个小组的频率 2 频率分布直方图是用面积表示数据落在各个小组的频率的大小 在频率分布直方图中 各小长方形面积之和为1 说明 画频率分布直方图的一般步骤 1 求极差 最大值与最小值的差 2 决定组距与组数 将数据分组 组数 极差 组距 当样本容量不超过100时 组数一般为5 12组 5 画频率分布直方图 4 画频率分布表 二 频率分布直方图 3 将数据分组 三 频率分布折线图 随着样本容量的增加 作图时所分的组数增加 组距减小 相应的频率折线图会越来越接近于一条光滑曲线 统计中称这条光滑曲线为总体密度曲线 四 总体密度曲线 四 总体密度曲线 身高 a b 图中阴影部分的面积 表示总体在区间 a b 内取值的百分比 反映了总体分布 即反映了总体在各个范围内取值的百分比 说明 总体密度曲线是客观存在的 但在实际中 我们只能用样本来估计 由于样本是随机的 不同的样本得到的频率分布折线图不同 即使是同一样本 不同的分组得到的频率分布折线图也不同 也就是说 频率分布折线图是随着样本的容量和分组情况的变化而变化的 因此不能由样本的频率分布折线图得到准确的总体密度曲线 例1 为了了解某地高一年级男生的身高情况 从其中的一个学校选取容量为60的样本 60名男生的身高 单位 cm 分组情况如下 6 0 45 27 例2 一个社会调查机构就某地居民的月收入调查了10000人 并根据所得数据画了样本的频率分布直方图 为了分析居民的收入与年龄 学历 职业等方面的联系 要从这10000人中再用分层抽样的方法抽出100人作进一步调查 则在 2500 3000 元 月收入段应抽出人 25 试验1 进行 抛掷硬币 试验的试验结果 画出频率分布的条形图 注意点 各直方长条的宽度要相同 相邻长条之间的间隔要适当 结论 当试验次数无限增大时 0 1 两种试验结果的频率大致相同 五 总体分布 排除了抽样造成的误差 精确地反映了总体取值的概率分布规律 这种总体取值的概率分布规律通常成为总体分布 2 研究总体概率分布往往可以研究其频数分布 频率分布 频率分布与总体分布的关系 1 通过样本的频数分布 频率分布可以估计总体的概率分布 抽样过程中加大样本容量 排除抽样造成的误差 这样样本的分布频率精确地反映了总体取值的概率分布规律 用样本的频率分布估计总体分布 可以分为两种情况 1 当总体中的个体取不同数值很少时 如试验1 其几何表示用条形图 2 当总体中的个体取不同数值较多 甚至无限时或总体可以在一个实数区间内取值 如试验2 其几何表示用直方图 说明 以上两种情况的不同之处在于 前者的频率分布表列出的是几个不同数值的频率 条形图用其高度来表示取各个值的频率 后者的频率分布表列出的是在各个不同区间内取值的频率 直方图用其图形面积的大小来表示在各个区间内取值的频率 各长方形面积之和为1 nba某赛季甲 乙两名篮球运动员每场比赛的得分的原始纪录如下 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 问题一 请用适当的方法表示上述数据 并对两名运动员的得分能力进行比较 六 茎叶图 问题二 用上次课所学的制作样本的频率分布直方图来分析好吗 甲 13 51 23 8 26 38 16 33 14 28 39 乙 49 24 12 31 50 31 44 36 15 37 25 36 39 当数据比较少时 应用列分布直方图反而不方便 简化制图格式和步骤 得到新的统计制图方法 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 茎叶图 茎叶图 顾名思义 茎是指中间的一列数 叶就是从茎的旁边生长出来的数 中间的数字表示得分的十位数 旁边的数字分别表示两个人得分的个位数 茎叶图特点 茎叶图不仅能保留原始数据 而且能够展示数据的分布情况 乙 得分基本上是对称的 叶的分布是 单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北劳动关系职业学院《北京规划研究》2023-2024学年第二学期期末试卷
- 齐鲁医药学院《微机原理与嵌入式系统实验》2023-2024学年第二学期期末试卷
- 潍坊工程职业学院《Java开发框架》2023-2024学年第二学期期末试卷
- 三亚学院《演讲与主持》2023-2024学年第二学期期末试卷
- 大连工业大学艺术与信息工程学院《建筑概预算》2023-2024学年第二学期期末试卷
- 天津开发区职业技术学院《微电子器件基础》2023-2024学年第二学期期末试卷
- 心理咨询技能课件
- 内蒙古鸿德文理学院《酒店收益管理》2023-2024学年第二学期期末试卷
- 吉林交通职业技术学院《动植物检验检疫》2023-2024学年第二学期期末试卷
- 广西机电职业技术学院《电法勘探》2023-2024学年第二学期期末试卷
- 2025年四川省成都市锦江区中考二诊物理试题(含答案)
- (二模)赣州市2025年高三年级适应性考试英语试卷(含答案)
- 2024年新疆阿合奇县事业单位公开招聘村务工作者笔试题带答案
- 2025-2030中国胃食管反流药物行业市场发展趋势与前景展望战略研究报告
- 2025年建筑集成光伏(BIPV)市场规模分析
- 小学生脱口秀课件
- 2025-2030海工装备制造行业市场深度调研及前景趋势与投资研究报告
- 华为测试面试题及答案
- 漂珠销售合同协议
- 2025化学中考解题技巧 专题10 技巧性计算(解析版)
- 部门加班调休管理制度
评论
0/150
提交评论