




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用心 爱心 专心 1 统统 计计 1 1 抽样方法抽样方法 1 简单随机抽样 抽签法 随机数表法 常常用于总体个数较少时 它的 特征是从总体中逐个抽取 2 系统抽样也叫等距离抽样 常用于总体个数较多时 它的 主要特征是均衡成若干部分 每部分只取一个 3 分层抽样 主要特征是分层按比例抽 样 主要用于总体中有明显差异 它们的共同点共同点 每个个体被抽到的概率都相等 体现 n N 了抽样的客观性和平等性 如 如 1 1 某社区有 500 个家庭 其中高收入家庭 125 户 中等收入家庭 280 户 低收入家 庭 95 为了调查社会购买力的某项指标 要从中抽取一个容量为 100 户的样本 把这种抽样 记为 A 某中学高中一年级有 12 名女排运动员 要从中选取 3 人调查学习负担的情况 把这 种抽样记为 B 那么完成上述两项调查应分别采用的抽样方法 A 为 B 为 答 分层抽样 简单随机抽样 3 3 某中学有高一学生 400 人 高二学生 300 人 高三学生 300 人 现通过分层抽样抽 取一个容量为 n 的样本 已知每个学生被抽到的概率为 0 2 则 n 答 200 4 4 容量为 100 的样本拆分成 10 组 前 7 组的频率之和为 0 79 而剩下的三组的频数 组成等比数列 且其公比不为 1 则剩下的三组中频数最大的一组的频率是 答 0 16 5 5 用简单随机抽样的方法从含有 10 个个体的总体中 抽取一个容量为 2 的样本 则 某一个体 第一次被抽到的概率 第一次未被抽到 第二次被抽到的概率 在整个抽a 样过程中被抽到的概率 分别是 答 111 10 10 5 2 2 总体分布的估计 总体分布的估计 用样本估计总体 是研究统计问题的一个基本思想方法 即用样本 平均数估计总体平均数 即总体期望值 描述一个总体的平均水平 用样本方差估计总 体方差 方差和标准差是描述一个样本和总体的波动大小的特征数 方差或标准差越小 表 示这个样本或总体的波动越小 即越稳定 一般地 样本容量越大 这种估计就越精确 总体估计要掌握 1 表 频率分布表 2 图 频率分布直方图 频率分布直方图的特征 1 从频率分布直方图可以清楚的看出数据分布的总体趋势 2 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后 原有的具体 数据信息就被抹掉了 频率直方图的作法 1 算数据极差 minmax xx 2 决定组距和组数 3 决定分点 4 列频率分布表 5 画频率直方图 提醒提醒 直方图的纵轴 小矩形的高 一般是频率除以组距的商 而不是频率 横轴一般是 数据的大小 小矩形的面积表示频率小矩形的面积表示频率 组数的决定方法是 设数据总数目为 n 时 50 n 分为组 时 分为组 8 510050 n12 8 如 如 1 1 一个容量为 20 的样本数据 分组后组距与频数如下 10 20 2 20 30 3 30 40 4 40 50 5 50 60 4 60 70 2 则样本在区间上的频率为 50 50 A 5 B 25 C 50 D 70 答 D 用心 爱心 专心 2 2 2 已知样本 10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 那么频率为 0 3 的范围是 A 5 5 7 5 B 7 5 9 5 C 9 5 11 5 D 11 5 13 5 答 B 3 3 观察新生儿的体重 其频率分布直方图如图所示 则新生儿的体重在 2700 3000 的频率为 答 0 3 4 4 如图 是一次数学考试成绩的样本频率 分布直方图 样本容量 n 200 若成绩不低于 60 分为及格 则样本中的及格人数是 答 120 5 5 有同一型号的汽车 100 辆 为了解这种汽车每蚝油 1L 所行路程的情况 现从中随即 抽出 10 辆在同一条件下进行蚝油 1L 所行路程实验 得到如下样本数据 单位 km 13 7 12 7 14 4 13 8 13 3 12 5 13 5 13 6 13 1 13 4 其分组如下 1 完成上面频率分布表 2 根据上表 在给定坐标系中画出 频率分布直线图 并根据样本估计总体数据 落在 12 95 13 95 中的概率 3 根据样本 对总体的期望值进行 估计 解 1 频率分布表 分组频数频率 12 45 12 95 20 2 12 95 13 45 30 3 13 45 13 95 40 4 13 95 14 45 10 1 分组频数频率 12 45 12 95 12 95 13 45 13 45 13 95 13 95 14 45 合计 101 0 O2400 2700 36003300 3000 3900 体重 g 率率 率率 0 001 分数 频率 组距 0 20406080100 0 018 0 012 0 009 0 006 0 005 用心 爱心 专心 3 合计 101 0 2 频率分布直方图 估计总体数据落在 12 95 13 95 中的概率为 0 7 3 13 40 7 0 3 1 40 80 3 0 5 0 50 60 1 0 4 13 10 x 因此 总体的期望值进行估计约为 13 4 6 为了了解高一学生的体能情况 某校抽取部分学生进行一分钟跳绳次数次测试 将所得 数据整理后 画出频率分布直方图 如图 图中从左到右各小长方形面积之比为 2 4 17 15 9 3 第二小组频数为 12 1 第二小组的频率是多少 样本容 量是多少 2 若次数在 110 以上 含 110 次 为达标 试估计该学校全体高一 学生的达标率是多少 3 在这次测试中 学生跳绳次数的 中位数落在哪个小组内 请说明 理由 分析 在频率分布直方图中 各小 长方形的面积等于相应各组的频率 小长方形的高与频数成正比 各组 频数之和等于样本容量 频率之和 等于 1 解 1 由于频率分布直方图以面积的形式反 映了数据落在各小组内的频率大小 因此第二小组的频率为 4 0 08 24171593 又因为频率 所以 第二小组频数 样本容量 12 150 0 08 第二小组频数 样本容量 第二小组频率 2 由图可估计该学校高一学生的达标率约为 171593 100 88 24171593 3 由已知可得各小组的频数依次为 6 12 51 45 27 9 所以前三组的频数之和为 69 前四组的频数之和为 114 所以跳绳次数的中位数落在第四小组内 9010 0 11 0 12 0 13 0 14 0 15 0 次数 o 0 00 4 0 00 8 0 01 2 0 01 6 0 02 0 0 02 4 0 02 8 频率 组距 0 03 2 0 03 6 用心 爱心 专心 4 3 3 样本平均数 样本平均数 12 1 11 n ni i xxxxx nn 如如有一组数据 x1 x2 xn x1 x2 xn 它们的算术平均值为 20 若去掉其中的 xn 余下数据的算术平均值为 18 则xn关于 n 的表达式为 答 218 n xn 4 4 样本方差 样本方差 2222 12 1 n sxxxxxx n 2 1 1 n i i xx n 样本标准差 222 12 1 n sxxxxxx n 如 如 1 1 甲 乙两名射击运动员参加某大型运动会的预选赛 他们分别射击了 5 次 成绩 如下表 单位 环 甲 108999 乙 1010799 如果甲 乙两人中只有 1 人入选 则入选的应是 答 甲 2 2 已知实数的期望值为 方差为 若 2 21 nxxx n x 2 S n i i ax n m 1 2 1 则一定有 xa A B C D 与无法比较大小 答 B mS 2 mS 2 mS 22 Sm 3 3 某班 40 人随机平均分成两组 两组学生一次考试的成绩情况如下表 则全班的平均分为 方差为 答 85 51 提醒提醒 若的平均数为 方差为 则的平均数 12 n x xx x 2 s 12 n axb axbaxb 为 方差为 axb 22 a s 如如已知数据的平均数 方差 则数据的 n xxx 21 5 x4 2 S73 7 3 73 21 n xxx 平均数和标准差分别为 A 15 36 B 22 6 C 15 6 D 22 36 答 B 5 5 茎叶图茎叶图 1 茎叶图的画法 将每个数据分为茎 高位 与叶 低位 两部分 将最大茎和最小茎之间的数按大小 顺序排成一列 将各数据的叶依先后次序写 在其茎的左 右 两侧 2 茎叶图的特征 用茎叶图表示数据有两个优点 一是从统计图上没有原始数据信息的损失 所有 数据信息都可以从茎叶图中得到 二是茎叶图中的数据可以随时记录 随时添加 方便记 录与表示 茎叶图只便于表示两位有效数字的数据 而且茎叶图只方便记录两组的数据 两 个以上的数据虽然能够记录 但是没有表示两个记录那么直观 清晰 6 6 独立性检验独立性检验 独立性检验是检定两个事件间是否独立的统计方法 是卡方检验的一个应用 卡方检验卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布 统计量 组别 平均分方差 第 1 组 8016 第 2 组 9036 用心 爱心 专心 5 所作的假设检验 即根据样本的频数分布来推断总体的分布 卡方独立性检验的零假设是各 事件之间相互独立 卡方值永远大于零 2 2 的两个临界值分别是的两个临界值分别是 3 8413 841 与 与 6 635 6 635 3 841 时 接受假设即两事件无关 2 x 相关系数相关系数是测定变量之间相关密切程度和相关方向的代表性指标 相关系数用符号 r 表示 其特点表现在 参与相关分析的两个变量是对等的 不分自变量和因变量 改变两 变量的地位并不影响相关系数的数值 因此相关系数只有一个 相关系数有正负号反映相关 系数的方向 正号反映正相关 负号反映负相关 回归和相关都是研究两个变量相互关系的分析方法 相关分析研究两个变量之间相关的 方向和相关的密切程度 但是相关分析不能指出两变量相互关系的具体形式 也无法从一个 变量的变化来推测另一个变量的变化关系 回归方程则是通过一定的数学方程来反映变量之 间相互关系的具体形式 以便从一个已知量来推测另一个未知量 为估算预测提供一个重要 的方法 相关性检验的步骤相关性检验的步骤是 1 做统计假设 x 与 Y 不具备线性相关关系 2 根据小概率 0 05 与查出 r 的一个临界值 3 根据样本相关系数公式计算出 r 的值 4 作统计推断 2n 如果表明 95 的把握认为 x 与 Y 之间具备线性相关关系 如果接受假设 0 05 rr 0 05 rr 提醒 提醒 A 与 B 有关并不意味着 A 的发生必然导致 B 的发生 7 7 回归分析回归分析 回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定 确定一个相应的数学表达式 以便从一个已知量来推测另一个未知量 为估计预测提供一个 重要的方法 在回归分析中 由 X 推算 Y 与由 Y 推算 X 的回归方程是不同的 不可混淆 与相关 2 ii i xxyy baybx xx 由x推y 2 ii i xxyy baxby yy 由y推x 分析相比 回归分析的特点是 两个变量是不对等的 只能用自变量来估计因变量 而不允 许由因变量来推测自变量 必须区分自变量 一般说 事物的原因作自变量 X 回归分析和相关分析是互相补充 密切联系的 相关分析需要回归分析来表明现象数量相 关的具体形式 而回归分析则应该建立在相关分析的基础上 依靠相关分析表明现象的数量 变化具有密切相关 进行回归分析求其相关的具体形式才有意义 如如 1 在研究色盲与性别的关系调查中 调查了男性 480 人 其中有 38 人患色盲 调 查的 520 个女性中 6 人患色盲 1 根据以上的数据建立一个 2 2 的列联表 2 若认为 性别与患色盲有关系 则出错的概率会是多少 解 1 患色盲不患色盲总计 男 38442480 女 6514520 总计 449561000 2 假设 H 性别与患色盲没有关系 先算出 K 的观测值 用心 爱心 专心 6 2 1000 38 514442 6 27 14 480 520 44 956 k 率 则有 2 10 808 0 001P K 即是 H 成立的概率不超过 0 001 若认为 性别与患色
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司撕名牌策划方案
- 公司日常打卡小活动方案
- 公司组织哪些活动方案
- 公司美食节活动策划方案
- 公司沙龙如何做活动方案
- 公司节能减排策划方案
- 公司整年团建活动方案
- 公司消费扶贫活动方案
- 公司职工瑜伽活动方案
- 公司环保创新活动方案
- 2024年 黄冈市法院系统招聘审判辅助人员考试真题试题含答案
- 荆州中学2024-2025学年高二下学期6月月考历史试题答案
- 公司消防网格化管理制度
- 外科换药拆线技术规范
- 2025年四川泸州市中考数学试卷真题及答案详解(精校打印)
- 2025年中考考前最后一卷化学(武汉卷)(全解全析)
- 2026届高考语文复习:直击2025年语文高考阅读客观题关键词比对
- 江西中考语文试题及答案
- 公司收购公司部分股权之可行性研究报告
- 曲靖一中2025届高考决胜全真模拟卷(二)化学试题及答案
- T/CHES 43-2020水利水电工程白蚁实时自动化监测预警系统技术规范
评论
0/150
提交评论