




已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课标版理数 10 6统计 一 随机抽样1 总体 个体 样本 样本容量的概念统计中所考察对象的全体构成的集合看作总体 构成总体的每个元素作 为个体 从总体中抽取的 各个个体所组成的集合叫样本 样本中个体的 个数叫样本容量 2 简单随机抽样一般地 设一个总体含有n个个体 从中逐个 不放回地抽取n个个体作为样本 n n 如果每次抽取时总体内的各个个体被抽到的 机会都相等 就把这种抽样方法叫做简单随机抽样 最常用的简单随机抽样的方法有两种 抽签法和 随机数法 3 系统抽样当总体中的个体比较多时 首先把总体分成均衡的若干部分 然后按照 事先确定的规则 从每一部分中抽取一个个体 得到所需要的样本 这 种抽样方法叫做系统抽样 4 分层抽样一般地 在抽样时 将总体分成互不交叉的层 然后按照 一定的比例 从各层独立地抽取一定数量的个体 将各层取出的个体合在一起作为样本 这种抽样方法是一种分层抽样 二 用样本估计总体1 用样本的频率分布估计总体分布 1 频率分布表与频率分布直方图频率分布表和频率分布直方图 是从各个小组数据在样本容量中所占比例大小的角度 来表示数据分布的规律 它可以使我们看到整个样本数据 的频率分布情况 绘制频率分布直方图的步骤为 求极差 决定组距与组数 将数据分组 列频率分布表 画频率分布直方图 2 频率分布折线图连结频率分布直方图中各小长方形上端的中点 就得到频率分布折线图 3 茎叶图统计中还有一种被用来表示数据的图叫做茎叶图 一般地 茎是指中间的一列数 叶就是从茎的旁边生长出来的数 用茎叶图刻画数据有两个优点 a 所有的数据信息都可以从图中得到 b 茎叶图便于数据的记录和表示 能够展示数据的分布情况 但当样本数据较多或数据位数较多时 茎叶图就显得不太方便 2 用样本的数字特征估计总体的数字特征 1 众数 一组数据中出现次数最多的数 2 中位数 将数据从小到大排列 若有奇数个数 则最中间的数是中位数 若有偶数个数 则中间两数的平均数是中位数 3 平均数 反映了一组数据的平均水平 4 标准差 s 反映了样本数据的离散程度 5 方差 s2 x1 2 x2 2 xn 2 反映了样本数据的离散程度 三 变量间的相关关系及回归分析1 相关关系 当自变量取值一定时 因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系 与函数关系不同 相关关系是一种不 确定关系 2 散点图 表示具有相关关系的两个变量的一组数据的图形叫做散点图 它可直观地判断两变量的关系是否可以用线性关系表示 若这些点散布在从左下角到右上角的区域 则称两个变量正相关 若这些点散布在从左上角到右下角的区域 则称两个变量负相关 3 回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 在线性回归模型y bx a e中 因变量y的值由自变量x和随机误差e共同确定 即自变量x只能解释部分y的变化 在统计中 我们把自变量x称为解释变量 因变量y称为预报变量 4 1 回归方程 x 其中 它主要用来估计和预测取值 从而获得对这两个变量之间整体关系的了解 2 相关指数用相关指数r2来刻画回归的效果 其计算公式是r2 1 r2越大 说明残差平方和 yi 2越小 也就是说模型的拟合效果越好 在线性回归模型中 r2表示解释变量对预报变量变化的贡献率 r2越接近于1 表示回归效果越好 5 相关系数 它主要用于相关量的显著性检验 以衡量它们之间的线性相关程度 当r 0时 表示两个变量正相关 当r 0时 表示两个变量负相关 r 越接近1 表明两个变量的线性相关性越强 当 r 接近0时 表明两个变量间几乎不存在线性相关关系 四 独立性检验1 分类变量 变量的不同 值 表示个体所属的不同类别 像这样的变量称为分类变量 2 列联表 列出两个分类变量的频数表 称为列联表 假设有两个分类 变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 可构造一个随机变量k2 其中n a b c d为样本容量 3 独立性检验利用随机变量 独立性假设来确定是否一定有把握认为 两个分类变量有关系 的方法称为两个分类变量的独立性检验 两个分类变量x和y是否有关系的判断方法 统计学研究表明 当k2 3 841时 认为x与y无关 当k2 3 841时 有95 的把握说x与y有关 当k2 6 635时 有99 的把握说x与y有关 当k2 10 828时 有99 9 的把握说x与y有关 1 将参加夏令营的600名学生编号为 001 002 600 采用系统抽样方法抽取一个容量为50的样本 且随机抽得的号码为003 这600名学生分住在三个营区 从001到300在第 营区 从301到495在第 营区 从496到600在第 营区 三个营区被抽中的人数依次为 a 25 17 8b 25 16 9c 26 16 8d 24 17 9 答案a总体容量为600 样本的容量是50 600 50 12 因此 每隔12个号能抽到一名 由于随机抽得第一个号码为003 所以按照系统抽样的操作步骤在第 营区应抽到25人 第 营区应抽到17人 第 营区应抽到8人 故选a 2 甲 乙两名运动员在某项测试中的8次成绩如茎叶图所示 分别表示甲 乙两名运动员这项测试成绩的平均数 s1 s2分别表示甲 乙两名运动员这项测试成绩的标准差 则有 a s1s2 答案b甲的成绩为8 9 14 15 15 16 21 22 乙的成绩为7 8 13 15 15 17 22 23 15 s1 15 s2 故选b 3 已知回归直线斜率的估计值为1 23 样本点的中心为点 4 5 则回归直线的方程为 a 1 23x 4b 1 23x 5c 1 23x 0 08d 0 08x 1 23答案c回归直线必过点 4 5 故其方程为 5 1 23 x 4 即 1 23x 0 08 4 某单位为了了解用电量y度与气温x 之间的关系 随机统计了某4天的用电量与当天气温 并制作了对照表 由表中数据得线性回归方程 x 中 2 预测当气温为 4 时 用电量约为度 答案68解析 10 40 回归直线过点 40 2 10 60 2x 60 令x 4 得 2 4 60 68 5 某社会调查机构就某地居民的月收入调查了10000人 并根据所得数据画了样本的频率分布直方图 如图 为了分析居民的收入与年龄 学历 职业等方面的关系 要从这10000人中再用分层抽样方法抽出100人做进一步调查 则在 2500 3000 元 的月收入段应抽取人 答案25解析由频率分布直方图可得出在 2500 3000 元 的月收入段的频率为0 0005 500 0 25 所以应抽取0 25 100 25人 典例1 1 2014湖南 2 5分 对一个容量为n的总体抽取容量为n的样本 当选取简单随机抽样 系统抽样和分层抽样三种不同方法抽取样本时 总体中每个个体被抽中的概率分别为p1 p2 p3 则 a p1 p2 p3b p2 p3 p1c p1 p3 p2d p1 p2 p3 2 2013陕西 4 5分 某单位有840名职工 现采用系统抽样方法抽取42人做问卷调查 将840人按1 2 840随机编号 则抽取的42人中 编号落入区间 481 720 的人数为 a 11b 12c 13d 14 抽样方法 解析 1 因为采取简单随机抽样 系统抽样和分层抽样抽取样本时 总体中每个个体被抽中的概率相等 故选d 2 因为840 42 20 1 故编号在 481 720 内的人数为240 20 12 答案 1 d 2 b 三种抽样方法的比较 1 1某批零件共160个 其中 一级品48个 二级品64个 三级品32个 等外品16个 从中抽取一个容量为20的样本 请说明分别用简单随机抽样 系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同 解析 1 简单随机抽样法 可采取抽签法 将160个零件按1 160编号 相应地制作1 160号的160个签 从中随机抽20个 显然每个个体被抽到的概率为 2 系统抽样法 将160个零件从1至160编上号 按编号顺序分成20组 每组8个 先在第1组中用抽签法抽得k号 1 k 8 则在其余组中分别抽取第k 8n n 1 2 3 19 号 此时每个个体被抽到的概率为 3 分层抽样法 按比例 分别在一级品 二级品 三级品 等外品中抽取48 6个 64 8个 32 4个 16 2个 每个个体被抽到的概率分别为 都是 总之 无论采取上述哪种抽样 总体中每个个体被抽到的概率都是 典例2 2014山东 7 5分 为了研究某药品的疗效 选取若干名志愿者进行临床试验 所有志愿者的舒张压数据 单位 kpa 的分组区间为 12 13 13 14 14 15 15 16 16 17 将其按从左到右的顺序分别编号为第一组 第二组 第五组 如图是根据试验数据制成的频率分布直方图 已知第一组与第二组共有20人 第三组中没有疗效的有6人 则第三组中有疗效的人数为 频率分布直方图的应用 a 6b 8c 12d 18 答案c解析由题图可知 第一组和第二组的频率之和为 0 24 0 16 1 0 40 故 该试验共选取的志愿者有 50人 所以第三组共有50 0 36 18人 其中有疗效的人数为18 6 12 用频率分布直方图解决相关问题时 应正确理解图表中各个量的意义 识图掌握信息是解决该类问题的关键 频率分布直方图有以下几个要点 1 纵轴表示频率 组距 2 频率分布直方图中各小长方形高的比也就是相应各组的频率之比 3 直方图中各小长方形的面积是相应各组的频率 所有的 小长方形的面积之和等于1 即频率之和为1 2 1从某小区抽取100户居民进行月用电量调查 发现其月用电量都在50至350度之间 频率分布直方图如图所示 1 直方图中x的值为 2 在这些用户中 月用电量落在区间 100 250 度 内的户数为 答案 1 0 0044 2 70解析 1 由频率分布直方图中各小长方形的面积之和为1 得 0 0012 0 0024 2 0 0036 x 0 0060 50 1 解得x 0 0044 2 月用电量在 100 250 度 内的频率为 0 0036 0 0044 0 0060 50 0 7 故户数为100 0 7 70 2 2某中学高一女生共有450人 为了了解高一女生的身高情况 随机抽取部分高一女生测量身高 所得数据整理后 列出频率分布表如下 1 求出表中字母m n m n所对应的数值 2 在直角坐标系中画出频率分布直方图 3 估计该校高一女生身高在149 5 165 5cm范围内有多少人 解析 1 由题意得m 50 可得m 50 8 6 14 10 8 4 n 0 08 n 1 00 2 频率分布直方图如图 3 该所学校高一女生身高在149 5 165 5cm范围内的频率为0 12 0 28 0 20 0 16 0 76 则该校高一女生身高在此范围内的人数为450 0 76 342 典例3 2013重庆 4 5分 以下茎叶图记录了甲 乙两组各五名学生在一次英语听力测试中的成绩 单位 分 已知甲组数据的中位数为15 乙组数据的平均数为16 8 则x y的值分别为 茎叶图 a 2 5b 5 5c 5 8d 8 8 答案c解析由茎叶图及已知得x 5 又乙组数据的平均数为16 8 即 16 8 解得y 8 选c 1 作样本的茎叶图时先要根据数据特点确定茎 叶 再作茎叶图 2 作样本的茎叶图时 一般对称作图 茎部位的数字由上向下 从小到大排列 叶部位的数字由内向外 从小到大排列 3 给定两组数据的茎叶图 比较数字特征时 重心 下移者平均数较大 数据集中者方差较小 3 1甲和乙两个城市去年上半年每月的平均气温 单位 用茎叶图记录如下 根据茎叶图可知 两城市中平均温度较高的城市是 气温波动较大的城市是 答案乙 乙解析甲城市的平均气温 t1 16 乙城市的平均气温 t2 19 甲城市气温的方差 9 16 2 13 16 2 17 16 2 17 16 2 18 16 2 22 16 2 乙城市气温的方差 12 19 2 14 19 2 17 19 2 20 19 2 24 19 2 27 19 2 28 所以乙城市平均温度较高 乙城市气温波动较大 3 2若某校高一年级8个班参加合唱比赛的得分如茎叶图所示 则这组数据的中位数和平均数分别是 a 91 5和91 5b 91 5和92c 91和91 5d 92和92答案a解析将这组数据从小到大排列 得87 89 90 91 92 93 94 96 故中位数为 91 5 平均数为 91 91 5 典例4 2014课标 19 12分 某地区2007年至2013年农村居民家庭人均纯收入y 单位 千元 的数据如下表 1 求y关于t的线性回归方程 2 利用 1 中的回归方程 分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况 并预测该地区2015年农村居民家庭人均纯收入 回归分析 附 回归直线的斜率和截距的最小二乘估计公式分别为 解析 1 由所给数据计算得 1 2 3 4 5 6 7 4 2 9 3 3 3 6 4 4 4 8 5 2 5 9 4 3 ti 2 9 4 1 0 1 4 9 28 ti yi 3 1 4 2 1 1 0 7 0 0 1 1 0 5 2 0 9 3 1 6 14 0 5 4 3 0 5 4 2 3 所求回归方程为 0 5t 2 3 2 由 1 知 0 5 0 故2007年至2013年该地区农村居民家庭人均纯收入逐年增加 平均每年增加0 5千元 将2015年的年份代号t 9代入 1 中的回归方程 得 0 5 9 2 3 6 8 故预测该地区2015年农村居民家庭人均纯收入为6 8千元 回归分析是处理变量相关关系的一种数学方法 主要解决 1 确定特定量之间是否有相关关系 如果有 就找出它们之间贴近的数学表达式 2 根据一组观察值 预测变量的取值及判断变量取值的变化趋势 4 1假设关于某设备的使用年限x 年 和所支出的维修费用y 万元 有如下表的统计资料 若由资料可知y对x呈线性相关关系 1 求线性回归直线方程 2 估计使用年限为10年时 维修费用是多少 解析 1 列表如下 4分 于是 5 1 23 4 0 08 6分 所以线性回归直线方程为 1 23x 0 08 8分 2 当x 10时 1 23 10 0 08 12 38 即估计使用年限为10年时 维修费用是12 38万元 12分 典例5 2014辽宁沈阳3月 19 12分 某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查 统计数据如下表所示 1 如果随机抽查这个班的一名学生 那么抽到积极参加班级工作的学生的概率是多少 抽到不太主动参加班级工作且学习积极性一般的学生的概率 独立性检验 是多少 2 试运用独立性检验的思想方法分析 学生的学习积极性与对待班级工作的态度是否有关 并说明理由 解析 1 随机抽查这个班的一名学生 有50种不同的抽查方法 由于积极参加班级工作的学生有18 6 24人 所以抽到积极参加班级工作的学生的抽法有24种 因此由古典概型概率的计算公式可得抽到积极参加班级工作的学生的概率是p1 因为不太主动参加班级工作且学习积极性一般的学生有19人 所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是p2 2 k2 11 538 由于11 538 10 828 所以有99 9 的把握认为学生的学习积极性与对待班级工作的态度有关系 独立性检验的基本思想类似于反证法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年文化创意产业发展策略案例分析试卷及答案
- 南宁六中一年级数学试卷
- 萌萌沉浸式做数学试卷
- 莆田四中高三数学试卷
- 清华高水平招生数学试卷
- 南安小升初数学试卷
- 印刷技术在防水手机壳包装的工艺挑战
- 沛县2年级期末数学试卷
- 乐山联考高一数学试卷
- 2025年面板检测系统项目合作计划书
- 铁路建设工程质量安全监督管理办法
- 数字经济与市场结构-洞察及研究
- 医疗器械经营质量管理规范培训
- DB42T 1496-2019 公路边坡监测技术规程
- 学校餐厅试吃活动方案
- 山水项目管护方案(3篇)
- 医院直播策划活动方案
- 2025驾驶员交通安全培训
- 学校清单制管理制度
- 便血中医护理方案
- 2025建造师二级考试题库及答案
评论
0/150
提交评论