版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计全章复习与巩固 【学习目标】 1. 理解随机抽样的必要性和重要性:会用简单随机抽样方法从总体中抽取样本:了解分层抽样和系统 抽样方法,会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本. 2. 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们 各自的特点. 3理解样本数据标准差的意义和作用,会计算数拯标准差:能从样本数拯中提取基本的数字特征(如 平均数、标准差),并作岀合理的解释. 4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样 本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思
2、想,解决一些简单的实际问题. 6会作两个相关联变量数据的散点图,会利用散点图理解变量间的相关关系:了解最小二乘法的思想, 能根据给出的线性回归方程系数公式建立线性回归方程. 【知识网络】 【要点梳理】 要点一:抽样方法 从调査的对象中按照一泄的方法抽取一部分,实行调查或观测,获取数据,并以此对调查对象的某项 指标做出推断,这就是抽样调査.调査对象的全体称为总体,被抽取的一部分称为样本. 1. 简单的随机抽样 简单随机抽样的概念: 设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽 到的概率相等,就称这样的抽样为简单随机抽样. 用简单随机抽样从含有N个个体的
3、总体中抽取一个容量为n的样本时,每次抽取一个个体时,任 一个体被抽到的概率为丄;在整个抽样过程中各个个体被抽到的概率为-: NN 简单随机抽样的特点是:不放回抽样,逐个地实行抽取,各个个体被抽到的概率相等: 简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法: 抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的 号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,实行均匀搅拌,抽签时 每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本. 适用范困:总体的个体数不多. 优点:抽签法简便
4、易行,当总体的个体数不太多时适宜采用抽签法. 随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号:第二步,选泄开始的数字: 第三步,获取样本号码. 2. 系统抽样: 当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制左出的规则,从每一部分抽 取一个个体,得到需要的样本,这种抽样叫做系统抽样. 系统抽样的步骤: 采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的 准考证号、街道上各户的门牌号等等. N 为将整个的编号分段(即分成几个部分),要确左分段的间隔k当二是整数时(N为总体中的个体 n N N 的个数 n为样本容量),k =-:
5、当二不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的 n n N 个数N能被n整除,这时k = n 在第一段用简单随机抽样确定起始的个体编号/ 按照事先确宦的规则抽取样本(通常是将/加上间隔八 得到第2个编号/ + ,第3个编号l + 2k, 这样继续下去,直到获取整个样本). 要点诠释: 系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一 部分实行抽样时,采用的是简单随机抽样: 与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的 总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔:当总体中的个体 数不能被样本容量整除时
6、,可用简单随机抽样先从总体中剔除少疑个体,使剩下的个体数能被样本容量整 除再实行系统抽样. 3. 分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分, 然后按照各部分所占的比例实行抽样,这种抽样叫做分层抽样,所分成的部分叫做层. 4 常用的三种抽样方法的比较: 类别 共同点 不同点 联系 适用范围 简单随 机抽样 抽样过 程中每 个个体 被抽取 的槪率 相等 从总体中逐个抽取 是后两种方法的基础 总体个数较少 系统抽样 将总体均分成几部分,按事先确 泄的规则在各部分抽取 在起始部分抽样时用简 单随机抽样 总体个数较多 分层抽样 将总体分成几层,
7、分层实行抽取 各层抽样时采用简单随 机抽样或系统抽样 总体由差异明显 的几部分组成 5 不放回抽样和放回抽样: 在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样:如果每次抽岀个体 后再将它放回总体,称这样的抽样为放回抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样. 要点二:用样本估计总体 1. 统计图表包括条形图、折线图、饼图.茎叶图. 2. 刻画一组数据集中趋势的统计鱼有平均数、中位数、众数. 平均数:匚=心+ + 刻画一组数据离散水准的统讣量有极差、方差/、标准差9 方弄 $2 _(召-X)- + (氐XY + +(Xn X) n 3. 总体分布 (1)总体:在数
8、理统计中,通常把被研究的对象的全体叫做总体. (2)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数 和样本容量的比,就是该数据的频率.所有数拯(或数据组)的频率的分布变化规律叫做样本的频率分布.能 够用样本频率表、样本频率分布条形图或频率分布直方图来表示. (3)频率分布直方图中每个小矩形的宽度为(分组的宽度),小矩形的而积为相对应的频率髙为 (4)频率分布折线图:在频率分布直方图中,按照分组原则,再在左、右两边各加一个区间,从所加的 左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线称 为频率折线图. (5)总
9、体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是 实行了n次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布. (6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相对应各组取值的概 率.设想样本容疑无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线, 这条曲线叫做总体密度曲线. 要点诠释: 总体密度曲线反映了总体在各个范用内取值的百分比,它能给我们提供更加精细的信息,总体在某 一区间取值的百分比就是该区间与该曲线所成的曲边梯形的面积. 总体密度曲线一般的分布规律是中间高、两边低的“山帰“
10、形分布,总体的数据大致呈对称分布,并 且绝大部分数据都集中在靠近中间的区间内。 并非所有的总体都存有密度曲线,如一些离散型的总体不存有密度曲线。 (7)茎叶图 除了上而几种图表能协助我们理解样本数据外,统讣中还有一种被用来表示数据的图叫做茎叶图。它 是一种将样本数据有条理地列出来,从中观察样本分布情况的图。 茎是指中间的一列数,叶是从茎的旁边生长出来的数。 在样本数拯较少时,用茎叶图表示数据的效果较好,但当样本数据较多时,茎叶图就显得不太方便了。 4. 几种频率分布的优缺点及用频率分布估计总体分布 (1)几种表示频率分布的方法的优缺点 频率分布表在数量表示上比较确切,但不够直观、形象,分析数据
11、分布的总体态势不太方便。 直方图能够很容易地表示大量数据,非常直观地表示分布的形状,使我们能够看到在分布表中看不 淸楚的数据模式。但是从直方图本身得不出原始的数据内容,也就是说,把数据表示成宜方图后,原有的 具体数据信息就被抹掉了。 频率分布折线图的优点是它反映了数据的变化趋势。如果样本容量持续增大,分组的组距持续缩小, 那么折线图就趋向于总体分布的密度曲线。 用茎叶图刻画数据有两个优点:一是所有的信息都能够从这个茎叶图中得到:二是茎叶图便于记录 和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。 (2)用样本的频率分布估计总体的分布 用样本估计总体,是
12、研究统汁问题的一个基本思想放法,对于不易知道的总体分布,总是用样本的频 率分布对它实行估计。一般地,样本容量越大,估计就越精确。 要点三:变量的相关性 1. 散点图:将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之 间的散点图.散点图形象地反映了各对数据的密切水准粗略地看,散点分布具有一泄的规律. 如果变疑之间存有某种关系,这些点会有一个集中趋势,这种趋势通常能够用一条光滑的曲线来近似 表示,这样近似的过程称为曲线拟合. 2. 相关关系:当自变量一左时,因变量的取值带有一立的随机性的两个变量之间的关系称为相关关系. 3. 线性相关:若两个变量的散点图中,所有点看上
13、去都在一条直线附近波动,则称变量间是线性相关 的.若所有点看上去都在某条曲线(不是直线)附近波动,则称此相关为非线性相关的:如果所有的点在散 点图中没有任何关系,则称变量间是不相关的. 4. 相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系. 不同点:函数关系是一种确左的关系;而相关关系是一种非确泄关系:函数关系是自变量与因变量之 间的关系,这种关系是两个非随机变量的关系:而相关关系是非随机变量与随机变量的关系. 5. 回归分析:对具有相关关系的两个变量实行统计分析的方法叫做回归分析.通俗地讲,回归分析是 寻找相关关系中非确定性关系的某种确定性. 对于线性回归分析,我们要注意以下
14、几个方而: (1) 回归分析是对具有相关关系的两个变量实行统讣分析的方法.两个变量具有相关关系是回归分析的 前提. (2) 散点图是定义在具有相关关系的两个变疑基础上的,对于性质不明确的两组数据,可先作散点图, 在图上看它们有无关系,关系的密切水准,然后再实行相关回归分析. (3) 求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求岀的回归直线方程才有实际意义, 否则,求出的回归直线方程亳无意义. 6. 回归直线 设所求的直线方程为y=bx+a,英中a、b是待泄系数. S(忑一元)(X 一歹) 工兀x -nxy 相对应的直线叫做回归直线,对两个变屋所实行的上述统讣分析叫做回归分析. 【
15、典型例题】 类型一:随机抽样 例1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调 查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为:任丙地区中有 20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为.则完成、这 两项调查宜采用的抽样方法依次是() A分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法 C系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法 【变式1】甲校有3600名学生, 乙校有5400名学生,丙校有1800需学生,为统计三校学生某方面的 情况,计划采用分层抽样法, 抽取一
16、个样本容屋为90人的样本,应在这三校分别抽取学生( A.30 人,30 人,30 人 C.20 人,30 人,10 人 B.30 人,45 人,15 人 D.30 人,50 人,10 人 【变式2】一个总体中有100个个体,随机编号为0, 1, 2,.,99,依编号顺序平均分成10个小组, 组号依次为1, 2, 3,,10.现用系统抽样方法抽取一个容量为10的样本,规泄如果在第1组随机抽取 的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽 取的号码是 . 【变式3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了英中 一组
17、在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动 总人数的丄,且该组中,青年人占50%,中年人占40%,老年人占10%为了了解各组不同的年龄层次的 4 职工对本次活动的满意水准,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本. 试确左 (I)游泳组中,青年人、中年人、老年人分别所占的比例; 环数 5 6 9 频数 3 1 1 环数 4 5 6 7 8 频数 1 1 1 1 1 成绩的统汁表如 两个人这次比赛 中的成 甲表: (II)游泳组中,青年人、中年人、老年人分别应抽取的人数. 类型二:用样本估计总体 例2.甲、乙两人在
18、一次射击比赛中各射靶5次.两人 甲表、乙表所示,请根据你所学统计知识,进一步判断这 绩情况. 乙表: 举一反三: 【变式1某人5次上班途中所花的时间(单位:分钟)分别为忑”10.11,9。已知这组数据的平均 数是10,方差为2,贝ijlx-yl的值为() A. 1 B2 C3 D4 例3.对某电子元件实行寿命追踪调查,情况如下: 寿命(h) 100200 200300 300400 400500 500600 个数 2() 3() 80 4() 30 (1)列出频率分布表: (2)画出频率分布直方图和累积频率分布图: (3)估计电子元件寿命在100400h以内的概率: (4)估计电子元件寿命在
19、4001】以上的概率. 举一反三: 【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁一 1 8岁的 男生体重(kg),得到频率分布直方图如下: 【变式2】某班学生在一次数学考试中成绩分布如下表: 分数段 0, 80) 80, 90) 90, 100) 人数 2 5 6 分数段 100, 110) 110, 120 120, 130) 人数 12 6 分数段 130, 140) 140, 150) 人数 4 2 那么分数在100, 110)中的频率和分数不满110分的累积频率分别是、(精确到0.01). 变式3】为检测某种产品的质崑 抽取了一个容量为30的样本
20、,检测结果为一级品5件,二级品8件, 三级品为13件,次品4件 (1)列出样本频率分布表: (2)画出表示样本频率分布的条形图; (3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76908486818786828583 乙组 82848589798091897974 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些? 举一反三: 【变式1】甲、乙两位歌手在“中国好声音选拔赛中.5位评委评分情况如茎叶图所示,记甲、乙两人 的平均得分分别为忑、 心,则下列判断准确的是( 甲 乙 6 1 7 5 8 8 8 6 8 4 0 9 3 A.心V七,甲比乙成绩稳宦 Bqvx二,乙比甲成绩稳宦 C. Affl X- f甲比乙成绩稳泄 DXa X- 乙比甲成绩稳立 类型三:变量的相关性和回归分析 例5某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据: 广告支出x(单位:万元) 1 2 3 4 销售收入y (单位:万元) 12 28 42 56 (1)画出表中数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 用户隐秘保护与利用的承诺书7篇范文
- 业务拓展市场分析报告模板
- 员工绩效考核指标模板量化评价
- 航运物流常识题库及答案
- 产品研发阶段质量控制承诺书3篇范文
- 环境治理目标落实责任承诺书8篇
- 2025年农业科技行业现代化种植与绿色生产研究报告及未来发展趋势预测
- 2025年物流行业智能物流应用案例研究报告及未来发展趋势预测
- 2025年旅游行业旅游数字化与旅游体验创新研究报告及未来发展趋势预测
- 医药从业资格证考试及答案解析
- 2025年新修订治安管理处罚法课件
- 2025年度《危险化学品生产企业事故隐患内部报告奖励管理制度》范本+附表
- 医学专业资格认证证明书(5篇)
- 小麦种植技术课件
- 中医适宜技术适应症课件
- 就餐安全课件
- 小区营销的成功案例与经验分享
- 国民经济行业分类代码(2024年版)
- 影视制作行业编剧经验证明书(8篇)
- 身体调养协议书模板
- 儿童舌诊课件
评论
0/150
提交评论