版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计、成对数据的统计分析第九章第1节随机抽样、统计图表[课程标准要求]1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的样本均值和样本方差.3.理解统计图表的含义.积累·必备知识01回顾教材,夯实四基放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中
抽取n(1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都
,把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内
的各个个体被抽到的概率都相等,把这样的抽样方法叫做不放回简单随机抽样1.简单随机抽样(1)简单随机抽样的概念逐个相等未进入样本(2)实现简单随机抽样的方法常有抽签法(适用于总体中个体数不多的情形)、随机数法(适用于个体数较多的情况).2.分层随机抽样(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行
抽样,再把所有子总体中抽取的样本
作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.简单随机合在一起(2)分层随机抽样的应用范围:当总体是由
的几个部分组成时,往往选用分层随机抽样.(3)比例分配的分层随机抽样所获得样本的均值与方差:利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,差异明显分层随机抽样中,每层抽取的个体的比例是相同的.3.统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势4.频率分布直方图的制作步骤(1)求极差:极差为一组数据中
与最小值的差.(2)决定组距与组数:当样本量不超过100时,常分成
组,一般取等长组距,并且组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列,即分组、
、频数、
.其中频数合计应是样本量,频率合计是
.(5)画频率分布直方图:横轴表示样本数据,纵轴表示.最大值5~12频数累计频率11.对于简单随机抽样和分层随机抽样,不论哪种抽样方法,总体中的每一个个体被抽到的概率是相等的.2.频率分布直方图中,小长方形的高=;小长方形的面积=组距×=频率;各个小长方形的面积的总和等于1.1.思考辨析(在括号内打“√”或“×”).(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.(
)(2)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.(
)(3)分层抽样中,不含简单随机抽样.(
)(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.(
)×××√2.下列情况中,适合用全面调查的是(
)A.检查某人血液中的血脂含量B.调查某地区的空气质量状况C.乘客上飞机前的安检D.调查某市市民对垃圾分类处理的意识√解析:C选项乘客上飞机前的安检适合用全面调查,只有确认每一位乘客所携带的物品都安全才能保证航空安全,A,B,D选项都适合抽样调查.故选C.3.在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取容量为20的一个样本,则每个个体被抽到的概率为(
)√解析:每个个体被抽取到的概率是.故选D.4.(多选题)某学生社团有男生32名,女生24名,从中随机抽取一个容量为7的样本,某次抽样结果为:抽到3名男生和4名女生,则下列说法正确的是(
)A.这次抽样可能采用的是抽签法B.这次抽样不可能是按性别分层随机抽样C.这次抽样中,每个男生被抽到的概率一定小于每个女生被抽到的概率D.这次抽样中,每个男生被抽到的概率不可能等于每个女生被抽到的概率√√解析:根据抽样结果,此次抽样可能采用的是抽签法,A正确;若按性别分层抽样,则抽得的男、女生人数应分别为4,3,所以这次抽样不可能是按性别分层随机抽样,B正确;若用抽签法,则每个男生被抽到的概率和每个女生被抽到的概率均相等,C,D错误.故选AB.5.如图是100名居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有
人.25解析:由频率分布直方图可知,月均用水量在[2,2.5)范围内的居民所占频率为0.50×0.5=0.25,所以月均用水量在[2,2.5)范围内的居民人数为100×0.25=25.02提升·关键能力类分考点,落实四翼考点一简单随机抽样[例1](1)下列抽取样本的方式属于简单随机抽样的个数为(
)①从无限多个个体中抽取100个个体作为样本;②从20件玩具中逐个抽取3件进行质量检验;③某班有56名学生,指定个子最高的5名学生参加学校组织的篮球赛;④盒子中共有80个零件,采用抽签法从中选出5个零件作为样本.A.0B.1C.2D.3√解析:(1)①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;③某班有56名学生,指定个子最高的5名学生参加学校组织的篮球赛,不满足随机抽取;根据简单随机抽样的概念可知②④正确.故选C.√(2)利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若抽完第一个个体后,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为(
)解析:(2)由题意可得,故n=37,所以每个个体被抽到的概率为.故选D.简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是等可能抽取.[针对训练](1)下列抽样中适合用抽签法的是(
)A.从某厂生产的3000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱50件)产品中抽取6件进行质量检验D.从某厂生产的3000件产品中抽取10件进行质量检验
√解析:(1)对于选项A,D,由于总体的个体数较多,不适合用抽签法,故选项A,D错误;对于选项C,由于甲、乙两厂生产的产品质量可能差别较大,也不适合用抽签法,故选项C错误;对于选项B,总体容量和样本容量都较小,适合用抽签法,故选项B正确.故选B.(2)假设要抽查某企业生产的某种品牌的袋装牛奶的质量是否达标,现从850袋牛奶中抽取50袋进行检验.利用随机数表抽取样本时,先将850袋牛奶按001,002,…,850进行编号,如果从随机数表第3行第1组数开始右读,最先读到的4袋牛奶的编号是614,593,379,242,请你以此方式继续向右读数,随后读出的4袋牛奶的编号是
,
,
,
.(下面摘取了随机数表第1行至第5行)第1行78226
85384
40527
48987
60602
16085
29971
61279第2行43021
92980
27768
26916
27783
84572
78483
39820第3行61459
39073
79242
20372
21048
87088
34600
74636第4行63171
58247
12907
50303
28814
40422
97895
61421第5行42372
53183
51546
90385
12120
64042
51320
22983203722104088解析:(2)最先读到的4袋牛奶的编号是614,593,379,242,向右读得到203,722,104,再下一个数是887,887大于850,故舍去,再下一个数是088.考点二分层随机抽样角度一比例分配的分层随机抽样[例2](1)某校为了解学生学习数学的情况,采用分层抽样的方法从高一年级600人、高二年级680人、高三年级720人中,抽取50人进行问卷调查,则高一、高二、高三年级抽取的人数分别是(
)A.15,16,19 B.15,17,18C.14,17,19 D.14,16,20√(2)(2024·河北秦皇岛模拟)为实现乡村生态振兴,走乡村绿色发展之路,乡政府采用按比例分配的分层抽样的方式从甲村和乙村抽取部分村民参与环保调研,已知甲村和乙村人数之比是3∶1,被抽到的参与环保调研的村民中,甲村的人数比乙村多8人,则参与调研的总人数是(
)A.16B.24C.32D.40√解析:(2)设被抽取参与调研的乙村村民有x人,则根据按两村人口比例分层抽样,甲村被抽取参与调研的有3x人,所以3x-x=8,即x=4,所以参与调研的总人数x+3x=16.故选A.角度二分层随机抽样的样本均值与方差[例3](1)(2024·陕西咸阳模拟)某学校团委举办了党史知识竞赛(满分100分),其中高一、高二、高三年级参赛选手的人数分别为1200,900,900.现用分层抽样的方法从三个年级中抽取样本,经计算可得高一、高二年级参赛选手成绩的样本平均数分别为85,90,全校参赛选手成绩的样本平均数为88,则高三年级参赛选手成绩的样本平均数为(
)A.87B.89C.90D.91√解析:(1)由分层抽样定义可知,高一,高二,高三年级参赛选手的样本数之比为1200∶900∶900=4∶3∶3,设高三年级参赛选手成绩的样本平均数为x,则,解得x=90,故高三年级参赛选手成绩的样本平均数为90.故选C.(2)(2024·广东广州模拟)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照分层抽样的方法从两个班共抽取10名学生,相关统计情况如下:高三(1)班抽取的学生答对题目的平均数为1,方差为1;高三(2)班抽取的学生答对题目的平均数为1.5,方差为0.35,则这10人答对题目的方差为(
)A.0.61B.0.675C.0.74D.0.8√分层抽样中有关计算的方法(1)在分层随机抽样中,抽样比
.根据这个抽样比,可以直接求出各层抽取的样本数,也可以据此列方程求解有关未知量.(2)已知分层随机抽样各层的均值和方差,可以直接根据公式计算总的均值和方差,这两个公式的结构也体现了按比例分配.[针对训练](1)(角度一)(2024·江苏宿迁模拟)某大学共有本科生5000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级学生的人数为(
)A.80B.60C.40D.20√解析:(1)三年级要抽取的学生人数是200=40.故选C.(2)(角度一)(多选题)某公司生产甲、乙、丙三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,公司质检部门用按比例分配的分层随机抽样的方法抽取46辆进行检验,则(
)A.在每一种型号的轿车中可采用抽签法抽取B.抽样比为C.三种型号的轿车依次抽取6辆、30辆、10辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的√√√解析:(2)因每一种型号的轿车数量较多,不适合用抽签法,故A错误;在按比例分配的分层随机抽样中,抽样比为,故B正确;在按比例分配的分层随机抽样中,三种型号的轿车应依次抽取6辆、30辆、10辆,故C正确;在按比例分配的分层随机抽样中,每一辆被抽到的概率是相等的,故D正确.故选BCD.(3)(角度二)某实验室有A,B,C三批种子,A组有30粒,发芽率为30%,B组有35粒,发芽率为60%,C组有35粒,发芽率为40%,则该实验室这三批种子的发芽率为
.解析:(3)这三批种子的发芽率为44%(4)(角度二)某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为
,方差为
.9.71.51解析:(4)根据两条生产线的产量比为7∶3,且新生产线产品质量指标的均值为10,方差为1,旧生产线产品质量指标的均值为9,方差考点三统计图表角度一扇形图、条形图[例4](多选题)(2024·广东深圳模拟)某学校组建了演讲、舞蹈、航模、合唱、机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委在全校学生中随机选取一部分学生(这部分学生人数少于全校学生人数)进行调查,并将调查结果绘制成了如下两个不完整的统计图,则(
)A.选取的这部分学生的总人数为500B.合唱社团的人数占样本总量的40%C.选取的学生中参加机器人社团的人数为78D.选取的学生中参加合唱社团的人数比参加机器人社团的人数多125√√√解析:由两个统计图表可得参加演讲的人数为50,占选取的学生总数的10%,所以选取的总人数为50÷10%=500,故选项A正确;合唱社团的人数为200,则合唱社团的人数占样本总量的×100%=40%,故选项B正确;选取的学生中参加机器人社团的人数占样本总量的1-40%-20%-10%-15%=15%,所以选取的学生中参加机器人社团的人数为500×15%=75,故选项C不正确;选取的学生中参加合唱社团的人数为200,参加机器人社团人数为75,所以选取的学生中参加合唱社团的人数比参加机器人社团的人数多125,选项D正确.故选ABD.角度二折线图[例5](2024·福建福州模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是(
)A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三增加了1倍以上C.这一星期内甲的日步数的平均值大于乙D.这一星期内甲的日步数的方差大于乙√解析:对于A,甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确.对于B,乙的星期三步数7030,星期四步数12970.因为所以没有增加1倍以上,故B不正确.角度三频率分布直方图[例6](2024·天津武清区模拟)某校对高三年级学生的数学成绩进行统计分析.全年级同学的成绩全部介于80分与150分之间,将他们的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后得到的频率分布直方图如图所示.现从全体学生中根据成绩采用分层抽样的方法抽取80名学生的试卷进行分析,则从成绩在[120,130)内的学生中抽取的人数为(
)A.28B.36C.20D.24√解析:成绩在[120,130)内的频率为1-(0.005+0.010+0.010+0.015+0.025+0.005)×10=0.3.因为从全体学生中根据成绩采用分层抽样的方法抽取80名学生的试卷进行分析,则从成绩在[120,130)内的学生中抽取的人数为80×0.3=24.故选D.(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据变化的趋势.(3)频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.[针对训练](1)(角度一)(多选题)(2024·湖南校联考)某统计机构对1000名拥有汽车的人进行了调查,对得到的数据进行整理并制作了如图所示的统计图表,下列关于样本的说法错误的是(
)A.30岁以上人群拥有汽车的人数为720B.40~45岁之间的人群拥有汽车的人数最多C.55岁以上人群每年购买车险的总费用最少D.40~55岁之间的人群每年购买车险的总费用,比18~30岁和55岁以上人群购买车险的总费用之和还要多√√√解析:(1)对于A,由1000×(1-18%)=820,知30岁以上人群拥有汽车的人数为820,故A错误;对于B,图表当中并没有40~45岁的拥有汽车的人群比例,所以由图得不出40~45岁之间的人群拥有汽车的人数最多,故B错误;对于C,55岁以上人群每年购买车险的总费用为1000×17%×3100=527000(元),18~30岁之间的人群每年购买车险的总费用为1000×18%×2800=504000(元),故C错误;对于D,40~55岁之间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年国核电力规划设计研究院有限公司招聘备考题库及一套完整答案详解
- 2026年中国科学院福建物质结构研究所结构化学全国重点实验室招聘5人备考题库及参考答案详解1套
- 2026年中共佛山市顺德区委组织部佛山市顺德区国有资产监督管理局招聘备考题库及参考答案详解一套
- 2026年中国科学院高能物理研究所财务会计岗招聘备考题库及参考答案详解1套
- 2026年中国科学院广州地球化学研究所科研助理招聘备考题库(高温高压实验学科组)带答案详解
- 2026年中科院建筑设计研究院有限公司招聘备考题库及完整答案详解1套
- 2026年四川长虹民生物流股份有限公司关于招聘安全及综合事务经理岗位的备考题库及答案详解一套
- 护理课程课件下载
- 休克护理的挑战与解决方案
- 2026春招:品牌专员题目及答案
- 云南省昭通市2024-2025学年七年级上学期期末历史试题(含答案)
- 2025年度解除房屋租赁合同后的产权交接及费用结算通知
- 教育机构财务管理制度及报销流程指南
- 2023-2024学年北京市海淀区八年级上学期期末考试物理试卷含详解
- 四川省绵阳市2024-2025学年高一上学期期末地理试题( 含答案)
- 2024版房屋市政工程生产安全重大事故隐患判定标准内容解读
- 医院培训课件:《黄帝内针临床运用》
- GB 21258-2024燃煤发电机组单位产品能源消耗限额
- 非ST段抬高型急性冠脉综合征诊断和治疗指南(2024)解读
- 广东省民间信仰活动场所登记编号证样式和填写说明
- JB∕T 13026-2017 热处理用油基淬火介质
评论
0/150
提交评论