17统计的基本概念-解析_第1页
17统计的基本概念-解析_第2页
17统计的基本概念-解析_第3页
17统计的基本概念-解析_第4页
17统计的基本概念-解析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第17讲统计的基本概念一、抽签法、随机数法①抽签法:把总体中的N个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取n次,使与号签上的编号对应的个体进入样本,就得到一个容量为n的样本.②随机数法1、用随机试验生成随机数2、用信息技术生成随机数:①用计算器生成随机数;②用电子表格软件生成随机数;③用R统计软件生成随机数.二、分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.三、获取数据的途径获取数据的基本途径有通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.四、众数、中位数、平均数①众数:一组数据中出现次数最多的数.②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.③平均数:如果n个数x1,x2,…,xn,那么x=1n五、方差、标准差①假设一组数据为x1,x2,…,xn,则这组数据的平均数x=②若假设一组数据为x1,x2,…,xn,它的平均数为,方差为,③标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【例题1】1、某总体由编号为01,02,03,⋯⋯,19,20的20个个体组成,利用下列随机数表选出5个个体,选法是下列表中第一行第5列开始从左到右依次选2个数字,选出的第5个个体编号为(

)18180792454417165809798386196216765003105523640505266238A.16 B.09 C.19 D.61【解题思路】根据随机数表,依次进行选择即可得出结果.【解答过程】选取方法是从随机数表第1行的第5列数字开始,从左到右依次选取2两个数字,则选出来的5个个体编号分别为∶07,17,16,09,19所以选出来的第5个个体编号为19.故选:C.2、某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.253 D.007【答案】A【分析】根据随机数表法依次读数即可.【详解】解:从第5行第6列开始向又读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,第五个是328,第六个是623.故选:A.【练习】1、要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号:________.注:下面抽取了随机数表第1行至第5行.0347437386369647366146986371623326168045601114109597742467624281145720425332373227073607512451798973167662276656502671073290797853135538585988975414101256859926969668273105037293155712101421882649817655595635643854824622316243099006184432532383013030【答案】227,665,650,267.【分析】找到第3行第6列的数2,每3个数组成一个数字,如果数字在001至850之间(包含001和850),即符合要求,从而找到前4个符合要求的数字即可.【详解】从随机数表第3行第6列的数2开始向右读第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,均符合题意.故答案为:227,665,650,267.2、从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按,,…,进行编号,然后从随机数表第行的第列和第列数字开始从左往右依次选取两个数字,则选出的第个同学的编号为(注:表为随机数表的第行与第行)(

)A. B. C. D.【答案】A【分析】从第一行第5列,两个两个数字取数,前面出现过的或者大于60的剔除,剩下的依次排列即得.【详解】按题意,从第一行第5列,两个两个数字取数,抽样编号依次为43,36,47,46,24,第5个是24,故选:A3、某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号001,002,……,699,700,从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第8个样本编号是(

)3321183429

7864560732

5242064438

1223435677

35789056428442125331

3457860732

2530073285

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.368 C.253 D.072【答案】B【分析】根据给定条件,利用随机数表法按要求每3个数为一个编号,不在编号范围内或重复的排除掉,读数即可.【详解】从表中第5行第6列开始向右读取数据,得到的前8个编号分别是:253,313,457,860(舍),732(舍),253(舍),007,328,523,457(舍),889(舍),072,368,则得到的第8个样本编号是368.故选:B.【例题2】1、现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈;③某中学有高中生3500人,初中生1500人,为了解学生的学习情况,拟抽取一个容量为200的样本.较为合理的抽样方法分别是(

)A.①简单随机抽样,②分层抽样,③系统抽样B.①简单随机抽样,②系统抽样,③分层抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样【解题思路】根据简单随机抽样、系统抽样、分层抽样的定义和特点,以及适用范围,判断即可.【解答过程】对于①,总体中的个体数较少,宜用简单随机抽样;对于②,总体中的个体数较多,而且容易分成均衡的若干部分,要选32名听众而刚好有32排,每排选一人,宜用系统抽样;对于③,总体中的个体数较多,又是由差异明显的两部分组成,宜用分层抽样.故选:B.2、“太空教师”的神舟十三号航天员翟志刚、王亚平、叶光富出现在画面中,“天宫课堂”第一课在中国空间站正式开讲.此次太空授课通过为同学们呈现多种精彩的实验和现象,激发了同学们的好奇心,促使他们去观察这些现象,进而去思考、去探索,把科学思维的种子种进心里.某校为了解同学们对“天宫课堂”这种授课模式的兴趣,决定利用分层抽样的方法从高二、高三学生中选取90人进行调查,已知该校高二年级学生有1200人,高三年级学生有1500人,则抽取的学生中,高三年级有(

)A.20人 B.30人 C.40人 D.50人【答案】D【分析】根据题意求得抽样比,再结合高三年级的总人数,即可求得结果.【详解】由题意可知该校高二年级学生有1200人,高三年级学生有1500人,则高二年级与高三年级的学生人数比为4:5,故选:D.【练习】1、下列抽样方法是简单随机抽样的是(

)A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查【答案】B【分析】根据简单随机抽样的特点逐项判断可得答案.【详解】对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.2、【多选】某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是(

)A.应采用分层随机抽样抽取 B.应采用抽签法抽取C.三种型号的轿车依次应抽取9辆、36辆、12辆 D.这三种型号的轿车,每一辆被抽到的可能性相同【答案】ACD【分析】根据分层抽样的概念及计算方法,逐项判定,即可求解.【详解】因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,所以A正确;个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有代表性,所以B错误;分层随机抽样中,每一个个体被抽到的可能性相同,故选项D正确.故选:ACD.3、我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有(

)人.”A.200 B.100 C.120 D.140【答案】C【分析】根据分层抽样的定义结合题意列方程求解即可【详解】设北面共有人,则由题意可得所以北面共有120人,故选:C【例题3】【答案】BC【分析】根据总体、个体、样本、样本容量的概念,可以判断BC正确.故选:BC.2、为了估计某自然保护区中天鹅的数量,可以使用以下方法:先从该保护区中捕出一定数量的天鹅,例如200只,给每只天鹅做上记号,不影响其存活,然后放回保护区,经过适当的时间,让其和保护区中其余的天鹅充分混合;再从保护区中捕出一定数量的天鹅,例如150只,查看其中有记号的天鹅,设有20只.根据上述数据,估计该自然保护区中天鹅的数量为(

)A.4000 B.3000 C.1500 D.750【答案】C【分析】根据简单随机抽样估计总体,列出方程即可得解.故选:C【练习】1、有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是(

)A.总体是36个篮球 B.样本是4个篮球C.样本容量是4 D.每个篮球被抽到的可能性不同【答案】D【分析】利用样本、样本容量、总体的意义,逐项分析判断作答.【详解】依题意,总体是36个篮球,样本是4个篮球,样本容量是4,选项A,B,C都正确;故选:D2、中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022年2月4日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为(

)A.23 B.92 C.128 D.180【答案】B【分析】先计算100名学生中能说出一句或一句也说不出的人数,根据抽样比例计算即可故选:B3、管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是(

)A.2800 B.1800 C.1400 D.1200【答案】C【分析】由从池塘内捞出70条鱼,其中有标记的有2条,可得所有池塘中有标记的鱼的概率,结合池塘内具有标记的鱼一共有40条鱼,按照比例即得解.【详解】设估计该池塘内鱼的总条数为,由题意,得从池塘内捞出70条鱼,其中有标记的有2条,又因为池塘内具有标记的鱼一共有40条鱼,故选:C.【例题4】1、某企业在举行的安全知识竞答活动中,随机抽取了30名员工,统计了他们的测试成绩(单位:分),并得到如图所示的统计图,设这30名员工的测试成绩的中位数为m,众数为n,平均数为,则(

)【答案】D【分析】根据统计图,以及平均数、众数、中位数的定义来计算m、n、的值即可比较大小,得出答案.【详解】由统计图可知,测试成绩按从高到低的顺序排好后,中间的两个测试成绩为80分,90分,2、已知某4个数据的平均数为6,方差为3,现又加入一个数据6,此时这5个数据的方差为(

)A.245 B.165 C.145【解题思路】根据方差的定义运算化简即可得解.【解答过程】因为4个数据的平均数为6,方差为3,所以14i=14xi故i=14加入一个数据6后,5个数的平均数还是6,则方差为15即这5个数据的方差为125故选:D.【练习】1、某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x,s2,新平均分和新方差分别为x1,s12,若此同学的得分恰好为A.x=x1,s2=C.x=x1,s2>【解题思路】利用平均数和方差的公式即可求解.【解答过程】设这个班有n个同学,分数分别是a1,a2,a3第i个同学的成绩ai第一次计算时,总分是(n−1)x方差s2第二次计算时,x1方差s1故s2故选:C.2、已知某样本的容量为100,平均数为80,方差为95,现发现在收集这些数据时,其中的两个数据记录有误,一个错将90记录为70,另一个错将80记录为100.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则(

)【答案】A【分析】根据平均数和方差公式即可求解.故选:A.3、已知某区甲、乙、丙三所学科基地学校的数学强基小组人数分别为24,8,16人,在一次统一考试中,该区三所学校强基学生的平均分分别为118,120,114,方差分别为15,12,21,则该区所有数学强基学生成绩的平均数______,方差S2=______.【答案】

117

21.5【分析】根据总体均值与总体方差的计算公式求解即可.故答案为:117;21.5.【例题5】A.两组样本数据的样本平均数相同 B.两组样本数据的样本众数不同C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同【答案】AB【分析】根据平均数和标准差的性质以及众数和极差的概念可得答案.【详解】设样本数据,,,…,的样本平均数为,样本众数为,样本标准差为,根据极差的概念可知两组样本数据的样本极差相同.所以两组样本数据的标准差和极差相同,平均数和众数不同.故选:ABA. B. C. D.【答案】A【分析】根据方差的性质计算可得.故选:A【练习】A.这两组数据的平均数相同 B.这两组数据的中位数相同C.这两组数据的极差相同 D.这两组数据的标准差相同【答案】AC对于C选项,数据不全相等时,既不是最大值也不是最小值,极差不变,所以C选项正确;故选:AC.A.12,10 B.12,4 C.10,4 D.10,18【答案】D【分析】根据平均数和方差公式结合题意求解即可.故选:D【答案】1故答案为:1课堂检测1、某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是(

)32

21

18

34

29

78

64

54

07

32

52

42

06

44

38

12

23

43

56

77

35

7884

42

12

53

31

34

57

86

07

36

25

30

07

32

86

23

45

78

89

07

23

6832

56

78

08

43

67

89

53

55

77

34

89

94

83

75

22

53

55

78

32

45

77A.328 B.253 C.007 D.860【答案】A【分析】按照随机数表提供的数据,三位一组的读数,并取001到400内的数,重复的只取一次,读取到第4个即可.【详解】从第5行第6列开始向右读取数据,分别为:253(第1个),313(第2个),457(不在范围内,不符合要求),860(不在范围内,不符合要求),736(不在范围内,不符合要求),253(重复,不符合要求),007(第3个),328(第4个),故选:A.2、为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是(

)A.按性别分层随机抽样 B.按学段分层随机抽样C.抽签法 D.随机数表法【答案】B【分析】由分层抽样的概念即可判断;【详解】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在较大差异,故应按照学段分层随机抽样.故选:B.3、某学校高二年级选择“物化生”,“物化地”和“史地政”组合的同学人数分别为240,90和120.现采用分层抽样的方法选出30位同学进行某项调查研究,则“史地政”组合中选出的同学人数为(

)A.8 B.12 C.16 D.6【答案】A【分析】根据分层抽样的定义列出式子,进行求解.故选:A4、为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是(

)A.总体是指这1000袋方便面 B.个体是1袋方便面C.样本是按抽取的20袋方便面 D.样本容量为20【答案】D【分析】根据总体,个体,样本,样本的定义逐一判断即可得解.【详解】对于A,总体是指这1000袋方便面的质量,故A错误;对于B,个体是指1袋方便面的质量,故B错误;对于C,样本是指按照抽取的20袋方便面的质量,故C错误;故选:D.5、现有一个容量为50的样本,其数据的频数分布表如下表所示:组号12345频数811109则第4组的频数和频率分别是(

)A.12,0.06 B.12,0.24 C.18,0.09 D.18,0.36【答案】B【分析】根据表格中数据,先计算出频数,再计算频率.故选:B【答案】D【详解】因为数据、、…、的平均数是4,方差是4,故选:D.A.9,5 B.6,5 C.9,4 D.6,4【答案】C【分析】根据均值和方差公式计算数据的数字特征,或者根据均值和方差的性质计算.故选:C.【答案】ACD故选:ACD.9、已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为.【分析】设丢失的数据为,对的取值进行分类讨论,求出这七个数的平均数、众数和中位数,根据题意可得出关于的方程,解之即可.因为这组数据的平均数与众数的和是中位数的倍,分以下几种情况讨论:10、为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为12的样本,并算得样本的平均数为5,方差为9.84;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为15.64.已知甲、乙两同学抽取的样本合在一起组成一个容量为20的样本,则合在一起后的样本方差为.【答案】12.4【分析】由分层抽样的方差公式求解.故答案为:课后作业0347,4373,8636,9647,3661,4698,6371,62029774,2467,6242,8114,5720,4253,3237,32141676,0227,6656,5026,7107,3290,7978,5336若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是(

)A.37 B.32 C.14 D.16【答案】D【分析】根据随机数表法的应用,按照已知的要求选出五个三个数字组成编号即可.【详解】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.故选:D2、中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷3318石,抽样取谷一把,数得168粒内有秕谷22粒,则粮仓内的秕谷约为(

)A.321石 B.166石 C.434石 D.623石【答案】C【分析】根据给定条件,利用样本的数字特征估计总体的相应特征作答.所以粮仓内的秕谷约为434石.故选:C3、某校高一年级有810名学生,现用比例分配的分层随机抽样方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为40,32,则该校高一年级的女生人数为(

).A.450 B.360 C.400 D.320【答案】B【分析】根据分层抽样定义计算即可.故选:B.4、高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是(

)A.100名学生是个体B.样本容量是100C.每名学生的成绩是所抽取的一个样本D.1000名学生是样本【答案】B【分析】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,再结合题中选项即可得到答案.【详解】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,根据选项可得选项A、D表达的对象都是学生,而不是成绩,所以A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论