版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章 统计统计 单元复习单元复习知识结构知识结构t57301p2统计统计用样本估计总体用样本估计总体随机抽样随机抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样变量间的相关关系变量间的相关关系用样本的频率用样本的频率布估计总体分布布估计总体分布用样本的数字特征用样本的数字特征估计总体数字特征估计总体数字特征线性回归分析线性回归分析一一 随机抽样随机抽样1. 1. 简单随机抽样简单随机抽样(1 1)概念:)概念:设一个总体有设一个总体有N N个个体,个个体, 从从中中逐个不放回逐个不放回地抽取地抽取n n个个体作为样本,个个体作为样本, 如果每次抽取时总体内的各个个体被抽如果
2、每次抽取时总体内的各个个体被抽到的机会都相等到的机会都相等, , 则这种抽样方法叫做则这种抽样方法叫做简单随机抽样简单随机抽样. .抽签法:抽签法:第一步,将总体中的所有个体编号,并第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上把号码写在形状、大小相同的号签上. .第二步,将号签放在一个容器中,并搅第二步,将号签放在一个容器中,并搅拌均匀拌均匀. .第三步,每次从中抽取一个号签,连续第三步,每次从中抽取一个号签,连续抽取抽取n n次,就得到一个容量为次,就得到一个容量为n n的样本的样本. .(2 2)步骤:)步骤:随机数表法:随机数表法:第一步,将总体中的所有个体编号第一
3、步,将总体中的所有个体编号. .第二步,在随机数表中任选一个数作为第二步,在随机数表中任选一个数作为起始数起始数. .第三步,从选定的数开始依次向右(向第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取数取出,编号范围外的数去掉,直到取满满n n个号码为止,就得到一个容量为个号码为止,就得到一个容量为n n的的样本样本. .2. 2. 系统抽样系统抽样(1 1)概念:)概念:将总体分成均衡的将总体分成均衡的n n个部分,再个部分,再按照预先定出的规则,从每一部分中抽取按照预先定出的规则,从每一部分中抽取1 1
4、个个个体,即得到容量为个体,即得到容量为n n的样本的样本. .(2 2)步骤:)步骤:第一步,将总体的第一步,将总体的N N个个体编号个个体编号. .第二步,确定分段间隔第二步,确定分段间隔k k,对编号进行分段,对编号进行分段. .第三步,在第第三步,在第1 1段用简单随机抽样确定起始个段用简单随机抽样确定起始个体编号体编号. .第四步,按照一定的规则抽取样本第四步,按照一定的规则抽取样本. .3.3. 分层抽样分层抽样(1 1)概念:)概念:若总体由差异明显的几部分组成,抽若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一样时,先将总体分成互不交叉的层,然后按照一
5、定的比例,从各层独立地抽取一定数量的个体,定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本再将各层取出的个体合在一起作为样本. .(2 2)步骤:)步骤:第一步,计算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比. .第二步,将总体分成互不交叉的层,按比例确定第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数各层要抽取的个体数. .第三步,用简单随机抽样或系统抽样在各层中抽第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体取相应数量的个体. .第四步,将各层抽取的个体合在一起,就得到所第四步,将各层抽取的个体合在一起,就得到所取样
6、本取样本. . 方法方法 类别类别 共同共同 特点特点抽样特征抽样特征相互联系相互联系适应范围适应范围简单随简单随机抽样机抽样系统系统抽样抽样分层分层抽样抽样抽样过抽样过程中每程中每个个体个个体被抽取被抽取的概率的概率相等相等将总体分成将总体分成均衡几部分,均衡几部分,按规则关联按规则关联抽取抽取将总体分将总体分成几层,成几层,按比例分按比例分层抽取层抽取用简单随用简单随机抽样抽机抽样抽取起始号取起始号码码总体中总体中的个体的个体数较少数较少总体中总体中的个体的个体数较多数较多总体由总体由差异明差异明显的几显的几部分组部分组成成从总体中从总体中逐个不放逐个不放回抽取回抽取用简单随用简单随机抽样
7、或机抽样或系统抽样系统抽样对各层抽对各层抽样样二、用样本估计总体二、用样本估计总体频率分布频率分布数字特征数字特征频率分布表频率分布表频率分布直方图频率分布直方图频率分布折线图频率分布折线图总体密度曲线总体密度曲线茎叶图茎叶图众数、中位数众数、中位数平均数平均数标准差、方差标准差、方差4. 4. 频率分布表频率分布表(1 1)含义:)含义:表示样本数据分布规律的表表示样本数据分布规律的表格格. .(2 2)作法:)作法:第一步,求极差第一步,求极差. .第二步,决定组距与组数第二步,决定组距与组数. .第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制
8、成表第四步,统计频数,计算频率,制成表格格. .5. 5. 频率分布直方图频率分布直方图(1 1)含义:)含义:表示样本数据分布规律的图表示样本数据分布规律的图形形. .(2 2)作法:)作法:第一步,画平面直角坐标系第一步,画平面直角坐标系. .第二步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与组第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长距的商为高,分别画出各组对应的小长方形方形. .6. 6. 频率分布折线图频率分布折线图 在频率分布直方图中,依次连接各在频率分布直方图
9、中,依次连接各小长方形上端中点得到的一条折线,称小长方形上端中点得到的一条折线,称为频率分布折线图为频率分布折线图. .7. 7. 总体密度曲线总体密度曲线 当总体中的个体数很多时,随着样当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线曲线为总体密度曲线. .频率分布表频率分布表频率分布直方图频率分布直方图频率分布折线图频率分布折线图连接各小长方连接各小长方形上端的中点形上端的中点总体密度曲线
10、总体密度曲线样本容量不断增大,频率折样本容量不断增大,频率折线图接近于一条光滑曲线线图接近于一条光滑曲线8. 8. 茎叶图茎叶图作法:作法:第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)(高位)和和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最大的茎之间的第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)数按大小次序排成一列,写在左(右)侧;侧;第三步,将各个数据的叶按大小次序写第三步,将各个数据的叶按大小次序写在茎右(左)侧在茎右(左)侧. .9. 9. 众数、中位数和平均数众数、中位数和平均数众数:众数:频率分布直方图最高矩形下端中频率分布直
11、方图最高矩形下端中点的横坐标点的横坐标. .中位数:中位数:频率分布直方图面积平分线的频率分布直方图面积平分线的横坐标横坐标. .平均数:平均数:频率分布直方图中每个小矩形频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的面积与小矩形底边中点的横坐标之积的总和的总和. .10.10.标准差标准差22212()()()nxxxxxxsn-+-+-=L11. 11. 相关关系相关关系 自变量取值一定时,因变量的取值带自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,有一定随机性的两个变量之间的关系,叫做相关关系叫做相关关系. .12. 12. 散点图散点图 在平面直角坐
12、标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.三、用样本估计总体三、用样本估计总体 如果散点图中的点的分布,从整体上如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫量之间具有线性相关关系,这条直线叫做回归直线做回归直线. .13. 13. 回归直线回归直线14. 14. 回归方程回归方程ybxa=+1122211()(),()nniiiiiinniiiixxyyx ynx ybaybxxxxnx巩固练习巩固练习例例1 1 为了了解某地参加计算机水平测试为了了解某地参加计算机水平测试的的5000
13、5000名学生的成绩,从中抽取了名学生的成绩,从中抽取了200200名名学生的成绩进行统计分析,在这个问题学生的成绩进行统计分析,在这个问题中,中,50005000名学生成绩的全体是名学生成绩的全体是 ( )A. A. 总体总体 B. B. 个体个体 C. C. 从总体中抽取的一个样本从总体中抽取的一个样本 D. D. 样本的容量样本的容量A A 例例2 2 在在20022002年春季,一家著名的全国性年春季,一家著名的全国性连锁服装店,进行了一项关于当年秋季服装连锁服装店,进行了一项关于当年秋季服装流行色的民意调查流行色的民意调查. .调查者通过向顾客发放饮调查者通过向顾客发放饮料,并让顾客
14、通过挑选饮料杯上印着的颜色料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色来对自己喜欢的服装颜色“投票投票”. .根据这次根据这次调查,在某大城市调查,在某大城市A A,服装颜色的众数是红色,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色而当年全国服装协会发布的是咖啡色. .(1 1)这个结果是否代表)这个结果是否代表A A城市的人的想法?城市的人的想法?(2 2)你认为这两种调查的差异是由什么原因)你认为这两种调查的差异是由什么原因引起的?引起的?(1 1)这个结果只能说明)这个结果只能说明A A城市中光顾这城市中光顾这家连锁服装店的人,比其他人较少倾向家连锁服装店的人,
15、比其他人较少倾向于选择咖啡色,同时由于光顾连锁店的于选择咖啡色,同时由于光顾连锁店的人是一种方便样本,不能代表人是一种方便样本,不能代表A A城市其他城市其他人的想法人的想法. .(2 2)是由样本的代表性引起的)是由样本的代表性引起的. .因为因为A A城城市的调查结果来自于该市光顾这家连锁市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代服装店的人群,这个样本不能很好地代表全国民众的观点表全国民众的观点. . 例例3 3 某初级中学有学生某初级中学有学生270270人,其中七年级人,其中七年级108108人,八、人,八、九年级各九年级各8181人,现要利用抽样方法抽取人,
16、现要利用抽样方法抽取1010人参加某项调人参加某项调查查. .使用分层抽样时,将学生按七、八、九年级依次统使用分层抽样时,将学生按七、八、九年级依次统一编号为一编号为1 1,2 2,270270;使用系统抽样时,将学生随;使用系统抽样时,将学生随机编号为机编号为1 1,2 2,270270,并将整个编号依次分为,并将整个编号依次分为1010段段. .如果抽到的号码有下列四种情况:如果抽到的号码有下列四种情况: 7 7,3434,6161,8888,115115,142142,169169,196196,223223,250250; 5 5,9 9,100100,107107,111111,12
17、1121,180180,195195,200200,265265; 1111,3838,6565,9292,119119,146146,173173,200200,227227,254254; 3030,5757,8484,111111,138138,165165,192192,219219,246246,270.270. 那么下列判断正确的是那么下列判断正确的是 ( )A. A. 都不能为系统抽样都不能为系统抽样 B. B. 都不能为分层抽样都不能为分层抽样C. C. 都可能为系统抽样都可能为系统抽样 D. D. 都可能为分层抽样都可能为分层抽样D D 例例4 4 为了了解某地区高中学生的身
18、体为了了解某地区高中学生的身体发育情况,抽查了该地区发育情况,抽查了该地区100100名年龄在名年龄在17.517.51818岁的男生体重(单位:岁的男生体重(单位:kgkg),),得到频率分布直方图如下:得到频率分布直方图如下: 54.5 56.5 58.5 60.5 62.5 64.5 66.5 68.5 70.5 72.5 54.5 56.5 58.5 60.5 62.5 64.5 66.5 68.5 70.5 72.5 体重体重/kg/kg频率频率组距组距0.030.030.050.050.070.07求这求这100100名学生中体重在名学生中体重在56.556.564.564.5范围
19、范围内的人数内的人数. .4040 例例5 5 某商场为了调查旅游鞋的销售情况,某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下:理后,画出频率分布直方图如下:35.5 37.5 39.5 41.5 43.5 45.5 35.5 37.5 39.5 41.5 43.5 45.5 尺寸尺寸频率频率组距组距0.03750.03750.08750.0875已知图中从左到右前已知图中从左到右前3 3个小矩形的面积之个小矩形的面积之比为比为1 12 23 3,第二,第二小组的频数为小组的频数为10.10.(1 1)求
20、样本容量的值;)求样本容量的值;(2 2)估计购鞋尺寸在)估计购鞋尺寸在37.537.543.543.5内的顾客内的顾客所占百分比约是多少?所占百分比约是多少?404080%80% 例例6 6 已知某人已知某人5 5次上班途中所花时间次上班途中所花时间的平均数为的平均数为1010分钟,方差为分钟,方差为2 2分钟,有三分钟,有三次上班途中所花时间分别为次上班途中所花时间分别为9 9分钟,分钟,1010分分钟和钟和1111分钟,求另两次上班途中所花的分钟,求另两次上班途中所花的时间时间. .8 8分钟分钟,12,12分钟分钟 例例7 7 某工厂甲、乙两个车间包装同一某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔种产品,在自动包装传送带上,每隔3030秒抽一包产品,称其重量是否合格,秒抽一包产品,称其重量是否合格,7 7次次抽查数据记录如下:抽查数据记录如下:甲车间:甲车间:102102,101101,9999,103103,9898,9999,9898;乙车间:乙车间:110110,115115,9090,8585,7575,115115,110.110.试根据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗数据安全区块链保护的应用场景分析
- 医疗数据安全共享的区块链激励案例剖析
- 胆肠吻合课件
- 医疗数据安全保险互操作机制
- 山东省决胜新2026届生物高一上期末联考试题含解析
- 2026届天津市滨海新区七所重点中学高三生物第一学期期末学业水平测试模拟试题含解析
- 医疗数据安全FMEA防护策略
- 东莞市重点中学2026届数学高三第一学期期末达标检测试题含解析
- 医疗数据区块链共识机制:效率与安全平衡
- 医疗数据区块链共享的存证机制
- 高二电磁学考试题及答案
- 2025下半年贵州遵义市市直事业单位选调56人笔试考试参考题库及答案解析
- 2025鄂尔多斯达拉特旗第二批事业单位引进28名高层次、急需紧缺人才考试笔试模拟试题及答案解析
- 甲状腺癌放射性碘抵抗机制研究
- 包治祛痘合同范本
- 门窗的代理合同范本
- 2025年秋国家开放大学《思想道德与法治》终考大作业试卷一附答案【供参考】
- 20252025年(完整版)三级安全教育真题试卷含答案
- 人教版2025-2026学年八年级上册数学期末考试模拟试卷
- 挂名法人代表协议合同
- 《软件工程》机考题库
评论
0/150
提交评论