版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章统计复习,知识结构,1简单随机抽样,设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。,如果用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的概率都等于,(1)要求被抽取样本的总体的个体数有限;(2)它是不放回抽样;(3)它是逐个进行抽取;(4)它是一种等概率抽样。,(一)定义:,(二)个体入样的概率:,(三)简单随机抽样的特点:,2.1随机抽样,1简单随机抽样,(一)抽签法,3优点:简单易行。,2适用范围:总体的个体数不多时,1.步骤:一是标号;二是做号签,放回均匀搅拌;三是逐个
2、抽取。,(二)随机数表法,第一步编号(位数相同);第二步在随机数表中选定开始数与方向第三步获取样本的号码,抽足为止(去掉其中不合要求和与前面重复的数),2.系统抽样,当总体的个体比较多时,将总体分成均衡的几个部分,然后按照预先定出的规则,从每一个部分抽取一个个体,得到所需要的样本,这样的抽样叫做系统抽样。,第一步:编号(在保证编号的随机性的前提下,可以直接利用个体所带有的号码)第二步:分段(定分段间隔习惯于,注意剔除部分个体时,要保证随机性和客观性)第三步:确定起始个体号(在第一段采用简单随机抽样来确定)第四步:按照事先确定的规则抽取样本(通常逐个加k.即所得样本的编号分别为,(1)概念:,(
3、2)系统抽样的步骤,分层抽样步骤:第一步求出样本容量与总体的个体数之比n:N,第二步各层数量乘比值n:N,得各层应抽数(需为整数时可进行四舍五入),第三步采用简单随机抽样(抽签或随机数表法)或系统抽样的方法从各个层中分别抽取,然后合在一起,就是所抽取的样本。,分层抽样定义:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽取叫做分层抽样,其中所分成的各部分叫做层。,3分层抽样,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围,2、决定组距与组数(组数取整),3、将数据分组,1.画频率分布直方图的步骤
4、,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图(高度=频率/组距)。,组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,2.2用样本估计总体,2.2.1用样本的频率分布估计总体分布,说明:小长方形面积=频率,所有小正方形面积=1,2.连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,3.当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线总体密度曲线。,4.茎叶图(适用于样本数据较少时),2.2.2用样本的数字特征估计总体的数字特征,1、众数在样本数据的频率分布直方图中,就是最高矩形
5、的中点的横坐标。,2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。,3.平均数在频率分布直方图中是每个小矩形的面积乘以小矩形底边中点的横坐标之和.,(一)众数、中位数、平均数,4.三种数字特征的优缺点,众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征,中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。,平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较
6、大,使平均数在估计时可靠性降低。,(二).标准差,标准差考察样本数据的分散程度的大小,计算标准差公式,方差:标准差的平方,标准差越大,样本数据越分散标准差越小,样本数据越集中,1.相关关系:自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系。它是一种非确定性关系。,2.3变量间的相互关系,2.线性相关关系:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系.这条直线叫做回归直线,该直线方程叫回归方程,直线过定点,相关系数,可以证明,且越接近于1,相关程度越大;越接近于0,相关程度越小.r在-1,-0.75,负相关很强;r在0.7
7、5,1,正相关很强;r在-0.75,-0.30或0.30,0.75,相关性一般r在-0.25,0.25,相关较弱;,1.学校共有师生2400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是.,150人,综合应用,2.有A、B、C三种零件,分别为a个,300个,200个采用分层抽样法抽取一个容量为45的样本,A种零件被抽取20个,C种零件被抽取10个,则这三种零件共有个.,900,综合应用,4.一个总体的80个个体编号为0,1,2,79,并依次将其分成8个小组,组号为0,1,2,7,要用系统抽样的方法抽取一个容量为8的样本,即
8、规定先在第0组随机抽取一个号码,记为m,依次错位地得到后面各组的号码,即第k组中抽取的号码的个位数为m+k或m+k-10(若m+k10).则在m=6时,所抽到的8个号码是_.,综合应用,6,17,28,39,40,51,62,73.,5.已知一组数据x1,x2,x3,x4,x5,它们的平均数为20,如果把x1改写成10,那么新数据40,x2,x3,x4,x5,的平均值为25,则原先的x1等于是.,15,综合应用,6.已知两组数据x1,x2,xn,与y1,y2,yn,它们的平均数分别为,标准差分别是s1,s2,则新的一组数据2x1-3y1+1,2x2-3y2+1,2xn-3yn+1,的平均数是,
9、3y1+1,3y2+1,3yn+1方差是.,9s2,7.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如相数据:,现要使销售额达到6万元,则需广告费用为。(保留两位有效数学),综合应用,8.有一个样本容量为100的数据分组,各组的频数如下:(17,19,1;(19,21,1;(21,23,3;(23,25,3;(25,27,18;(27,29,16;(29,31,28;(31,33,30;(1)画出频率分布直方图(2)估计小于29的数据的频率(3)求出样本的众数、中位数、平均数、方差,综合应用,1、一个总体中的100个个体编号为0,1,2,99,并依次将其分为10个小组,组号为0,1,2,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组(号码
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机电传动与控制 课件 第7章 电气控制系统设计
- 洁净厂房工程验收规范
- 研究生考研考试英语全真模拟试题及答案(第二季)
- 饮料饮品管理制度
- (完整版)喷射混凝土施工方案(专家论证版)
- 医疗机构中医健康管理标准(2026年版)
- 生鲜冷库维护规程
- 2026年朔州市平鲁区网格员招聘笔试备考试题及答案解析
- 2025年扬州市邗江区网格员招聘考试试题及答案解析
- 2026年甘肃省武威市网格员招聘考试备考试题及答案解析
- 员额法官、检察官考试真题及答案(完整版)
- 病房消毒课件
- 物业公司全员安全生产责任制度
- 2025村集体土地承包会议记录
- 2025年甘肃省委党校在职研究生招生考试(中共党史党建)综合试题及答案
- 2025年机械设计与自动化测试题及答案
- (2024)电梯安全管理员考试题及参考答案
- 利用微震监测技术研究麦积山石窟崖体的地形效应
- 小学二年级《金斧头》中文故事课件
- 光缆基础知识培训课件
- 臭气回收处理方案(3篇)
评论
0/150
提交评论