统计知识点及常见题型_第1页
统计知识点及常见题型_第2页
统计知识点及常见题型_第3页
统计知识点及常见题型_第4页
统计知识点及常见题型_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-作者xxxx-日期xxxx统计知识点及常见题型【精品文档】 统计知识点及常见题型1总体和样本:在统计学中 , 把研究对象的全体叫做总体把每个研究对象叫做个体把总体中个体的总数叫做总体容量为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本其中个体的个数称为样本容量2简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法

2、。3简单随机抽样常用的方法: (1)抽签法;随机数表法;计算机模拟法;使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:总体变异情况;允许误差范围;概率保证程度。4抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签 (3)对样本中的每一个个体进行测量或调查 例:请调查你所在的学校的学生做喜欢的体育活动情况。5随机数表法: 例:利用随机数表在所在的班级中抽取10位同学参加某项活动。1系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。K(抽样距离)=N(总体

3、规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。2系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。1分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在

4、各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。两种方法:1先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。2先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。2分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。分层标准:(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。(3)以那些有明显分层区分

5、的变量作为分层变量。3分层的比例问题: (1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 (2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。1、样本均值:2、样本标准差:3用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、

6、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。4(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍(3)一组数据中的最大值和最小值对标准差的影响,区间的应用;“去掉一个最高分,去掉一个最低分”中的科学道理1、概念: (1)回归直线方程 (2)回归系数2回归直线方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即自变量x)代

7、入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。4应用直线回归的注意事项 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。题型一选择合适的抽样方法简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

8、第一个样本采用简单随机抽样的办法抽取。分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。1现有以下两项调查:某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;某市有大型、中型与小型的商店共1500家,三者数量之比为159为了调查全市商店每日零售额情况,抽取其中15家进行调查 完成、这两项调查宜采用的抽样方法依次是( )A.简单随机抽样法,分层抽样法 B.分层抽样法,简单随机抽样法C分层抽样法,系

9、统抽样法 D系统抽样法,分层抽样法2某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作;某校高一年级有12名女排球运动员,要从中选出3人调查学习负担情况,记作;那么,完成上述2项调查应采用的抽样方法是( )A.用随机抽样法,用系统抽样法 B.用分层抽样法,用随机抽样法C.用系统抽样法,用分层抽样法 D.用分层抽样法,用系统抽样法题型二:系统抽样剔除个体数计算当系统抽样中样本总量除以样本容量不是整数时,需要用简单随机抽样法剔除部分个体,剔除个体的数量=样本总量组距×样本容量。例若总

10、体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除 个个体,编号后应均分为 段,每段有 个个体5, 35 ,47 题型三:分层抽样有关计算 分层抽样特点:各层抽样比例=总体抽样比例=,每层抽取个体数量=该层个体总量×抽样比例。经典例题:某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少学生?练习某单位业务人员、管理人员、后勤服务人员人数之比依次为1532为了了解该单位职员的某种情况,采用分层抽样方法抽出一个容量为n的样本,样本中业

11、务人员人数为30,则此样本的容量n为( )A.20 B.30 C40 D80 题型四:频率分布直方图画法步骤作频率分布直方图分布的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数,一般样本容量越大组数越多,经常分为512组,组距尽量取整。 将数据分组,通过唱票计算各组的频数 列频率分布表,根据各组频数计算频率,列出频率分布表画出频率分布直方图,横轴只画最小值与最大值之间部分,纵轴表示的值题型五:由频率分布直方图估计众数、平均数、中位数由频率分布直方图估计众数:一般先计算各部分小矩形的面积,找到面积最大的矩形,取该矩形横边中点对应的数即为所求由频率分布直方图估计平均数:一般利用平均数公

12、式来计算,其中表示第n个矩形横边中点对应的数,表示第n个矩形的面积。由频率分布直方图估计中位数:就是平分直方图面积且垂直于横轴的直线对应的数。前n个小矩形面积不足0.5时,中位数=下一个矩形横边左端点+×组距题型六:频率分布表中未知量计算 各组频数之和=样本容量,各组频率之和=1,各组频数÷频率=样本容量 数据落在某区间的概率区间包括的各组频率之和经典例题:为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.频率组距次数(1) 求

13、第四小组的频率和参加这次测试的学生人数;(2) 在这次测试中,学生跳绳次数的中位数落在第几小组内?(3) 参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?试估计该年级学生平均跳绳次数,中位数、众数 练习一2005年降雨量的概率如下表所示:(1)求年降雨量在 范围内的概率;(2)求年降雨量在或范围内的概率;(3)求年降雨量不在范围内的概率;(4)求年降雨量在范围内的概率年降雨量/mm概率012025016014练习2某地区的年降水量在下列范围内的概率如下表所示年降水量(单位:mm)100,150)150,200)200,250)250,300)概率则年降水量在15

14、0,300(mm)范围内的概率为( )A0.41 B0.45 C0.55 D练习3.(2014重庆文17)(本小题满分13分.(I)小问4分,(II)小问4分,(III)小问5分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示: 洞穿高考预测题六(I)求频率分布直方图中的值;(II)分别求出成绩落在与中的学生人数;(III)从成绩在的学生中任选2人,求此2人的成绩都在中的概率.题型七:用平均数和方差判断产品质量、成绩好坏、产量高低等 平均数和方差(标准差)都是反映数据离散程度的工具。成绩好坏、产量高低等指标首先看平均数越高越好,当平均数相近或相同时,可以用方差(标准差)来刻画样本的稳定性。题型八:求线性相关的两个变量的回归直线方程,并作出适当预测第一步:作散点图第二步:求回归方程第三步:代值计算求线性回归方程系数公式:,.重要结论正相关则b0,负相关则b0,当解释变量增加一个单位时,预报变量相应增加(b0)或减少(b0)b个单位,称为样本点的中心,此点一定在回归直线上。用回归直线方程计算出的y值不是真实值,真实值在计算值的左右,可能大,可能小也可能相等。相关指数R2用来刻画拟合效果,R2的值越大,拟合效果越好,反之则越差,一般选择R2值大的模型。对R2值理解:相关指数R20.997,说明x可以解释y的99.7%的变化。经典例题:10有10名同学高一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论