




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计知识点及常见题型2.1.1简单随机抽样1 .总体和样本:在统计学中,把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体 胃的有关性质,一般从总体中随机抽取一部分:田,血 ,/研究,我们称它为样本.其中个体的个数称为样本容量.2 .简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是: 每个样本单位被抽中的可能性相同 (概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。 简单随 机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。3 .简单随
2、机抽样常用的方法:(1)抽签法;随机数表法;计算机模拟法;使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:总体变异情况;允许误差范围;概率保证程度。4 .抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。5 .随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。6 .1.2系统抽样1 .系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。K (抽样距离
3、)=N (总体规模)/n (样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可 以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布 承某种循环性规律,且这种循环和抽样距离重合。2 .系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重 要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样 可以大大提高估计精度。3 .1.3分层抽样1 .分层抽样(类型抽样):先将总体中的所有单位按照某种特征
4、或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。两种方法:1 .先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。2 .先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取 样本。2 .分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。分层标准:(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。(2)以保证各层内部同质性强、各层之间异质性
5、强、突出总体内在结构的变量作为分层变量。(3)以那些有明显分层区分的变量作为分层变量。3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不 同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权 处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。2.2.2用样本的数字特征估计总体的数字特征1、样本均值:xXiX2nxn2、.样本标准差:S VS2 JJ)!(X2X)2(X
6、nX)2n3 .用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在 随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均 值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。4 . (1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍(3) 一组数据中的最大值和最小值对标准差的影响,区间(X 3s, X 3s)的应用;“去掉一个最高分,去掉一个最低分”中的
7、科学道理2.3.2两个变量的线性相关1、概念:(1)回归直线方程(2)回归系数2.回归直线方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量 X)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。(3)利用回归方程进行统计控制规定Y值的变化,通过控制 X的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。4.应用直线回归的注意事项(1)做回归分析要有实际意义;(2)回归分析前,最好先作出散点图;(3)回归直
8、线不要外延。题型一选择合适的抽样方法简单随机抽样,也叫纯随机抽样。 就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然 后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本 合起来构成总体的样本。1 .现有以下两项调查:某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量
9、状况;某市有大型、中型与小型的商店共1500家,三者数量之比为1 : 5: 9.为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成、这两项调查宜采用的抽样方法依次是()A.简单随机抽样法,分层抽样法C.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法D.系统抽样法,分层抽样法2 .某社区有400个家庭,其中高等收入家庭120户,中等收入家庭 180户,低收入家庭100户.为了调查社会购买力的某项指标,要从中抽取一个容量为 100的样本记作;某校高一年级有12名女排球运动员,要从中选出3人调查学习负担情况,记作;那么,完成上述2项调查应采用的抽样方法是()A.用随机抽样法,用系统抽
10、样法B.用分层抽样法,用随机抽样法C.用系统抽样法,用分层抽样法D.用分层抽样法,用系统抽样法题型二:系统抽样剔除个体数计算当系统抽样中样本总量除以样本容量不是整数时,需要用简单随机抽样法剔除部分个体,剔除个体的数量=样本总量一组距孙羊本容量。例.若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除 个个体,编号后应均分为 一段,每段有 个个体.5,35,47题型三:分层抽样有关计算分层抽样特点:各层抽样比例=总体抽样比例=样本容量总体容量,每层抽取个体数量=该层个体总量刈由样比例。经典例题:某校高中部有三个年级,其中高三有学生1000人,现采
11、用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了 75人,高二年级抽取了 60人,则高中部共有多少学生?练习.某单位业务人员、管理人员、后勤服务人员人数之比依次为15 : 3 : 2.为了了解该单位职员的某种情况,采用分层抽样方法抽出一个容量为n的样本,样本中业务人员人数为30,则此样本的容量 门为()A.20B.30C. 40D. 80题型四:频率分布直方图画法步骤作频率分布直方图分布的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数,一般样本容量越大组数越多,经常分为512组,组距尽量取整。将数据分组,通过唱票计算各组的频数列频率分布表,根据各组频数计算频率,列出频率
12、分布表频率,一画出频率分布直方图,横轴只画最小值与最大值之间部分,纵轴表示汨M的值组距题型五:由频率分布直方图估计众数、平均数、中位数由频率分布直方图估计众数:一般先计算各部分小矩形的面积,找到面积最大的矩形,取该矩形横边中点对应的数即为所求由频率分布直方图估计平均数:一般利用平均数公式 X X1P1 X2P2XnPn来计算,其中Xn表示第n个矩形横边中点对应的数,Pn表示第n个矩形的面积。由频率分布直方图估计中位数:就是平分直方图面积且垂直于横轴的直线对应的数。前n个小矩形面积不足 0.5时,中位数=下一个矩形横边左端点+ 弁:二, 义组距该小矩形面积题型六:频率分布表中未知量计算各组频数之
13、和=样本容量,各组频率之和 =1,各组频数 砌率=样本容量数据落在某区间的概率 个区间包括的各组频率之和经典例题:为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.1, 0.3, 0.4.第一小组的频数是 5.(1)求第四小组的频率和参加这次测试的学生人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在 100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?试估计该年级学生平均跳绳次数,中位数、众数(2)求年降雨量在150, 200250, 30
14、0或 范围内的概率;练习一.2005年降雨量的概率如下表所示:,一 一 ,100, 200 一,,、(1)求年降雨量在 , 范围内的概率;(3)求年降雨量不在150, 300范围内的概率;(4)求年降雨量在100, 300范围内的概率.年降雨量/mm100,150150,200200,250250,300概率0. 120. 250. 160. 14练习2.某地区的年降水量在下列范围内的概率如下表所示年降水量(单位:mm)100, 150)150, 200)200, 250)250, 300)概率0.120.250.160.14则年降水量在150, 300 (mm)范围内的概率为()A. 0.4
15、1 B. 0.45 C. 0.55D. 0.67练习3. (2014重庆文17)(本小题满分13分.(I)小问4分,(II)小问4分,(III)小问5分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示:洞穿高考预测题六(II )分别求出成绩落在50, 60与60, 70中的学生人数;(III)从成绩在50,70的学生中任选2人,求此2人的成绩都在 60, 70中的概率.题型七:用平均数和方差判断产品质量、成绩好坏、产量高低等成绩好坏、产量高低等指标首先看平均数越高越好,平均数和方差(标准差)都是反映数据离散程度的工具。 当平均数相近或相同时,可以用方差(标准差)来刻画样本的稳定
16、性。题型八:求线性相关的两个变量的回归直线方程,并作出适当预测第一步:作散点图第二步:求回归方程第三步:代值计算求线性回归方程系数公式:重要结论正相关则xyinx yn 22Xinxn_(x x)(yii 1 n_(xi x)2i 1y)<?y bX.b>0,负相关则b<0,当解释变量增加一个单位时,预报变量相应增加(b> 0)或减少(b<0)I b!个单位? y bx, (x, y)称为样本点的中心,此点一定在回归直线上。用回归直线方程计算出的 y值不是真实值,真实值在计算值的左右,可能大,可能小也可能相等。相关指数R2用来刻画拟合效果,R2的值越大,拟合效果越好,反之则越差,一般选择R2值大的模型。对R2值理解:相关指数R2弋0.997说明x可以解释y的99.7%的变化。经典例题:10.有10名同学高一(x)和高二(y)的数学成绩如下:且- 回成绩x74717268767367706574
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 软件开发流程面临的挑战试题及答案
- 企业文化与风险管理考题及答案
- 制定职业晋升的长期规划计划
- 2024年甘肃陇南事业单位招聘笔试真题
- VB最佳编程习惯与技巧试题及答案
- 2024年东莞市市场监督管理局招聘笔试真题
- 移动设备安全性测试试题及答案
- 软件工程项目管理中的挑战试题及答案
- 未来市场竞争中的风险识别试题及答案
- 自然语言处理技术试题及答案
- 137案例黑色三分钟生死一瞬间事故案例文字版
- 高中英语外研版 单词表 必修1
- 临床流行病学与循证医学-临床实践指南的制定与评价
- 【魔镜洞察】2024药食同源保健品滋补品行业分析报告
- 2023届高考地理一轮复习跟踪训练-石油资源与国家安全
- 14.有趣的光影(课件)-美术六年级下册
- 中央2024年商务部中国国际电子商务中心招聘笔试历年典型考题及考点附答案解析
- 2024年四川省南充市名校中考物理模拟试卷
- JBT 14682-2024 多关节机器人用伺服电动机技术规范(正式版)
- 改进工作作风自查报告(11篇)
- 24春国家开放大学《机械CADCAM》形考任务1-3参考答案
评论
0/150
提交评论