高中必修三统计知识点_第1页
高中必修三统计知识点_第2页
高中必修三统计知识点_第3页
高中必修三统计知识点_第4页
高中必修三统计知识点_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高中必修三统计知识点整理高中必修三统计知识点整理11/11高中必修三统计知识点整理v1.0可编写可改正必修3知识点总结统计简单随机抽样1简单随机抽样,也叫纯随机抽样。就是从整体中不加任何分组、划类、排队等,完满随机地抽取检查单位。特色是:每个样本单位被抽中的可能性同样(概率相等),样本的每个单位完满独立,互相间无必定的关系性和排挤性。简单随机抽样是其它各样抽样形式的基础。平常但是在整体单位之间差异程度较小和数目较少时,才采纳这类方法。2简单随机抽样常用的方法:1)抽签法;随机数表法;计算机模拟法;使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:整体变异状况;赞成偏差范围;概率保

2、证程度。3抽签法:1)给检核对象集体中的每一个对象编号;2)准备抽签的工具,实行抽签3)对样本中的每一个个体进行丈量或检查例:请检查你所在的学校的学生做喜爱的体育活动状况。4随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。系统抽样1系统抽样(等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,此后依据这一固定的抽样距离抽取样本。第一个样本采纳简单随机抽样的方法抽取。K(抽样距离)=N(整体规模)/n(样本规模)前提条件:整体中个体的摆列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则散布。能够在调查赞成的条件下,从不同样的样本开始抽样,比较几次样

3、本的特色。假如有明显差异,说明样本在整体中的散布承某种循环性规律,且这类循环和抽样距离重合。2系统抽样,即等距抽样是实质中最为常用的抽样方法之一。因为它对抽样框的要求较低,实行也比较简单。更为重要的是,假如有某种与检查指标相关的协助变量可供使用,整体单元按协助变量的大小次序排队的话,使用系统抽样能够大大提升估11v1.0可编写可改正计精度。分层抽样1分层抽样(种类抽样):先将整体中的全部单位依据某种特色或标记(性别、年纪等)区分红若干种类或层次,此后再在各个种类或层次中采纳简单随机抽样或系用抽样的方法抽取一个子样本,最后,将这些子样本合起来构成整体的样本。两种方法:1先以分层变量将整体区分为若

4、干层,再依据各层在整体中的比率从各层中抽取。2先以分层变量将整体区分为若干层,再将各层中的元素按分层的次序齐整摆列,最后用系统抽样的方法抽取样本。2分层抽样是把异质性较强的整体分红一个个同质性较强的子整体,再抽取不同样的子整体中的样安分别代表该子整体,全部的样本从而代表整体。分层标准:1)以检查所要分析和研究的主要变量或相关的变量作为分层的标准。2)以保证各层内部同质性强、各层之间异质性强、突出整体内在构造的变量作为分层变量。3)以那些有明显分层区分的变量作为分层变量。3分层的比率问题:1)按比率分层抽样:依据各样种类或层次中的单位数目占整体单位数目的比重来抽取子样本的方法。2)不按比率分层抽

5、样:有的层次在整体中的比重太小,其样本量就会特别少,此时采纳该方法,主假如便于对不同样层次的子整体进行专门研究或进行互相比较。假如要用样本资料推测整体时,则需要先对各层的数据资料进行加权办理,调整样本中各层的比率,使数据恢复到整体中各层实质的比率构造。例1某大学为了增援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,采纳6人构成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3,18.第二步:将18个号码分别写在18张外形完满同样的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中

6、逐一抽取6个号签,并记录上边的编号;22v1.0可编写可改正第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:第一步:将18名志愿者编号,编号为01,02,03,18.第二步:在随机数表中任选一数作为开始,按随意方向读数,比方第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在0118中的数,或已读过的数,都跳过去不作记录,挨次可获得12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行详细实行.解(1)将每一个人随机编一个号由0001至1003.(2

7、)利用随机数法找到3个号将这3名工人剔除.(3)将节余的1000名工人从头随机编号由0001至1000.1000(4)分段,取间隔k=10=100将整体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l,100+l,200+l,,900+l共10个号码选出,这10个号码所对应的工人构成样本.例3(14分)某一个地域共有5个乡镇,人口3万人,此中人口比率为32523,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这类疾病与不同样的地理地点及水土相关,问应采纳什么样的方法并写出详细过程.解应采纳分层抽样的方法.过程以下:(1

8、)将3万人分为五层,此中一个乡镇为一层.(2)按仍旧本容量的比率随机抽取各乡镇应抽取的样本.3230015=60(人);30015=40(人);5230015=100(人);30015=40(人);330015=60(人),所以各乡镇抽取人数分别为60人,40人,100人,40人,60人.(3)将300人组到一同即获得一个样本.33v1.0可编写可改正用样本的数字特色预计整体的数字特色1、本均值:x1x2xnxn2、样本标准差:ss2(x1x)2(x2x)2(xnx)2n3用样本预计整体时,假如抽样的方法比较合理,那么样本能够反应整体的信息,但从样本获得的信息会有偏差。在随机抽样中,这类偏差是

9、不可以防范的。固然我们用样本数据获得的散布、均值和标准差其实不是整体的真实的散布、均值和标准差,而但是一个预计,但这类预计是合理的,特别是当样本量很大时,它们的确反应了整体的信息。4(1)假如把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变.(2)假如把一组数据中的每一个数据乘以一个共同的常数k,标准差变成本来的k倍.(3)一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用;“去掉一个最高分,去掉一个最低分”中的科学道理.例1为认识A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下边列出了每一个轮胎行驶的最远里程数(单位:1000

10、km)轮胎A96,112,97,108,100,103,86,98轮胎B108,101,94,105,96,93,97,1061)分别计算A,B两种轮胎行驶的最远里程的均匀数,中位数;2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;3)依据以上数据你以为哪一种型号的轮胎性能更为坚固解(1)A轮胎行驶的最远里程的均匀数为:98=100,8中位数为:10098=99;2轮胎行驶的最远里程的均匀数为:10810194105969397106=100,810197中位数为:=99.(2)A轮胎行驶的最远里程的极差为:112-86=26,标准差为:44v1.0可编写可改正s=4212232820

11、3214222=221;82B轮胎行驶的最远里程的极差为:108-93=15,标准差为:s=8212625242723262=118.82(3)因为A和B的最远行驶里程的均匀数同样,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更为坚固.例2(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传达带上每隔30min抽取一包产品,称其重量,分别记录抽查数据以下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.1)这类抽样方法是哪一种2)将这两组数据用茎叶图表示;3)将两组数据比较,说明哪个车间产品较坚固.解(1)因为间隔时间同样

12、,故是系统抽样.(2)茎叶图以下:3)甲车间:均匀值:1x1=(102+101+99+98+103+98+99)=100,21222方差:s1=(102-100)+(101-100)+(99-100)6.乙车间:55v1.0可编写可改正均匀值:x2=1(110+115+90+85+75+115+110)=100,7方差:s22=1(110-100)2+(115-100)2+(110-100)24.7x=x22,s1s2,甲车间产品坚固.12两个变量的线性相关1、见解:1)回归直线方程2)回归系数2最小二乘法3直线回归方程的应用(1)描绘两变量之间的依存关系;利用直线回归方程即可定量描绘两个变量

13、间依存的数目关系(2)利用回归方程进行展望;把预告因子(即自变量x)代入回归方程对预告量(即因变量Y)进行预计,即可获得个体Y值的赞成区间。3)利用回归方程进行统计控制规定Y值的变化,经过控制x的范围来实现统计控制的目标。如已经获得了空气中NO2的浓度和汽车流量间的回归方程,即可经过控制汽车流量来控制空气中NO2的浓度。4应用直线回归的注意事项1)做回归分析要有实质意义;2)回归分析前,最好先作出散点图;3)回归直线不要外延。回归直线方程的推导设x与y是拥有线性相关关系的两个变量,且相应于样本的一组察看值的n个点的坐标分别是:(x1,y1),(x2,y2),(x3,y3),(xn,yn),下边

14、给出回归方程的推导。设所求的回归方程为y?bxa,此中a,b是待确立的参数,那么:?bxia,(i1,2,3,n),yi样本中各个点的偏差是yi?yi(bxia),(i1,2,3,n)yi明显,上边的各个偏差的符号有正、有负,假如将他们相加会互相抵消一部分,所以他们的和不可以够代表n个点与回归直线在66v1.0可编写可改正整体上的凑近程度,而是采纳n个偏差的平方和Q来表示n个点与相应直线(回归直线)在整体上的凑近程度。n?2n2Q(yi)(yibxia)yi即i1i1(y1bx1a)2(y2bx2a)2(y3bx3a)2(ynbxna)2求出当Q取最小值时的a,b的值,就求出了回归方程。(一)

15、先证明两个在变形顶用到的公式:n2n22x1x2xn(xix)nxx公式(1)xini1i1此中nx)2x)2x)2x)2(xi(x1(x2(xn因为i1222(x1x2xn)22x1x2xn2nxnx222nxn)2nxnx(x1x2nxi22nx)2nxi22(x2x2x2)nxi1nx所以i1(xii1nx12nnn(xix)(yiy)xiyinxy公式()i1i1n(xix)(yiy)(x1x)(y1y)(x2x)(y2y)(xnx)(yny)因为i1(x1y1x2y2xnyn)(x1yy1xx2yy2xxnyynx)nxynxiyi(x1x2xn)y(y1y2yn)xnxyi1nn(

16、x1x2xn)y(y1y2yn)xnxyxiyii1nnnnnnxiyi2nxynxyxiyinxy(xix)(yiy)xiyinxyi1i1所以i1i1(二)推导:将Q的表达式的各项先张开,再归并、变形Q(y1bx1a)2(y2bx2a)2(y3bx3a)2(ynbxna)277v1.0可编写可改正(y12y22yn2)2y1(bx1a)2y2(bx2a)2yn(bxna)(bx1a)2(bx2a)2(bxna)2张开n2nnb2n2nna2yi2bxiyi2ayixi2abxii1i1i1i1i1以a,b为同类项,归并nnyixinnnna22na(i1bi1)b2xi22bxiyiyi2

17、nni1i1i1-以a,b的次数为标准整理22n2nn2x,yna2na(ybx)b2bxiyi-将数据转变成均匀数xiyii1i1i1bx)2bx)2b2n2nn2na(yn(yxi2bxiyiyi配方法i1i1i1bx)22nb2x2b2n2nn2na(y2nbxyxi2bxiyiyiny张开i1i1i1bx)2b2(n22nn22na(yxi)2b(xiyinxy)(yinxny)整理i1i1i1bx)2b2nx)2nny)2na(y(xi2b(xix)(yiy)(yii1i1i1用公式(一)、(二)变形nna(ybx)2nx)2b2(xix)(yiy)ny)2i1(xi2bi1n2i1

18、(yi配方(xix)i1nny)22n2(xix)(yiy)2(xix)(yin2na(ybx)(xix)bi1ni1n(yiy)22i1(xix)(xix)i1i1i1在上式中,共有四项,后两项与a,b没关,为常数;前两项是两个非负数的和,所以要使得Q区的最小值,当且仅目前两项的值都为0。所以88v1.0可编写可改正aybxaybxnn(xix)(yiy)或xiyinxy用公式(一)、(二)变形得bi1bi1nn(xix)2xi2nxi1i1(三)总结规律:上述推倒过程是环绕着待定参数a,b进行的,只含有xi,yi的部分是常数或系数,用到的方法有(1)配方法,有两次配方,分别是a的二次三项式

19、和b的二次三项式;(2)变形时,用到公式(一)、(二)和整体思想;(3)用平方的非负性求最小值。(4)实质计算时,平常是分步计算:先求出x,y,再分别计算nnnn(xix)(yiy),(xix)2或xiyinxy,xi2nx的值,最后就能够计算出a,b的值。i1i1i1i16相关系数r统计中常用相关系数r来权衡两个变量之间的线性相关的强弱,当xi不全为零,yi也不全为零时,则两个变量的相关系数的计算公式是:nn(xix)(yiy)xiyinxyri1i1nnnn2(xix)2(yiy)2nx2xi2yi2nyi1i1i1i1r就叫做变量y与x的相关系数(简称相关系数)说明:(1)对于相关系数r

20、,第一值得注意的是它的符号,当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;(2)其他注意r的大小,假如r0.751,那么正相关很强;假如r1,0.75,那么负相关很强;假如r0.75,0.30或r0.30,0.75,那么相关性一般;假如r0.25,0.25,那么相关性较弱例1测得某国10对父子身高(单位:英寸)以下:父亲60626465666768707274身高(x)儿子6670身高(y)1)对变量y与x进行相关性查验;2)假如y与x之间拥有线性相关关系,求回归直线方程;99v1.0可编写可改正(3)假如父亲的身高为73英寸,预计儿子身高10102解:(1)x66.8,y67,xi244794yi244929.22,xy4462.24,4475.6,xi1i1102xiyi44836.4,y4489,i110 xiyinxy所以ri110n22x2y2nynxi1ii1i44836.4104475.6(4479444622.4)(44929.2244890)80.480.40.98,6730.15282.04所以y与x之间拥有线性相关关系10i1xiyi10 xy44836.444756(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论