学好统计应用决策未来生活_第1页
学好统计应用决策未来生活_第2页
学好统计应用决策未来生活_第3页
学好统计应用决策未来生活_第4页
学好统计应用决策未来生活_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学好统计应用 决策未来生活366100福建省大田第一中学田富德统计在现实生产、生活中冇着广泛的应用,木文将分知识点与同学们共同体会统计在现实中的应用。1. 简单随机抽样的应用-般地,设一个总体含有有限个个体,并记其个数为n,如果通过逐个抽取的方法从屮抽取一个样本,且 每次抽取时各个个体被抽到的概率相等。就称这样的抽样为简单随机抽样。例1某校为了解毕业班阶段复习悄况,准备在模拟考试后从参加考试的500名学生中抽取20名学生的试 卷,进行详细的试卷质量分析,请你帮忙设计一个适宜的抽取方案。并写出具体操作步骤。k思维点拨为了保证抽取的公平性(即每个同学的试卷被抽取的概率相等),为了保证试卷质量分析的

2、 客观性、准确性和可信性。规范的、不带主观意向的随机抽样才能得到前面的保证,因此此题宜用简单随 机随机抽样。【解析】方法一(抽签法):其步骤如下:先将50()名同学试卷进行编号1,2,,500;做好大小、形 状相同的号签,分别写上这500个数;将这些号签放在一起,并进行均匀搅扌半,接着连续抽取20个号 签,然后对这20个号签对应的试卷进行质量分析。方法二(随机数表法):将500名学生看作一个总体,从中抽取一个 =20的样木,使用随机数表法进行 抽取。第一步:给总体中的每个个体编上号码:001, 002, 003,,500o第二步:从随机数表的第13 行第3列的4开始向右连续取数字,以3个数为一

3、组,碰到右边限时向下错一行向左继续取,在读取时, 遇到大于500或重复的数时,将它舍弃,再继续向下取,所得样本号码如下:424, 064, 297, 074, 140, 407, 385, 075, 354, 024, 066, 352, 022, 088, 313, 500, 162, 290, 263, 253。k点评实施简单随机抽样常用的方法启:(1)抽签法;(2)随机数表法。在具体问题屮应灵活使用这两 种方法,一般总体中个体数较多时采取随机数表法,否则,采用抽签法。抽样的过程也反映了科学的工作 态度和求实的工作作风。在利用“随机数表法”进行简单随机抽样中,耍严格按照课本中介绍的步骤,否

4、 则容易出错误。2. 系统抽样的应用当总体屮的个体数较多时,采用简单随机抽样显然很费事,这时,可将总体分成均衡的几个部分,然后按 照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样。例2从2008名职工中抽取一个由20人组成的外出考察团,试适当的抽取方法及其步骤,并求出每名职工 被抽取的概率。k思维点拨由于总体中的个体较多,本题适宜采用系统抽样。系统抽样的步骤可简记为:“编号一一剔 除分段确定起始的个体号抽取样木”。本题在分段之前一定要先剔除8人,这样才能保证每 段中的样本个数相同,从而抽出的个体样本概率相等;具次在第一组屮抽取出一个个体后,后面各组中所 取的个体

5、样本编号都是间隔了 10()o【解析】(1)采用随机的方式给个体编号:1,2,-, 200& (2)剔除3个个体;(3)分段:由于2000-20 = 100,故将总体分为20个部分,其中每一部分有100个个体;(4)在第一部分随机抽取一个号码,比如 28号;(5)起始号加上各段中所含的个体数,如128, 228,,1928,与28共同组成样本。八“"十、出11 心丄 2000205每名职工被抽到的概率为: x= 。2008 2000 502k点评11值得说明的是,系统抽样中,剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽 样有密切联系,也从而可知系统抽样是等概率抽

6、样,即每个个体被抽到的概率都是样本容量与总体小的个 体数之比。3分层抽样的应用当已知总体由差杲明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然 后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。例3 个地区共有5个乡镇30000人,其人口比例为3:2:523。要从这30000人小抽取300个进行癌症发病分析。已知癌症与不同地理位置及其水十有关,问应用什么样的抽样方法,并写出具体过程。k思维点拨各乡镇的地理位置及水土影响癌症发病率,因而不同乡镇的发病情况差异明显,比较符合分 层抽样的特征。在分层抽样过程中,每个个体被抽取的概率是相等的,体

7、现了分层抽样的公平性。分层抽 样的步骤:“分层按比例确定各层抽収个体的个数一一各层进行随机抽样一一汇合成样本”。【解析】本题采取分层抽样,具体步骤:将30000人分成5层,其屮一个乡镇为一层;按照样本容量 与总体容最的比例及各乡镇的人i丨比例随机抽取各乡镇应抽取的样札通过计算,易知各乡镇应抽的样本 数分别为60, 40, 100, 40, 60;将这300人组到一起,即得到一组样本。k点评分层抽样要将相近一类归入一层,不同类归于不同层,所以又称类型抽样。分层抽样所取得的样 本更具代表性,更能反映总体情况。分层抽样吋,山于各部分抽取的个体数与这一部分个体数的比等于样 本容量与总体的个体数的比,所

8、以分层抽样也是等概率抽样。4.样本频率分布的应用样木中所冇数据(或者数据组)的频数和样本容量的比,就是该数据的频率。所冇数据(或者数据组)的 频率的分布变化规律叫做样木频率分布,可以用样木频率分布表,样木频率分布条形图或者频率分布肓方 图等来表示。由于总体分如通常不易知道,我们往往用样本的频率分布去估计总体分布。-般地,样本容 量越大,估计就越精确。例4对某电了元件进行寿命追踪调杳,情况如下:寿命(h)1002002003003()0 400400500500600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电了元件寿命在100h400h以内的概率;(4)

9、估计电子元件寿命在400h以上的概率;(5)估计总体的数学期望。k思维点拨h木例从某一总体中抽出了容量为200的样木,并给出各段上的频数,通过计算可得出相应的 概率,并且能求出某一数值区间上的概率。因此,对样木频率分布研究的结果就近似反映了总体分布的情 况。解决总体分布估计问题的一般程序为:当总体中所取不同的数值较少时,常用条形图表示相应样本的 频率分布,否则,常用频率分布直方图表示相应样本的频率分布,具体步骤为:先确定分纽的纽数(最大数据与最小数据之差除组距得组数);分别计算各组的频数及频率(频率=频数);画出频率分布寿命(h)频数频率100200200. 10200300300. 1530

10、0400800. 40400500400. 20500600300. 15合计2001(2)频率分布直方图直方图并作出相应的估计。【解析】(!)样本频率分布表如下:(3)由频率分布表可以看出,寿命在100h400h的电子元件出现的频率为0. 10+0. 15+0. 40二0.65,所以 我们估计电子元件寿命在100h400h的概率为0. 65o(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0. 20+0.15=0. 35,故我们估计电子元 件寿命在400h以上的概率为0. 35。(5)样本的期望值为100+20° xoo * 200+300 % °5 +

11、300+400 % ° 上。十 400+500 % ° 卫。十 500+600 % °§ = 365。22 2 2 2所以,我们估计总体生产的电子元件寿命的期望值为365h»k点评本例主要考查了用样本的频率分布来估计总体分布的方法和过程,以及频率分布表、条形图和直 方图等知识。这里要注意频率分布条形图和频率分布直方图是两个不同的概念,虽然它们的横轴表示的内 容是相同的,但是频率分布条形图的纵轴(炬形的高)表示频率;频率分布肓方图的纵轴(矩形的高)表 示频率与组距的比值,其相应组距上的频率等于该上的矩形的面积。5正态分布及其性质的应用若随机变最占

12、的总体密度曲线就是或近似地是以下函数的图象:f(x) = e 2/,兀丘(七,+00)。其 2兀<7中“,ct(ct>0)是参数,分別表示总体的平均数和标准差,那么这个总体分布叫做正态分布,常记作n(“q2),它的图像称为正态曲线。例5若公共汽车的高度是按照保证成年男子与车门顶部碰头的概率在1%以下设计的,如果某地成年男子 的身高§2(175,6?)(单位:cm),则该地公共汽车门的高度应设计为多高?k思维点拨这是一个实际问题,只要通过数学建模,就可以知道其木质就是一个“正态分布下求随机变 量在某一范围内取值的概率”的问题。本题中碰头的概率是指成年男子身高“大于或等于”车

13、门高度的概 率,要转化为“小于”后,才可杏表。一般地,在解决正态总体的有关问题时,应首先把这个正态总体化 成标准正态总体。【解析】设该地公共汽车门的高度应设计高为xcm,则根据题意可知:p>x)<% ,由于x _ 175v- _ 175歹 /v(175,62),所以,p>x) = -p<x) = 1 一()<0.01,也即:0)()>0.99。6 6y-175通过查表可知:- >2.33,解得:x> 188.98 o即该地公共汽车门至少应设计为189 cm高。6k点评u这类问题最容易犯的错误是没有转化成标准正态分布就直接求解。另外,若碰到负值的标

14、准正态分布还需转化为非负值的标准正态分布表达式,即(-兀)=1-(兀),从而才可查表。正态分布是最常见、应用最广泛的一种分布,人的身高、体重、学生的学习成绩、产品的尺寸规格等一般均服从正态分布,学 习时要特别注重正态分布在现实生活中的广泛应用。6.线性回归分析的应用般地,设x和y是具有相关关系的两个变量,且对应于斤个观测值的z?个点大致分布在一条直线的附近。若设所求的直线方程为y = bx-a,“_n工(兀 _切(”一刃工兀开_财歹b= =£(兀一"x-nxi=l/=!o我们将这个方程叫做回a = y-bx归直线方程,相应的直线叫做回归直线,而对两个变量所进行的上述统计分析

15、叫做线性回归分析。 例6某种花卉的开花期与温度显著相关,为了控制花卉的开花期,作了 10次试验,数据如下:编号12345678910温度x°c20252122232718151410开花期y x33152526241835404150(1) 求x, y的相关系数r ,并进行相关性检验;(2) 若将花卉开花期控制在45天左右,问养花的温度应控制在多少度?k思维点拨在解具体问题的过程中,通常是先进行相关性检验,通过检验确认两个变屋具冇线性相关关 系后,再求其冋归直线方程,否则,所求的线性冋归方程是无意义的。【解析】(1) r =打/=!-nx2)(tx21=1=-0.9786,得斤2 = 8 ,心 05 = 0-632。r乙05,即花卉的开花期与温度之间存在和关关系。” 工i-心(2)由b= = -2.0459 ,工兀2 -nx"/=!成= 70.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论