1抽样方法(1)简单随机抽样抽签法_第1页
1抽样方法(1)简单随机抽样抽签法_第2页
1抽样方法(1)简单随机抽样抽签法_第3页
1抽样方法(1)简单随机抽样抽签法_第4页
1抽样方法(1)简单随机抽样抽签法_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE 139 -统 计1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的主要特征是均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体中有明显差异,它们的共同点:每个个体被抽到的概率都相等,体现了抽样的客观性和平等性。如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人调查学

2、习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别采用的抽样方法:A为_,B为_。(答:分层抽样,简单随机抽样);(3)某中学有有高一学生4400人,高高二学生3000人,高三三学生3000人,现通过过分层抽样抽抽取一个容量量为n的样本本,已知每个个学生被抽到到的概率为00.2,则nn= _(答答:200);(4)容量为1100的样本本拆分成100组,前7组的频率之之和为0.79,而剩下下的三组的频频数组成等比比数列,且其其公比不为11,则剩下的的三组中频数数最大的一组组的频率是_(答:0.16);(5)用简单随随机抽样的方方法从含有110个个体的的总体中,抽抽取一个容量量为2的样本本

3、,则某一个个体“第一次被抽抽到的概率”,“第一次未被被抽到,第二二次被抽到的的概率”,“在整个抽样样过程中被抽抽到的概率”分别是_(答:);2.总体分布的的估计:用样本估计计总体,是研研究统计问题题的一个基本本思想方法,即即用样本平均均数估计总体体平均数(即即总体期望值值描述一个个总体的平均均水平);用用样本方差估估计总体方差差(方差和标标准差是描述述一个样本和和总体的波动动大小的特征征数,方差或或标准差越小小,表示这个个样本或总体体的波动越小小,即越稳定定)。一般地地,样本容量量越大,这种种估计就越精精确。总体估估计要掌握:(1)“表”(频率分布表表);(2)“图”(频率分布直直方图)。频率

4、分布直方图图的特征:(1)从频率分分布直方图可可以清楚的看看出数据分布布的总体趋势势。(2)从频率分分布直方图得得不出原始的的数据内容,把把数据表示成成直方图后,原原有的具体数数据信息就被被抹掉了。频率直方图的作作法: (1)算算数据极差 (2)决决定组距和组组数; (3)决决定分点; (4)列列频率分布表表; (5)画画频率直方图图。 提醒:直方图的纵纵轴(小矩形形的高)一般般是频率除以以组距的商(而不是频率率),横轴一一般是数据的的大小,小矩矩形的面积表表示频率。组数的决定方方法是:设数数据总数目为为n,时,分分为组;时,分为为组.如(1)一个容容量为20的的样本数据,分分组后组距与与频数

5、如下: (10,20,22;(20,30,33;(30,40,44;(40,50,55;(50,60,44;(60,70,22;则样本在在区间上的频频率为A5% B25% C50% D70%(答:D);(2)已知样本本:10 8 6 10 13 88 10 12 11 77 8 9 111 9 12 9 100 11 12 12 ,那那么频率为00.3的范围围是A5.577.5 B7.59.5 C9.5111.5 D11.513.5(答:B);(3)观察新生生儿的体重,其其频率分布直直方图如图所所示,则新生生儿的体重在在27000,30000的频率为_(答:0.3);O240027003600

6、330030003900体重(g)0.001(4)如图,是是一次数学考考试成绩的样样本频率分布布直方图(样样本容量n=200),若若成绩不低于于60分为及及格,则样本本中的及格人人数是O240027003600330030003900体重(g)0.001 分数分数频率/组距0204060801000.0180.0120.0090.0060.005(5) 有同一一型号的汽车车100辆,为了解这种种汽车每蚝油油1L所行路程程的情况,现现从中随即抽抽出10辆在在同一条件下下进行蚝油11L所行路程程实验,得到到如下样本数数据(单位:km):113.7,112.7,114.4,113.8,13.3,12

7、2.5,133.5,133.6,133.1,133.4,其分分组如下:分组频数频率12.45,12.955)12.95,13.455)13.45,13.955)13.95,14.455)合计101.0(1)完成上面面频率分布表表;(2)根据上表表,在给定坐坐标系中画出出频率分布直直线图,并根根据样本估计计总体数据落落在12.95,133.95)中中的概率;(3)根据样本本,对总体的的期望值进行行估计解:(1)频率率分布表:分组频数频率12.45,12.955)20.212.95,13.455)30.313.45,13.955)40.413.95,14.455)10.1合计101.0(2)频率分

8、布布直方图:估计总体数据落落在12.95,133.95)中中的概率为00.7(3)13.4因此,总体的期期望值进行估估计约为133.4. (6)为了了解解高一学生的的体能情况,某校抽取部部分学生进行行一分钟跳绳绳次数次测试试,将所得数数据整理后,画画出频率分布布直方图(如如图),图中中从左到右各各小长方形面面积之比为22:4:177:15:99:3,第二二小组频数为为12.90100110120130140150次数90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036若次数在1100以上(含1110次

9、)为为达标,试估估计该学校全全体高一学生生的达标率是是多少?在这次测试中,学学生跳绳次数数的中位数落落在哪个小组组内?请说明明理由。分析:在频率分分布直方图中中,各小长方方形的面积等等于相应各组组的频率,小小长方形的高高与频数成正正比,各组频频数之和等于于样本容量,频频率之和等于于1。解:(1)由于于频率分布直直方图以面积积的形式反映映了数据落在在各小组内的的频率大小,因此第二小组的的频率为:又因为频率=,所以 (2)由图可估估计该学校高高一学生的达达标率约为(3)由已知可可得各小组的的频数依次为为6,12,551,45,227,9,所所以前三组的的频数之和为为69,前四四组的频数之之和为11

10、44,所以跳绳绳次数的中位位数落在第四四小组内。3、样本平均数数: 。如有一组数据:x1,x2,xn(x1x2xn),它们的算算术平均值为为20,若去去掉其中的xxn,余下数据据的算术平均均值为18,则则xn关于n的表达式为为 (答答:)。4、样本方差:;样本标准差:。如(1)甲、乙乙两名射击运运动员参加某某大型运动会会的预选赛,他他们分别射击击了5次,成成绩如下表(单位:环)甲108999乙1010799如果甲、乙两人人中只有1人人入选,则入入选的应是 (答答:甲);(2)已知实数数的期望值为为,方差为,若,则一定定有 A B C DD与无法比较大大小(答:BB);(3)某班400人随机平均

11、均分成两组,两两组学生一次次考试的成绩绩情况如下表表: 统计量量组别平均分方差第1组8016第2组9036 则全班的平均均分为_,方方差为_(答答:85,551)提醒:若的平均均数为,方差差为,则的平均数数为,方差为为。如已知数据的平平均数,方差差,则数据的平平均数和标准准差分别为 A15,366 B22,6 C15,6 D22,366 (答答:B)5.茎叶图(1) 茎叶图图的画法: = 1 * GB3 将每个数据分分为茎(高位位)与叶(低低位)两部分分, = 2 * GB3 将最大茎和和最小茎之间间的数按大小小顺序排成一一列, = 3 * GB3 将各数据的的叶依先后次次序写在其茎茎的左(右

12、)两两侧.(2)茎叶图的的特征:()用茎叶图图表示数据有有两个优点:一是从统计计图上没有原原始数据信息息的损失,所所有数据信息息都可以从茎茎叶图中得到到;二是茎叶叶图中的数据据可以随时记记录,随时添添加,方便记记录与表示。()茎叶图只只便于表示两两位有效数字字的数据,而而且茎叶图只只方便记录两两组的数据,两两个以上的数数据虽然能够够记录,但是是没有表示两两个记录那么么直观,清晰晰。6. 独立性检检验独立性检验是检检定两个事件件间是否独立立的统计方法法,是卡方检检验的一个应应用. 卡方检验是对样样本的频数分分布所来自的的总体分布是是否服从某种种理论分布或或某种假设分分布所作的假假设检验.即根据样

13、本本的频数分布布来推断总体体的分布,卡方独立性性检验的零假假设是各事件件之间相互独独立.卡方值值永远大于零零. 2的两个临临界值分别是是3.8411,与6.6635.3.8411时,接受假假设即两事件件无关.相关系数是测定定变量之间相相关密切程度度和相关方向向的代表性指指标。相关系系数用符号“r ”表示,其其特点表现在在:参与相关关分析的两个个变量是对等等的,不分自自变量和因变变量,改变两两变量的地位位并不影响相相关系数的数数值,因此相相关系数只有有一个;相关关系数有正负负号反映相关关系数的方向向,正号反映映正相关,负负号反映负相相关; 回归和相关都是是研究两个变变量相互关系系的分析方法法。相

14、关分析析研究两个变变量之间相关关的方向和相相关的密切程程度。但是相相关分析不能能指出两变量量相互关系的的具体形式,也也无法从一个个变量的变化化来推测另一一个变量的变变化关系。回回归方程则是是通过一定的的数学方程来来反映变量之之间相互关系系的具体形式式,以便从一一个已知量来来推测另一个个未知量。为为估算预测提提供一个重要要的方法。相关性检验的步步骤是:(11)做统计假假设:x与YY不具备线性性相关关系.(2)根据据小概率0.05与查出出r的一个临临界值.(33)根据样本本相关系数公公式计算出rr的值.(44)作统计推推断:如果表表明95%的的把握认为xx与Y之间具具备线性相关关关系,如果果接受假

15、设.提醒:A与B有有关并不意味味着A的发生生必然导致BB的发生.7.回归分析回归分析是对具具有相关关系系的两个或两两个以上变量量之间数量变变化的一般关关系进行测定定,确定一个个相应的数学学表达式,以以便从一个已已知量来推测测另一个未知知量,为估计计预测提供一一个重要的方方法。在回归归分析中,由由X推算Y与与由Y推算XX的回归方程程是不同的,不不可混淆: .与相关分分析相比,回回归分析的特特点是:两个个变量是不对对等的,只能能用自变量来来估计因变量量,而不允许许由因变量来来推测自变量量,必须区分分自变量,一一般说,事物物的原因作自自变量X.回归分析和相关关分析是互相相补充、密切切联系的。相相关分

16、析需要要回归分析来来表明现象数数量相关的具具体形式,而而回归分析则则应该建立在在相关分析的的基础上。依依靠相关分析析表明现象的的数量变化具具有密切相关关,进行回归归分析求其相相关的具体形形式才有意义义。如(1)在研究究色盲与性别别的关系调查查中,调查了了男性4800人,其中有有38人患色色盲,调查的的520个女女性中6人患患色盲,(1)根据以上上的数据建立立一个22的列联表表;(2)若认为“性别与患色色盲有关系”,则出错的的概率会是多多少解:(1)患色盲不患色盲总计男38442480女6514520总计449561000 (2)假设H :“性别与患色色盲没有关系系” 先算算出K 的的观测值: 则则有 即是是H 成立立的概率不超超过0.0001, 若若认为“性别与患色色盲有关系”,则出错的的概率为0.001(2)一台机器器使用的时间间较长,但还还可以使用,它它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论