样本特征数.doc_第1页
样本特征数.doc_第2页
样本特征数.doc_第3页
样本特征数.doc_第4页
样本特征数.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 样本特征数第一节 集中位置量数【教学目的】、使学生了解集中位置量数的含义,并能正确理解。 、掌握平均数、中位数的计算方法,并能熟练运用。 3、了解什么是众数。【教学重点】平均数、中位数的计算【教学难点】对组序差的理解【导言】样本特征数 集中位置量数:反映数据集中趋势的特征数 离中位置量数:反映数据离中趋势的特征数l 集中位置量数与离中位置量数统称为样本特征数,只有当两者结合起来描述样本的特征时,才能全面地认识样本数量的特征。【教学内容】一、 平均数(算术平均数)(一)小样本资料平均数的计算(n45)、直接法: 【举例】10人肺活量()2600 3400 2700 2400 2800 3050 2950 2550 2500 3000 2、简化法(假定均数法):适用于样本变量位数多或带小数的资料。 关于 的几点说明: (1)越接近均数,计算越简单。(2)尽量选整数,若不能选整数,也要尽量选整齐的数。(二)大样本资料平均数的计算(n45) (假定均数法) 假定均数,从理论上讲,可以取任何一个常数,但为了计算方便,一般选取频数最多的那组的组中值。d 组序差(缩减值或简化后的组中值)由于等距分组(即相等), d值是有规律的, 所在组d =0,向上依次是-1,-2,-3.向下依次为1,2,3。【举例】120名18岁女孩身高如下表,求。组限 d fd1471491511531551571591611631651671691711 -6 -6 4 -5 -20 8 -4 -3211 -3 -3314 -2 -28 15 -1 -1520 160 0 0 15 1 1511 2 22 10 3 30 6 4 244 5 201 6 6120 -17 =160+ =159.7(cm) 【注意】此方法在样本含量不大时, 有一定偏差(各组的代替了 各组的实测值)随着样本含量的增大,精确度也会随着提高。【指导练习】某校150名男生60米跑成绩如下表,求组限 d fd7.5-7.8-8.1-8.4-8.7-9.0-9.3-9.6-9.9-10.2-2-4-88 -3 -24 21 -2 -4231 -1 -31 42 8.85 0 026 1 26 12 2 244 3 12 3 4 121 5 5150 -26 =8.85+ 8.80 二、中位数(一)定义:将一组数据按大小顺序排列,位置居中的数。(二)适用条件:适用于在一组变量中,大部分较集中,只有少数的甚至个别的分散在一侧的资料,它不受极端数据的影响。5人身高 153 155 156 157 179 =156cm 另5人身高 152 155 156 157 159 =160cm是描述数据集中趋势较好的指标,但因与资料中的每个变量值都有关,灵敏性较高,易受极端数据的影响,为避免极端数据的影响,最好用表示集中趋势。(三)的计算: 1、小样本资料的计算(1)n为奇数:为有序数列中第位数。(2)n为偶数:为位置居中间的两个数的均值,即有序数列中第和+1位所对应的两个数的均值。2、大样本资料的计算 L 中位数所在组的下限 f 中位数所在组的频数F 中位数所在组前一组的累计频数【注意】一般就在f最多的那组,可用n/2与F相比较而确定。【举例】120名18岁女孩身高如下表,求。组限 d fd F1471491511531551571591611631651671691711 -6 -6 1 4 -5 -20 58 -4 -32 1311 -3 -33 2414 -2 -28 3815 -1 -15 5320 160 0 0 7315 1 15 8811 2 22 9910 3 30 1096 4 24 1154 5 20 1191 6 6 120120 -17n/2=60 在159-组 =159+ =159.7(cm) 【指导练习】某年级立定跳远成绩如下表,求。组限 d fd F1.8-1.9-2.0-2.1-2.2-2.3-2.4-2.5-2.6-2.7-2.8-1 1 -5 13 4 -12 410 14 -30 1418 32 -36 3229 61 -29 6138 2.35 99 0 9925 124 25 12420 144 40 14410 154 30 1544 158 16 1582 160 10 160160 9n/2=80 在2.3-组 =2.35+(80-61)=2.35=2.35+=2.36 三、众数【介绍】定义:在一组观测值中,出现次数最多的那个数。【注意】(1)个体数目很多且呈明显的集中趋势才能确定。(2)在频数分布表中,通常把频数最多的那一组的组中值作为众数。(3)理论计算众数困难,统计实践中很少采用。四、三者的关系(数据呈正态分布) 【作业】1、P41第1、2题。2、第4、5、6题求、。 3、测得上海市某小学二年级80名男生身高数据如下表所示,求、。组限 f F115-118-121-124-127-130-133-136-139-142- 1 1 3 4 8 12 10 22 20 42 19 61 12 73 4 77 2 79 1 80 80第二节 离中位置量数【教学目的】、理解离中位置量数的含义 、熟悉掌握标准差、变异系数的区别和计算方法,并能灵活应用 【教学重点】标准差的计算方法 【教学难点】自由度的理解【导言】 两组运动员纵跳成绩(cm)如下: 甲组: 乙组: 这两组运动员的纵跳平均数均为甲=乙=62.2cm。乙组离散程度要大于甲组,用集中水平反映变量特征不完全。因此,要全面反映变量的特征,除了考察变量的平均水平外,还必须看变量的离中位置量数。集中趋势指标的代表性如何要用离散程度指标来说明:离散程度指标愈大,集中趋势指标代表性愈差;离散程度指标愈小,集中趋势指标代表性愈好。【教学内容】 一、极差(全距) 【优点】是反映离散程度一种简单的方法,可作为一种辅助指标,以便大体了解数据的扩散程度。【缺点】、由于极端值的偶然性,会影响它的可靠性和稳定性。 2、未把观察值都考虑进去,在分析资料中有很大的局限性。二、方差 离均差(每一个实测值与均数之差) n 1 自由度(能够独立自由变化的变量个数)【缺点】方差的单位与原观察值的单位不一致,如身高原来的单位是 cm ,而方差的单位就成了 cm2 ,为统一单位,方差开方便得到了。三、标准差 (一)小样本资料的计算 【举例】测得8名学生的铅球成绩如下表,求S。 7.138.108.507.107.008.156.957.5050.8465.6172.2550.4149.0066.4248.3056.25459.08 =0.61(m)(二)大样本资料的计算 【注意】当两组变量相近时:较大,说明变量值围绕的分布较广,的代表性较差。较小,说明变量值围绕的分布较密集,的代表性较好。【举例】120名18岁女孩身高如下表,求S。组限 d fd fd2 F1471491511531551571591611631651671691711 -6 -6 36 1 4 -5 -20 100 58 -4 -32 128 1311 -3 -33 99 2414 -2 -28 56 3815 -1 -15 15 5320 160 0 0 0 7315 1 15 15 8811 2 22 44 9910 3 30 90 1096 4 24 96 1154 5 20 100 1191 6 6 36 120120 -17 815 =5.23(cm)【指导练习】某校150名男生60米跑成绩如下表,求S组限 d fd fd27.5-7.8-8.1-8.4-8.7-9.0-9.3-9.6-9.9-10.2-2 -4 -8 328 -3 -24 7221 -2 -42 8431 -1 -31 3142 8.85 0 0 026 1 26 2612 2 24 484 3 12 363 4 12 481 5 5 25150 -26 402 =0.49(s)四、变异系数CV(相对离散程度指标)1、定义:标准差与均数的百分比。CV = 兼顾了与,描述了一组数据相对于的变异程度,是一个无量纲的统计量。2、适用条件:(1)单位相同但均数差异较大(如标枪、铅球)。(2)单位不同(如投掷、百米)。3、代表的意义:CV大,说明变量值的离散程度大。CV小,说明变量值的离散程度小。4、和CV的区别【相同点】都是反映变量的离散程度【不同点】只能对相同性质资料的离散程度进行比较CV能比较不同水平、不同性质的资料数据的离散程度5、计算 ( 1 )单位相同相差很大【举例】少年女子跳远前名m,m;少年女子跳高前6名的 m,m。试比较这两项成绩的离散程度。解:% = 2.11% 100% = 2.33% 跳远的离散程度小于跳高 ( 2 )单位不同【举例】某男运动员,主项为 100m,兼项为跳远,主兼项 20 次测试结果为100m:=12s ,0.15s;跳远:=5.9 m ,0.18 m 试比较主兼项成绩的稳定性。 解:100% = 1.25% 100% = 3.05% 说明该运动员100 m成绩较稳定【作业】1、P41第3题。2、第4、5题求。第三节 百分位数【教学目的】、了解百分位数的概念,掌握百分位数的计算 、熟悉百分位数在综合评价中的应用 【教学重点】 百分位数的计算及代表意义【教学难点】 如何理解百分位数【导言】集中位置量数和离中位置量数适合于数据资料呈正态分布或近似正态分布时来描述其特征。当数据资料经检验不是正态分布时,如仍然以和S来描述其特征就不合适了,此时应用百分位数。【教学内容】 一、定义:将一组数据从小到大排成有序数列,并将其100等分,每一等分处即是一个百分位,第H等分处,称第H百分位数,即。 二、适用条件:百分位数可以描述任何分布数据资料的特征。三、百分位数的计算: 所在组由nH/100来确定,其值与F相比较【举例】某年级立定跳远成绩如下表,求P5、 P15、 P50 、P75。组限 F1.8-1.9-2.0-2.1-2.2-2.3-2.4-2.5-2.6-2.7-1 11 211 13 24 3729 6639 10521 126 9 1354 1391 140140 nH/100=5140/100=7P5在2.0-组P5 = L += 2.0+2.05(m)同理:P15 = 2.1+2.13(m)P50 = 2.3+2.31(m) P75 = 2.3+=2.40(m)【总结】中位数公式是百分位数公式的一个特例,P50就是中位数 以描述样本的集中趋势,以不同百分位数来描述离散程度。【指导练习】随机抽测120名学生50m跑成绩(),如下表,分别求、。组限F F6.0-6.3-6.6-6.9-7.2-7.5-7.8-8.1- 8 815 2326 49 20 6921 9017 1078 115 5 120120 P5 = 6.0+=6.225()P10 = 6.3+=6.38()P75 = 7.2+=7.5()P90 = 7.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论