三3-1数理统计基础.ppt_第1页
三3-1数理统计基础.ppt_第2页
三3-1数理统计基础.ppt_第3页
三3-1数理统计基础.ppt_第4页
三3-1数理统计基础.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 数理统计基础,1 总体与样本,1.1 总体与个体 在数理统计学中,我们把由全部研究对象所组成的集合称为总体,而把组成总体的每一个对象称为个体。,总体是某一个具有确定概率分布的随机变量。一般也用大写字母X,Y,Z等表示。 我们把由从总体X中随机抽取出的n个个体 所组成的集合称为样本,记作( )。样本中所含的个体数目称为样本容量。,样本具有以下两个特征: 和总体X具有相同的分布, 是一组相互独立的随机变量。 统计学上,往往把具有以上特征的样本称为简单随机样本,当一次抽样完以后,样本( )得到相应的一组观察值( ),我们把它称为样本值。,1.2 样本函数与统计量,1.统计量定义 定义 设 是从总体X中抽出的一个样本,若 是定义在样本空间上不含任何未知参数的一个单值函数,则称 为统计量。,2 样本均值与样本方差,2.1 样本均 1.样本均值 设 为总体X的样本,测得样本值为 ,称统计量 为样本均值 。,例1 某省在全国数学高考中,随机地抽取11份卷子,他们的成绩分别为: 79,62,84,90,91,71,76,83,98,77,78, 试求样本均值 。,例2 从一批电子元件中随机抽取6个,测得其长度,得到数据(单位:cm): 144.2,144.5,144.1,143.1,143.5,143.8 求样本均值 。,在计算 的样本均值时,若 中有相同的值,就可以合并计算,假设不同的只有k各值,即 ,并 且 出现了 次,则,加权平均数,给出一组数据 ,再给出一组正数 ,这里 , 则 为 的加权平均数, 为 相应的权。,例3 (补) 48名学生数学分数的情况如下表: 分数- 人数 分数- 人数 分数- 人数 45 - 1 65 - 3 85 - 7 50 - 2 70 - 8 90 - 5 55 - 0 75 - 7 95 - 6 60 - 2 80 - 7 求其平均数。,2.2 样本方差,设 为总体X的样本,测得样本值为 ,则称 及 为样本方差及样本标准差,例3 设用测温仪对某物体的温度测温了5次,其样本值为: (单位:C) 1250,1265,1245,1260,1275, 求:1)样本方差; 2)样本标准差。,例3(补) 求上面补充题的样本方差和样本标准差。,3 众数与中位数,3.1 众数 在一组数据中,出现次数最多的一个数叫做这组数据的众数。 众数描述了一组数据的集中趋势。,例3(补) 求上面补充题的众数。,3.2 中位数,把一组数据按大小次序排列,处在最中间的位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。 如一组数据19,21,24,25,27 ,其中为数是 24; 又如一族数据:23,24,25,26,28,30,31,32,其中位数是25.5,例3(补) 求上面补充题的中位数。,算数平均数、中位数、众数之间的关系,算数平均数的优点: 1 .反应灵敏; 2 .严密确定; 3 .简明易懂; 4 .适合代数运算; 5 .受抽样变动的影响较小。 它主要缺点是易受两极端数值的影响。,中位数的优点: 1 .比较严密确定; 2 .简明易懂; 3 .计算简便; 4 .受抽样变动小; 5 .不受两极端数值的影响。 缺点反应不灵敏,主要适用在数据有特大或特小极端数值或个别数据不确切时,属于等级性质时。,众数的优缺点: 众数虽然简明易懂,较少受两极端数值的影响,但它不是一个良好的集中量。 他的缺点有:由于数据的编制不同,可能会得到不同的众数,所以它极不准确、极不稳定,不适合代数运算,受抽样变动较大。 众数常用在数据的粗略估计上。,其他的计算方法还有: 1 .加权平均数 , 2 .几何平均数 3 .调和平均数,例4 (补) 某年初中入学考试的语文、数学、英文成绩按比例4:3:3计入总分,如有一学生的语文为72分,数学为94分,英语为分,求该学生的总分。,例5(补) 某学生语文阅读理解能力测试分数如下表: 测试次序 1 2 3 4 5 阅读理解成绩 34.00 52.00 60.67 69.33 77.33 求其平均进步率。,例6(补) 5个学生每分钟写钢笔字分别为6个,9个,12个,12个,15个,这5个学生平均写字的速度是多少?,全距、四分位距,1. 全距R 一组数据中最大值与最小值之差为全距. 2. 四分位距QD 其中 表示25%百分位距, 表示75%百分位距;,例7 (补) 求下列数据的全距和四分位距: 25,22,29,12,40,15,14,39,37,31,33,19,17,20,35,30,四分位距简明易懂,计算简便,较少受到两极端数值的影响,比全距可靠得多。但它忽略了左右共50%数据的差异,又不适合代数运算,其应用有限。,差异系数CV,差异系数是以平均数为单位,视标准差占平均数百分比的大小来衡量差异的程度;差异系数越大,表明离散程度越大。其计算公式为 其中,例8(补) 1978年测得我国17岁学生400米跑成绩,男学生平均数为92.5秒,标准差为6.72秒,女学生平均数为117.0秒,标准差为10.60秒,试比较男女生之间的离散程度。,偏态系数,偏态系数主要描述数据分布是否呈正态分布。其计算公式为 当 ,表明分布呈对称的; 当 ,表明分布呈正偏态; 当 ,表明分布呈负偏态。,作业 P197 习题3.3 1,2,4直方图与概率密度函数,作直方图的步骤: 1)确定数据中的最大值、最小值; 2)对数据分组; 3)求出组距和组限; 4)计算频数、频率、频率密度; 5)列出有关组距、频数、频率密度等统计表; 6)制作直方图。,例1 某企业生产电子元件的长度有差异,其长度X 是随机变量,用直方图方法分析X 服从什么分布? 抽取100个样本(数据见课本P195 )。,5经验分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论