版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高等学校数学专业课程数理统计数学教研室主讲:黄新仁课程简介 概率论的特点是什么?假定随机变量的概率分布已知,以此来讨论其各种特性。一、数理统计学的任务如:概率、期望、方差、协方差、相关系数等。 实际中,如何确定随机变量的概率分布未知或数字特征?【例】确定某灯泡厂年产灯泡的次品率。灯泡的质量通常用其寿命来衡量,若规定寿命不足3000小时为次品,那么确定该厂年产灯泡的次品率可归结为求灯泡寿命X这个随机变量的概率分布函数F(x),因为当F(x)已知时,P(x3000)=F(3000)即为所求。 F(x)如何求?测量所有灯泡,确定次品率。不可行!破坏性不经济课程简介 F(x)如何求?抽测一部分灯泡如何
2、由部分来推断整体?数理统计的主要任务:上一页下一页返回研究怎样以有效的方式收集、整理和分析带有随机性的数据,对所考察的问题作出推断和预测,为决策和行动提供依据和建议.课程简介二、课程内容及学时分配第六章:样本及抽样分布理论第七章:参数估计第八章:假设检验第九章:方差分析与回归分析(9学时)(9学时)(12学时)(12学时)三、预备知识概率论、数学分析、线性代数课程简介四、数理统计发展简史上一页下一页返回英国是数理统计的发源地和研究中心,从第二次世界大战开始,美国也发展得很快,并且在生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛的应用,如教学评价、调查统计、经济评估、销售预测、质量
3、控制、天气预报、地震预报、疾病分析、产量估计等。课程简介 发展历史短; 应用性很强; 涉及领域广。(一)古典时期(19世纪前) 高斯等:误差理论,正态分布,最小二乘法与国家实施的统治有关, 描述性统计学数理统计学的萌芽期 收集数据、简单计算、作图表等;Status(国家)Statista(政治家)Statistics(统计学)课程简介课程简介这一时期的主要理论与成就:伯努利(瑞士,1654-1705)系统论证了大数定律;贝叶斯(英国,1702-1763)提出了归纳推理理论,后被发展为一种统计推断方法;棣莫佛(法国,1667-1754)发现了正态分布的密度函数,为大样本理论奠定基础;高斯(法国,
4、1667-1754)、勒让德(法国,1752-1883)在误差理论中引进正态分布,并用最小二乘法进行计算;(二)近代时期(19世纪末至二战结束)概率论的发展,工农业生产迫切需要,促使数理统计的主要分支建立,是数理统计的形成时期. 皮尔逊(英国,1857-1936)1889年,提出了矩估计理论;戈塞特(英国,1876-1937)1908年,发现了t分布和t检验法;费希尔(英国,1890-1962)1912年,推广了t检验法,发展了显著性检验及方差分析;假设检验、回归分析、方差分析等有决定其面貌的内容和理论,数理统计成为应用广泛、方法独特的一门数学学科. 课程简介(三)现代时期(二战以后)瓦你德(
5、美籍罗马尼亚,1902-1950)致力于用数学方法使统计学精确化、严密化. 计算机及其软件的应用,如EXCEL、MATLAB、SAS、SPSS推动了数理统计在理论研究和应用方面不断地向纵深发展,并产生一些新的分支和边缘性的新学科,如最优设计和非参数统计推断等。课程简介课程简介五、统计学的两大学派社会统计学&数理统计学 社会统计学派始于19世纪末,首创人物是德国的克尼斯。德国统计学家恩格尔提出的“恩格尔系数” ,英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法等,都是伟大的贡献高等学校数学专业课程数理统计样本及抽样分布第六章数学教研室本章目录6.1 随机样本6.2 箱线图和直方图6.3
6、 抽样分布上一页下一页返回6.1 随机样本6.2 箱线图和直方图6.3 抽样分布【定义1】研究的问题所涉及的对象的全体称为总体, 总体中的每个成员称为个体.一、总体与个体例如:灯泡厂年产的所有灯泡是总体,每一个灯泡是个体。【问】人们关心的是灯泡(即总体或个体)本身吗?关心的是灯泡的某个数量指标寿命!【定义2】研究对象的某项指标的全体称为总体,而把每个成员的指标称为个体.上一页下一页返回6.1 随机样本1、总体与个体的概念又如:研究2000名学生的年龄, 学生年龄的全体就构成一个总体, 每个学生的年龄就是个体. 有限总体总体所包含的个体数量是有限。 无限总体总体所包含的个体数量是无限的。对一个总
7、体,如果我们用X 表示它的数量指标,那么对不同的个体X 取不同的值。因此,如果随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.X 的分布称为总体的分布X 是一个随机变量,总体的特性是由总体的分布来刻画。因此, 常把总体和总体分布视为同义语,即以后常将X 称为总体X。有概率分布上一页下一页返回6.1 随机样本【例】考察某厂的产品质量,以0记合格品,以1记不合格品,则总体=由0或1组成的一堆数,若以 p 表示这堆数中1的比例(不合格品率),则该总体对应于一个具有参数p的(0-1)分布:该总体叫(0-1)分布总体类似还有:正态(分布)总体、指数分布总体等。2. 总体分布【定义3】从总体中抽取
8、的一部分样品称为样本,样本中个体的个数称为样本容量,样本的观察值称为样本值。二、样本例如,从一批灯泡中抽取了n个灯泡,测其寿命分别记为X1,X2,Xn, 其观察值分别为x1,x2,xn,则(X1,X2,Xn)是样本,n是样本容量,(x1,x2,xn)是样本值。上一页下一页返回6.1 随机样本【定义4】若样本X1,X2,Xn间相互独立,且与总体X具有相同的分布,则成其为简单随机样本,简称样本。 对于有限总体,采取有放回抽样。但是使用不方便。当个体总数比样本容量大得多时,在实际中可采用不放回抽样 对于无限总体,总是采用无放回抽样。三、样本的分布假设总体X具有概率密度f(x), X1,X2 ,Xn
9、为来自总体X的样本,于是它们的联合概率密度为 设总体X具有分布函数F(x), 则样本联合分布函数为上一页下一页返回6.1 随机样本本章目录6.1 随机样本6.2 箱线图和直方图6.3 抽样分布上一页下一页返回6.1 随机样本6.2 箱线图和直方图6.3 抽样分布6.2 直方图与箱线图一、直方图(histogram)横坐标表示数据,纵坐标有三种表示方法:频数、频率、频率/组距。三种直方图的差别仅在于纵轴刻度的选择,直方图形状本身并无变化。直方图又称柱状图,它是表示数据变化情况的一种主要工具。用直方图可以解析出数据的规则性,比较直观地看出数据特性的分布状态,便于判断其总体质量分布情况。【例1】6.
10、2 直方图与箱线图(1)对样本分组:组数通常在520个;(2)确定组距:组距 = (最大观测值 最小观测值)/组数;(3)确定组限:各组区间端点为a0, a1=a0+, a2=a0+2, , ak=a0+k, 形成如下的分组区间(a0, a1 , (a1, a2, , (ak-1, ak,对这84个数据(样本)进行整理,具体步骤如下:其中a0 略小于最小观测值, ak 略大于最大观测值.(4)统计样本数据落入每个区间的个数频数fi,并计算出频率fi / n.6.2 直方图与箱线图【解】取区间a0,ak=124.5,159.5,组距d=(159.5-124.5)/7=5,确定组限,数出落在各区间
11、内的数据的频数,计算出相应频率,得到下表:于是得到频率直方图如下:6.2 直方图与箱线图于是得到频率直方图如下:当n 很大时,频率直方图的外轮廓曲线接近于总体X的概率密度曲线。正态总体0.01190.04760.11910.39290.28570.10710.0357估计:51.2%的人最大头颅宽度落在区间134.5,144.5之间等。6.2 直方图与箱线图6.2 直方图与箱线图二、箱线图(Box-plot ) 箱线图也叫“盒式图”或“箱形图”,是一种用作显示一组数据分散情况资料的统计图,因其形状类似箱子而得名,它被应用于各种领域,常见于品质管理。 最适宜提供有关数据的位置和分散的参考,尤其在
12、不同的母体数据时更可表现其差异。 6.2 直方图与箱线图1、样本分位数【定义】于是有6.2 直方图与箱线图【例2】【解】6.2 直方图与箱线图2、箱线图的做法数据集的性质:6.2 直方图与箱线图【例3】【解】6.2 直方图与箱线图【例4】6.2 直方图与箱线图【解】箱线图如下图:本章目录6.1 随机样本6.2 箱线图和直方图6.3 抽样分布上一页下一页返回6.1 随机样本6.2 箱线图和直方图6.3 抽样分布6.3 抽样分布一、基本概念1、统计量的定义【定义1】 设 X1, X2, , Xn 为取自某总体的样本,若样本的函数g = g(X1, X2, , Xn)中不含有任何未知参数,则称g是一
13、个统计量,g(x1, x2, , xn)称为统计值。 、经验分布函数Fn(x)如:是统计量(值)不是统计量(值) 当, 2 未知时,x1, x1/2.几个常用统计量的定义(1)样本均值(2)样本方差其观察值设 X1, X2, , Xn 为取自某总体的样本,x1, x2, , xn是其观察值其观察值6.3 抽样分布(3)样本标准差(4)样本k 阶原点矩其观察值(5)样本k阶中心矩样本均值样本方差一阶原点矩二阶中心矩其观察值6.3 抽样分布由以上定义得下述结论:由第五章关于依概率收敛的序列的性质知矩估计法的理论6.3 抽样分布3.经验分布函数6.3 抽样分布【例1】一般地,6.3 抽样分布格里汶科
14、定理6.3 抽样分布有很多统计推断是基于正态分布的假设的,以标准正态变量为基石而构造的三个著名统计量在实际中有广泛的应用,它们被称为统计中的“三大分布” 。统计量的分布叫做“抽样分布” 。6.3 抽样分布二、常见的分布1、2 分布(卡方分布)【定义2】 设 X1, X2, Xn, 是来自总体N(0,1)的样本 ,则称统计量 2 = X12+ X22 + +Xn2 (1)服从自由度为n 的2分布,记为 2 2(n) 。指(1)中右端包含的独立变量的个数。2(n) 分布的概率密度为:6.3 抽样分布2 分布的性质性质1:设 来自正态总体则性质2:设则有分布的可加性.性质3:若 ,则有6.3 抽样分
15、布2 分布分位数(点)分位数 2(n) 可以从附表4 中查到。【定义3】 对给定的正数 (01),称满足条件 的2(n) 是自由度为n卡方分布的上 分位数(点).如:请同学们求解:28.84531.4106.3 抽样分布附表2-1根据正态分布的对称性知附表2-2【例2】6.3 抽样分布附表2-3附表4只详列到 n=45 为止.附表2-4附表2-5【例3】6.3 抽样分布例如利用上面公式,而查详表可得费舍尔(R.A.Fisher)证明:6.3 抽样分布【定义4】 对给定的正数 (01),称满足条件 的1-2(n) 是自由度为卡方分布的下1- 分位数(点).思考?6.3 抽样分布2、t 分布 【定
16、义5】 设随机变量X 与Y 独立,且X N(0,1), Y 2(n), 则称的分布为自由度为n 的t 分布,记为t t(n) 。 t 分布的密度函数为: t分布是英国统计学家戈塞特(Gosset)于1908年在一篇以“学生”(student)为笔名的论文中首先提到的,因此又称为学生分布。它在小样本实验分析中有重要应用。 6.3 抽样分布2.当n充分大时,其图形类似于标准正态变量概率密度的图形.6.3 抽样分布t 分布分位数(点)【定义6】对给定的正数 (01),若满足条件 则称 为t分布的上 分位数(点).附表2-6附表2-7【例3】6.3 抽样分布请同学们求解:1.7531若:问?求满足的6
17、.3 抽样分布3、F 分布【定义7】设X 2(m), Y 2(n), X1与X2独立,则称 是自由度为m与n的 F分布,记为F F(m, n) 。yf(y)on1=10,n2=25n1=10,n2=56.3 抽样分布【定义8】 对给定 (01) ,称满足条件P(F F(m,n) = 的F(m,n) 是自由度为m 与 n 的F 分布的上 分位数。F分布分位数(点)【例4】6.3 抽样分布定理1 设 x1, x2, xn 是来自N(, 2) 的样本,则有(上讲中已证明)(利用正交变换证明,请参看其他教材)(利用正交变换证明,请参看其他教材)推论6.3 抽样分布定理2 设 x1, x2, xn 是来
18、自N(, 2) 的样本,则有证明:由定理1及其推论知与 相互独立.从而由t分布的生成定义 知6.3 抽样分布定理3 设 x1, x2, xm 和y1, y2, yn分别来自两个相互独立的正态总体N(a1, 12) 和N(a2, 22) ,则有证明:由定理1知由于两个总体相互独立,所以 独立于是故有结论成立(一般正态变量的标准化).6.3 抽样分布定理4 设 x1, x2, xm 和y1, y2, yn分别来自两个相互独立的正态总体N(a1, 2) 和N(a2, 2) ,则有证明:由定理3知又由定理1知且 相互独立,于是6.3 抽样分布定理4 设 x1, x2, xm 和y1, y2, yn分别
19、来自两个相互独立的正态总体N(a1, 2) 和N(a2, 2) ,则有证明:(续)于是由t分布的生成定义 知结论成立.相互独立6.3 抽样分布定理5 设 x1, x2, xn 是来自N(1, 12) 的样本,y1, y2, yn 是来自N(2, 22) 的样本,且此两样本相互独立,则有特别,若12 =22 ,则因为证明:于是由F 分布的生成定义 知结论成立.6.3 抽样分布Karl.Pearson(1857-1936) 卡方分布是海尔墨特(Hermert)和皮尔逊(K.Person)分别于1875和1900年导出的。皮尔逊是英国著名统计学家,1879年毕业于剑 桥大学,1901年,他与高尔顿、
20、韦尔登创办的生物统计学杂志, 使数理统计有了自己的阵地。皮尔逊的最大贡献是在1900年发表的一篇文章中引进的拟合优度的卡方检验。不少人把这视为近代统计学的开端。关于卡方分布附录:附表2-11.645附表2-2标准正态分布表z01234567891.61.71.81.92.02.12.22.32.42.52.62.72.82.93.00.94520.95540.96410.97130.97720.98210.98610.98930.99180.99380.99530.99650.99740.99810.99870.94630.95640.96480.97190.97780.98260.98640
21、.98960.99200.99400.99550.99660.99750.99820.99900.94740.95730.96560.97260.97830.98300.98680.98980.99220.99410.99560.99670.99760.99820.99930.94840.95820.96640.97320.97880.98340.98710.99010.99250.99430.99570.99680.99770.99830.99950.94950.95910.96710.97380.97930.98380.98710.99040.99270.99450.99590.99690
22、.99770.99840.99970.95050.95990.96780.97440.97980.98420.98780.99060.99290.99460.99600.99700.99780.99840.96980.95150.96080.96860.97500.98030.98460.98810.99090.99310.99480.99610.99710.99790.99850.99980.95250.96160.96930.97560.98080.98500.98840.99110.99320.99490.99620.99720.99790.99850.99990.95350.96250
23、.97000.97620.98120.98540.98870.99130.99340.99510.99630.99730.99800.99860.99990.95450.96330.97060.97670.98170.98530.98900.99160.99360.99520.99640.99740.99810.99861.00001.96附表2-3分布表17.535=0.250.100.050.0250.010.005123456789101112131415161.3232.7734.1085.3856.6267.8419.03710.21911.38912.54913.70114.845
24、15.98417.11718.24519.3692.7064.6056.2517.7799.23610.64512.01713.36214.68415.98717.27518.54919.81220.06422.30723.5423.8415.9917.8159.48811.07112.59214.06715.50716.91918.30719.67521.02622.36223.68524.99626.2965.0247.3789.34811.14312.83314.44916.01317.53519.02320.48321.92023.33724.73626.11927.48828.845
25、6.6359.21011.34513.27715.08616.81218.47520.09021.66623.20924.72526.21727.68829.14130.57832.0007.87910.59712.83814.86016.75018.54820.27821.95523.58925.18826.75728.29929.89131.31932.80134.267=0.9950.990.9750.950.900.75123456789101112131415160.0100.0720.2070.4120.6760.9891.3441.7352.1562.6033.0743.5654
26、.0754.6015.1420.0200.1150.2970.5540.8721.2391.6462.0882.5583.0533.5714.1074.6605.2295.8120.0010.0510.2160.4840.8311.2371.6902.1802.7003.2473.8164.4045.0095.6296.2626.9080.0040.1030.3520.7111.1451.6352.1672.7333.3253.9404.5755.2265.8926.5717.2617.9620.0160.2110.5841.0641.6102.2042.8333.4904.1684.8655
27、.5786.3047.0427.7908.5479.3120.1020.5751.2131.9232.6753.4554.2555.0715.8996.7377.5848.4389.29910.16511.03711.9123.247附表2-4分布表=0.250.100.050.0250.010.0051718192021222324252627282930313220.48921.60522.71823.82824.93526.03927.14128.24129.33930.43531.52832.62033.71134.80035.88736.97324.76925.98927.20428
28、.41229.61530.81332.00733.19634.38235.56336.74137.91639.08740.25641.42242.58527.58728.86930.14431.41032.67133.92435.17236.41537.65238.88540.11341.33742.55743.77344.98546.19430.19131.52632.85234.17035.47936.78138.07639.36440.64641.92343.19444.46145.71246.97948.23249.48033.40934.80536.19137.56638.93240
29、.28941.63842.98044.31445.64246.96348.27849.58850.89252.19153.48635.71837.15638.58239.99741.40142.79644.18145.55946.92848.29049.64550.99352.33653.67255.00356.32834.382附表2-5分布表附表2-6 =0.250.100.050.0250.010.005123456789101112131415161.00000.81650.76490.74070.72670.71760.71110.70640.70270.69980.69740.69550.69380.69240.69120.69013.07771.88561.63771.53321.47591.43981.41491.39681.38301.37221.36341.35621.35021.34501.34061.33686.31382.92002.35342.13182.01501.94321.89461.85951.83311.81251.79591.78231.77091.76131.75311.745912.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.364
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 25890.2-2026轨道交通地面装置直流开关设备第2部分:直流断路器
- 护理中的护理管理与发展
- 医联体模式下医疗资源协同整合策略
- 医联体医技检查结果互认机制
- 医疗风险防控中患者反馈数据的应用策略
- 八纲辨证护理的健康教育
- 医疗资源整合
- 2025年高压用电安全培训
- 2025年餐厅食品安全培训
- 护理安全隐患排查与整改
- 卧床患者生活护理课件
- 高考生物 考前专项拔高提分练 二 必考题型二 遗传变异
- 2025年春新人教PEP版英语三年级下册全册教案
- 五年级上册数学计算题每日一练(共20天带答案)
- 2025春季开学第一课安全教育班会课件-
- 课件:《科学社会主义概论(第二版)》导论
- 雨污水管网施工危险源辨识及分析
- 供排水维修安全培训
- GB/T 44957-2024人工影响天气作业点防雷技术规范
- 污水处理工安全培训
- DB35T 1985-2021 原发性肝癌临床数据集
评论
0/150
提交评论