




已阅读5页,还剩93页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中南大学数学公共课统计,郭孔华电话:1387313273电子邮件:郭孔华中南大学数学科学与计算技术学院,变量函数分布等。然而,对于实际问题,随机变量的概率分布通常是未知的。如何确定随机变量的概率分布或数值特征是数理统计要解决的问题。在概率论中,我们研究的随机变量及其分布是假定已知的。在此前提下,我们研究了它的性质、特征和规律,如发现它的数值特征,讨论随机性,而数理统计是数学中内容非常丰富的一个分支。它既有严格的理论,又有极其广泛的应用。而且,随着科学技术的发展,其研究内容不断丰富和完善。数理统计的基本概念从历史书上不难发现许多关于货币和粮食、家庭账户、地震、洪水等的记录,这表明人们很早就开始了统计工作。然而,当时的统计数据只是相关事实的简单记录和排列,在某些理论的指导下,没有超出这些数据范围的推论。到19世纪末20世纪初,随着现代数学和概率论的发展,数理统计学科真正诞生了。数理统计是一门应用性很强的学科。它研究如何有效地收集、整理和分析随机数据,以便对所调查的问题做出推论和预测,直到为某些决策和行动提供依据和建议。注:我们只允许对随机现象进行一些观察试验,也就是说,我们所获得的只是局部观察数据。得出准确可靠的结论。一般来说,数理统计可以分为两类:一类是如何科学地安排测试,这一部分称为描述性统计,如测试设计和抽样方法。二是研究如何对获得的随机数据进行分析,对研究的问题进行科学合理的估计和推理,尽可能为决策提供依据。这一部分的内容称为推理统计,如参数估计、假设、检验等。我们主要讨论一些关于推理统计的最基本的问题。获取有效的随机数据。为了获得有代表性的观察值,对随机现象进行了观察和测试,并对获得的观察值进行了整理和分析,以进行推断和决策,从而找出研究对象的规律性、参数估计(第6章)、假设检验(第7章)、回归分析(第8章)、方差分析(第8章)、推断统计、等。在对100个样本进行强度测试后,他们面临以下问题:例如,一家工厂生产一种合金材料,其是通过随机方法选择的。1.这种合金材料的平均强度是多少?(参数的点估计)2。平均强度是多少?(参数的区间估计)3。如果规定的平均强度不小于某一值,该批材料是否合格?(参数假设检验)4。这些合金的强度服从正态分布吗?如果这批材料是通过两种不同的工艺生产的,不同的工艺会影响合金的强度吗?如果是这样,哪种工艺的生产强度更高?如果这批合金是由几种不同比例的原料组成的,那么这批合金的强度与原料比例之间的关系如何表达呢?(回归分析问题),我们依次讨论参数的点估计、区间估计和假设检验。首先我们将讨论数理统计中的一些基本概念。第五章数理统计中的样本及其分布我们研究的随机变量的分布通常是未知的。我们通过重复的独立实验和随机变量的观测获得数据,利用实际观测数据研究随机变量的分布,并估计和推断它们的分布函数和数字特征。本章作为数理统计的基础,研究人口、样本、统计和抽样分布等概念。以及正态总体的重要抽样分布定理.嘿。5.1简单随机样本.能力有限的人口称为有限人口,人口统计问题总是有其明确的研究对象。1.人口,整个研究对象被称为人口(矩阵),而人口中的每一个对象都被称为个体。研究一批灯泡的质量、人口,并检查国产汽车的质量、人口和样本。然而,在统计研究中,人们只关心每个个体的一个(或几个)量化指标以及量化指标在人群中的分布。这批灯泡的整个寿命就是人口,灯泡的寿命、每公里的油耗以及所有家用汽车每公里的油耗就是人口。此时,每个个体拥有的数量指标的总数就是人口。人口中包含的个体数称为总容量,总容量是无限的。当个体数量很大时,有限总体通常被认为是无限总体。然后,总体可以用描述其寿命的随机变量x或其分布函数F(x)来表示。因此,在理论上,人口可以等同于概率分布。概率分布是描述这种集体属性的最合适的工具。统计学的任务是根据从人口中提取的样本推断人口的性质。因为我们关心的是人口中的一些个人指数(例如人的身高和体重,灯泡的寿命),另一方面,例如,在研究一批灯泡的寿命时,所关心的数量指数是寿命,而所谓的一般性质只不过是这些指数值的集合性质。我们用X和Y分别表示身高和体重,那么一般可以用二维随机变量(X,Y)或它们的联合分布函数F(x,Y)来表示。一般概念的要点是:一般是一个概率分布。例如,在研究某一地区中学生的营养状况时,关注的量化指标是身高和体重、当x是离散的时,x的概率函数(分布列表)是总体概率函数。当x是连续的时,x的概率密度被称为总密度的函数。当人口分布为指数分布时,称为指数分布人口。当人口分布为正态分布时,称为正态分布人口或简称正态人口。例如,这个城市一个家庭的月收入x是一个随机变量。在数理统计中,x服从什么总是未知的。有足够的理由相信人口x服从某种类型的分布,但是这种分布的参数仍然是未知的。分配事先不清楚。根据数据,我们可以确定,即使如此,取什么值仍然未知。由于种群X的分布是未知的,X的数值特征,如均值和方差,通常是未知的。对于这些未知数,可以从相关数据中推断出数值。在破坏性试验中,不允许检查整个人群。不可能检查工厂生产的灯泡的寿命,某种手机的质量,以及吸烟和肺癌之间的关系。在实际问题中,检查整个人口需要太多的资源和时间。有些坏了。2.样品和简单样品。样本中包含的个体数量称为样本大小。然而,一旦采集了一组样本,n个特定的数字x1、x2,xn。根据某些规则,从群体中抽取几个个体进行观察测试,以获得关于群体的信息。为了推断人口分布和各种特征,从家用汽车中抽取5辆汽车进行油耗测试。样本大小是5,样本是一个随机变量,哪5辆车是随机抽取的!带有c的样品它要求采样样本x1,x2,xn满足以下两点:这可以由n个独立的随机变量x1,x2,xn,它们以与人口相同的方式分布。2.代表性:Xi (I=1,2,为了使抽样样本能很好地反映总体信息,必须考虑抽样方法。最常用的抽样方法叫做简单随机抽样,而1。独立性:x1,x2,xn是独立的随机变量;抽样的目的是对人口进行统计推断。从简单随机抽样中获得的样本称为简单随机样本。将来,当提到“x1”时,xn是取自一个总体的样本”,除非另有说明,它指的是简单的随机样本。其简单随机样本的联合分布函数是,f (x1,x2,xn)=f (x1) f (x2).f (xn)。简单随机抽样是应用中最常见的情况。如果总体x的分布函数是f(x),并且如果总体x的概率密度是F(x),则它的简单随机样本的联合概率密度是、求样本的概率分布(X1,X2,X3)。ex1。设置种群XB(1,p),即p (x=x)=px (1-p) 1-x,x=0,1。将X1,X2,X3设置为x的一个样本,溶液,xi=0,1;I=1,2,3。 (X1,x2,X3)分布律,P(X1=x1,X2=x2,X3=x3),和 x1 x2x3=0,1,2,3,p (x1=x1,x2=x2,x3=x3),k=0,1,2,3。嘿。ex2。假设总体x服从平均为1/2的指数分布,x1,x2,x3,x4是来自x的样本,求出X1,X2,X3,X4的联合概率密度和联合分布函数。解:x的概率密度是,它的分布函数是,那么X1,X2,X3,X4的联合概率密度是:例如,我们从某一类大学生中抽取10名学生测量他们的身高,得到10个数字。我们只能观察随机变量取的值,而看不到随机变量。它们是由样本而不是样本获取的值。3.人口、样本、样本值、人口之间的关系(理论分布)?统计是为了从现有数据中推断总体情况总体分布的性质样本值。总体分布决定了样本值的概率规律,即样本取样本值的规律。事实上,我们在取样后得到的数据都是具体而明确的数值。因此,总体情况可以从样本值中推断出来。它是种群的代表,包含了种群的信息,是分散而复杂的,而样本是连接两者的桥梁,其中已知的和未知的,被称为g (x1,xn)是一个统计数据。一个有效的方法是构造一些样本的函数。如果样本函数g (x1,xn)不包含任何未知参数,样本值用于推断整体情况,而样本值需要“处理”。1.统计学,这个量,不包含任何未知参数,完全由样本决定,称为统计量。样本中包含的信息(在某个方面)是通过样本函数收集的。定义x1,x2,xn是一个容量为n的样本,来自总体x。假设X1,X2,X3是从正常人群x-2中抽取的一个样本,并询问下列哪个样本函数是统计量,哪个不是?我们主要研究两种基本统计量:样本矩和序列统计量,2种统计量,以及几种常见的统计量,样本均值和样本方差,它们反映了总体均值的信息,总体均值反映了总体方差的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体K阶矩的信息和总体K阶中心矩的信息,以及它们相应的观测值和样本标准差,它反映了总体标准差的信息,k=1,2,还有:样本均值、样本方差、样本标准差、样本K阶原点矩、样本K阶中心矩。10个样本矩,统称为样本矩,统计的重要性质,集合X1,X2,Xn是来自总体x的容量为n的样本。如果x预期Ex=和方差DX=2,则为Ex3。=、(1)、E (S2)?=2,(2),=2/n;序列统计和范围被假设为样本,并且是样本值,当这些值被定义为r v时,它们被称为统计和序列统计,其中,被称为范围、总体、s当总体的分布函数已知时,抽样分布是确定的,但一般很难获得统计量的准确分布。本节介绍正常人群中几种常用统计数据的分布。在未来,我们将看到这些分布在数理统计中有着重要的应用。(1)正态分布,然后,特别是,然后,如果,如果,如果,(2)伽马分布(分布)。如果连续随机变量x的密度函数是一个函数,那么x服从参数为,的分布,并表示为x (,)。定义,其中,该函数具有以下性质:设x (,),可以证明对于任意整数k,为了讨论正态总体下的抽样分布,首先介绍了正态分布统计量中的三个重要分布,即分布、分布和分布。1.如果分布被设置为来自总体的样本,则统计量(1)被称为服从具有自由度的分布,其被表示为、和。这里,自由度指的是公式(1)右端包含独立变量个数和分布概率密度的图,如图5-1所示。(2),图5-1,这个结论可以概括如下:建立和相互独立的,可加性的分布,(略加证明),然后,建立一个简单的随机样本的总体,试图确定C和D,以便解决容易获得和N可以获得。它们彼此独立,由2分布的定义可知,因此,c=1/3,d=1/2,n=2。如果,那么,存在分布的数学期望和方差,因为,因此,再次,那么,点被称为分布的上面的子点,并且分布的子点被定义为具有给定的分布函数,如果存在,(6),当存在密度函数时,等式(6)可以被写成,(7),并且上面定义的分布的上面的子点是,(8),如图5-2所示,不同上部子点的值被制成表格并可以使用(见表5)。例如,对于,但该表仅详细显示,费希尔已经证明,当它足够大时,大约有(9)个上面的子站点,其中正态分布是标准的。通过使用等式(8),可以获得当时分布的上分位数的近似值,例如,从等式(9)(从更详细的表格获得),2,分布,集合,和独立,服从自由度的分布,并且被记录为,该分布也称为学生分布,并且该分布的概率密度函数是,(11),的。图5-3的点、是分布的上分位数。(见图6-6),轨迹的分布,对于给定的,表示满足条件,(13),图6-6,从轨迹的分布定义和图形的对称性,当,对于常用值,用正态近似,(14)时,轨迹的分布可以在表4中找到。(15),的概率密度。3.分布表示为(16),是(17),图5-4中绘制的图表。从定义来看,如果(18),图5-4,分布的点满足给定名称的条件,(19),(19)的点是分布的上点(图5-5),图5-5,很容易证明方程:(20),使用这个方程,查找附录表,你可以计算时间的值,例如,F分布的上分位数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 承包装修木工合同3篇
- 食堂托管管理合同营养健康方面的补充协议3篇
- 绿化合伙人协议书5篇
- 合作合同范本哪里卖
- 委托加工油合同范本
- 合同范本开头怎么写
- 场地出租合同书范文3篇
- 钢材买卖中介合同范本
- 超市商品经销合同范本
- 代理信息咨询合同范本
- 砂石料供应、运输、售后服务方案-1
- BYK色差仪使用方法简介
- 文献检索与科技论文写作入门-第2章
- 无损探伤工(技师、高级技师)技能鉴定考试题库大全-下(多选、判断题汇总)
- 大陆与台湾《建筑抗震设计规范》的比较
- 辩论赛PPT模板模板
- 陶瓷材料基础-陶瓷力学性能-课件
- 开展VIP商务旅客服务的项目策划书
- 广东省封开县金装神梧黄金开采有限公司金矿矿山地质环境保护与土地复垦方案评审意见
- 一年级下册竖式计算题大全
- 大学英语六级(CET-6)试卷模拟真题及答案
评论
0/150
提交评论