概率第十八讲51课件_第1页
概率第十八讲51课件_第2页
概率第十八讲51课件_第3页
概率第十八讲51课件_第4页
概率第十八讲51课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

二、总体与样本三、样本函数与统计量第十八讲样本及样本函数一、数理统计简介二、总体与样本三、样本函数与统计量第十八讲

数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计学是一门应用性很强的学科.它是研究怎样以有效

概率论与数理统计是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象.

但在研究问题的方法上有很大区别:

概率论

——已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;

数理统计

——通过对试验数据的统计分析,寻找所服从的分布和数字特征,从而推断总体的规律性.

数理统计的核心问题——由样本推断总体

一、

数理统计简介

数理统计所要解决的问题:对随机现象进行适当的合理的观测,取得数据,再根据观测数据分析、推断随机现象的统计规律。2.数理统计的基本内容采集样本统计推断1.什么是数理统计一、数理统计简介数理统计所要解决的问题:对随一个统计问题总有它明确的研究对象.1.总体…研究某批灯泡的寿命研究对象的全体称为总体(母体),总体中每个成员称为个体.总体二、总体与样本一个统计问题总有它明确的研究对象.1.总体…研究某批灯泡的然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体然而在统计研究中,人们关心总体仅仅是关心其每个个体的一总体可以用一个随机变量及其分布来描述.常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).

统计中,总体这个概念的要旨是:总体就是一个随机变量.总体可以用一个随机变量及其分布来描述.常用随机变量的记号或

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为

“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.2.

样本从国产轿车中抽5辆进行耗油量试验样本容量为5为推断总体分布及各种特征,按一定规则从总体中抽取若但是,一旦取定一组样本,得到的是n个具体的数(x1,x2,…,xn),称为样本的一次观测值,简称样本值.样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).但是,一旦取定一组样本,得到的是n个具体的数(x1,2.独立性:

X1,X2,…,Xn是相互独立的随机变量.由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1.

代表性:

X1,X2,…,Xn中每一个与所考察的总体有相同的分布.2.独立性:X1,X2,…,Xn是相互独立的随机变量.

简单随机样本:X1,X2,…,Xn相互独立,且与总体X同分布.

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.简单随机样本:X1,X2,…,Xn相互独立,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.

总体、样本、样本值的关系事实上我们抽样后得到的资料都是具体的、确定的值.如我们从总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.样本是联系二者的桥梁总体(理论分布)样本样本值统计是从手中已有的资料--4.总体X的分布函数与密度

在概率论中,随机变量的分布往往是知道的,通过某些已知的信息计算另一些信息.

而在实际中,经常是有一个我们关心的总体X,

我们既不知道它的分布,也不知道它的数学期望和方差.

但是,我们可以对其进行反复地试验,则试验n次,得到n个样本值,这n个样本值可以看作是对n个与总体分布相同的样本进行观察而获得的.4.总体X的分布函数与密度在概率论中,随机变量的分布往往数理统计的问题是,怎样在获得了这些试验数据之后,能够对总体X的某些信息获得一些估计?获得一些知识?分为两类,一类是对总体的分布进行一些统计.而另一类则是对总体的一些数字特征值,经常是数学期望和方差进行一些统计.数理统计的问题是,怎样在获得了这些试验数据之后,能够对总

研究总体X的分布密度,通常用频率直方图进行描述它通常是把数据的值域分成若干相等的区间,于是数据就按区间分成若干组,在每个区间上作一个小矩形:1.小矩形的面积=该组的频率.2.所有的小长方形的面积之和=1.

于是(1).总体X的密度(直方图)研究总体X的分布密度,通常用频率直方图进行描述它例1

我们来研究患某种疾病21岁∽44岁男子的血压(收缩压,以mm-Hg计)这一总体X.为此抽查了63个男子,测得如下表中所列的数据.1001301201381101101151341201221101201151621301301101471221201311101381241221261201301421101281201241101191321251311171121481081071171211301191211321181261179811512314112914012096141106114例1我们来研究患某种疾病21岁∽44岁男子的血压10013作图过程1.求最大值、最小值,并求极差.从表格上看最大值为162,最小值为96,极差R=162-96.2.分组、定组距.分组没有一定的通用原则,通常与数据个数n有关,取左右为佳.分组数m确定后,可按来确定组距d

本例中,将数据分成8组,组距为10(为方便起见).3.定分点、定区间.为方便起见(即和我们定的组距相符合),取起点为a=90.5,b=170.5.从而得到的作图区间为I=[90.5,170.5],可保证所有数据均在此区间内.注意,我们取的各小区间的端点坐标常比表中数据的精度高一位,以免数据落在区间的端点上.作图过程1.求最大值、最小值,并求极差.从表格上看最大值为1分组频数频率90.5~100.530.048100.5~110.5100.159110.5~120.5180.286120.5~130.5180.286130.5~140.580.127140.5~150.550.079150.5~160.500160.5~170.510.0154.样本值落入各组的频数和频率如下:分组频数频率90.5~100.530.048100.5~1190.5

110.5

130.5

150.5

170.55.作频率直方图:90.5110.5130.5演示:用SAS软件做直方图演示:用SAS软件做直方图从总体X中抽取容量为n的样本,得到如下结果(2).总体X的分布函数定义样本分布函数:

Fn(x)=fn(X≤x)

样本分布函数Fn(x)是事件“X≤x”的频率.样本分布函数从总体X中抽取容量为n的样本,得到如下结果(2).总体X的例1设总体X具有一个样本值1,2,3,则样本分布函数F3(x)为0,x<1,观测值xi频率fn(x)123例1设总体X具有一个样本值1,2,3,则样本分布函数0,例2设总体X具有一个样本值1,1,2,则样本分布函数F3(x)为例2设总体X具有一个样本值1,1,2,则样本分布函数F3(x

由样本去推断总体情况,需要对样本进行“加工”,构造一些样本的函数g(X1,X2,…,Xn).1.统计量

这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.三、样本函数与统计量由样本去推断总体情况,需要对样本进行“加工”,构造是不是例3是不是例3

2.几个常见统计量样本均值样本方差它反映了总体均值的信息它反映了总体方差的信息样本标准差其观察值2.几个常见统计量样本均值样本方差它反映了总体均值的信息样本k阶原点矩样本k阶中心矩

k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息其观测值样本k阶原点矩样本k阶中心矩k=1,2,…它反映了总体k解:

将计算器置于统计状态;输入数据.

解:将计算器置于统计状态;输入数据.解:

将计算器置于统计状态;输入数据.

(1)打开计算器;(2)MODE

2进入统计SD状态;(3)按DATA

DATA键可输入两次同样的数据。(4)输入14次0时,可按0

SHIFT;14

DATA键。(5)需要删除刚输入的数据时,可按SHIFT

CL键。解:将计算器置于统计状态;输入数据.作业作业二、总体与样本三、样本函数与统计量第十八讲样本及样本函数一、数理统计简介二、总体与样本三、样本函数与统计量第十八讲

数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计学是一门应用性很强的学科.它是研究怎样以有效

概率论与数理统计是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象.

但在研究问题的方法上有很大区别:

概率论

——已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;

数理统计

——通过对试验数据的统计分析,寻找所服从的分布和数字特征,从而推断总体的规律性.

数理统计的核心问题——由样本推断总体

一、

数理统计简介

数理统计所要解决的问题:对随机现象进行适当的合理的观测,取得数据,再根据观测数据分析、推断随机现象的统计规律。2.数理统计的基本内容采集样本统计推断1.什么是数理统计一、数理统计简介数理统计所要解决的问题:对随一个统计问题总有它明确的研究对象.1.总体…研究某批灯泡的寿命研究对象的全体称为总体(母体),总体中每个成员称为个体.总体二、总体与样本一个统计问题总有它明确的研究对象.1.总体…研究某批灯泡的然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体然而在统计研究中,人们关心总体仅仅是关心其每个个体的一总体可以用一个随机变量及其分布来描述.常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).

统计中,总体这个概念的要旨是:总体就是一个随机变量.总体可以用一个随机变量及其分布来描述.常用随机变量的记号或

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为

“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.2.

样本从国产轿车中抽5辆进行耗油量试验样本容量为5为推断总体分布及各种特征,按一定规则从总体中抽取若但是,一旦取定一组样本,得到的是n个具体的数(x1,x2,…,xn),称为样本的一次观测值,简称样本值.样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).但是,一旦取定一组样本,得到的是n个具体的数(x1,2.独立性:

X1,X2,…,Xn是相互独立的随机变量.由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1.

代表性:

X1,X2,…,Xn中每一个与所考察的总体有相同的分布.2.独立性:X1,X2,…,Xn是相互独立的随机变量.

简单随机样本:X1,X2,…,Xn相互独立,且与总体X同分布.

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.简单随机样本:X1,X2,…,Xn相互独立,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.

总体、样本、样本值的关系事实上我们抽样后得到的资料都是具体的、确定的值.如我们从总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.样本是联系二者的桥梁总体(理论分布)样本样本值统计是从手中已有的资料--4.总体X的分布函数与密度

在概率论中,随机变量的分布往往是知道的,通过某些已知的信息计算另一些信息.

而在实际中,经常是有一个我们关心的总体X,

我们既不知道它的分布,也不知道它的数学期望和方差.

但是,我们可以对其进行反复地试验,则试验n次,得到n个样本值,这n个样本值可以看作是对n个与总体分布相同的样本进行观察而获得的.4.总体X的分布函数与密度在概率论中,随机变量的分布往往数理统计的问题是,怎样在获得了这些试验数据之后,能够对总体X的某些信息获得一些估计?获得一些知识?分为两类,一类是对总体的分布进行一些统计.而另一类则是对总体的一些数字特征值,经常是数学期望和方差进行一些统计.数理统计的问题是,怎样在获得了这些试验数据之后,能够对总

研究总体X的分布密度,通常用频率直方图进行描述它通常是把数据的值域分成若干相等的区间,于是数据就按区间分成若干组,在每个区间上作一个小矩形:1.小矩形的面积=该组的频率.2.所有的小长方形的面积之和=1.

于是(1).总体X的密度(直方图)研究总体X的分布密度,通常用频率直方图进行描述它例1

我们来研究患某种疾病21岁∽44岁男子的血压(收缩压,以mm-Hg计)这一总体X.为此抽查了63个男子,测得如下表中所列的数据.1001301201381101101151341201221101201151621301301101471221201311101381241221261201301421101281201241101191321251311171121481081071171211301191211321181261179811512314112914012096141106114例1我们来研究患某种疾病21岁∽44岁男子的血压10013作图过程1.求最大值、最小值,并求极差.从表格上看最大值为162,最小值为96,极差R=162-96.2.分组、定组距.分组没有一定的通用原则,通常与数据个数n有关,取左右为佳.分组数m确定后,可按来确定组距d

本例中,将数据分成8组,组距为10(为方便起见).3.定分点、定区间.为方便起见(即和我们定的组距相符合),取起点为a=90.5,b=170.5.从而得到的作图区间为I=[90.5,170.5],可保证所有数据均在此区间内.注意,我们取的各小区间的端点坐标常比表中数据的精度高一位,以免数据落在区间的端点上.作图过程1.求最大值、最小值,并求极差.从表格上看最大值为1分组频数频率90.5~100.530.048100.5~110.5100.159110.5~120.5180.286120.5~130.5180.286130.5~140.580.127140.5~150.550.079150.5~160.500160.5~170.510.0154.样本值落入各组的频数和频率如下:分组频数频率90.5~100.530.048100.5~1190.5

110.5

130.5

150.5

170.55.作频率直方图:90.5110.5130.5演示:用SAS软件做直方图演示:用SAS软件做直方图从总体X中抽取容量为n的样本,得到如下结果(2).总体X的分布函数定义样本分布函数:

Fn(x)=fn(X≤x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论