抽样和抽样分布_第1页
抽样和抽样分布_第2页
抽样和抽样分布_第3页
抽样和抽样分布_第4页
抽样和抽样分布_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章抽样和抽样分布

第一节随机事件及其概率第二节随机变量的概率分布第三节抽样分布第四节正态分布和正态逼近一.抽样二.试验三.样本空间四.事件及其概率第一节随机事件及其概率一、抽样1.概念从总体中抽取部分单位,并进行实际调查,以推断总体。2.抽样的两种方法:重置抽样和不重置抽样两种抽样方法重置抽样1.概念:也称有放回的抽样,从总体中抽取一个单位,登记后再放回总体参加下一次的抽取,连续试验n次。2.重置抽样排列数:从总体N个单位,抽取样本容量为n个单位的重置试验,可能抽取的样本点个数:不重置抽样1.概念:也称无放回的抽样,每次总体中抽取一个单位,登记后不再放回原总体,不参加下一次抽选,下一次继续从总体余下的单位抽取样本单位,这样继续进行n次试验。有n个单位的样本是由n次连续试验构成的,但因每次抽出不重置,所以实质上等同于同时从总体中抽取n个样本单位。不重置抽样排列数:

不重置抽样又分为考虑顺序和不考虑顺序的情况(排列与组合)。从10个同学中抽三个担任不同职务,有:从10个同学中抽三个考察其平均成绩,则:二、试验1.概念:在相同条件下,对事物或现象所进行的观察。例如:掷一枚骰子,观察其出现的点数;产品质量检验,考察其是否是合格品等。2.试验具有以下特点:可以在相同的条件下重复进行;每次试验的可能结果不止一个,但试验的所有可能结果在试验之前是确切知道的;在试验结束之前,不能确定该次试验的确切结果;1.基本事件如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件,也称为样本点。通常样本点不止一个单位,而是由许多单位构成,这时就要连续n次试验的结果构成一个样本点。2.样本空间以全部样本点为元素的集合,称为样本空间。三、样本空间试验样本空间抛一枚硬币抛掷一颗骰子抽出一件产品检测一场足球比赛{正面向上,反面向上}{1,2,3,4,5,6}点{合格,不合格}{获胜,失利,平局}抛掷两枚硬币抽两件产品检测{(正,正),(反,正),(反,反)}………练习习题题写出出随随机机试试验验的的样样本本空空间间1.记记录录某某班班一一次次统统计计学学测测试试的的平平均均分分数数2.某某人人骑骑自自行行车车在在公公路路上上行行驶驶,,观观察察该该骑骑车车人人在在遇遇到到第第一一个个红红灯灯停停下下来来以以前前已已经经遇遇到到的的绿绿灯灯个个数数。。3.生生产产产产品品,,直直到到有有10件件正正品品为为止止,,记记录录生生产产产产品品的的总总件件数数。。1.事事件件::随随机机试试验验的的每每一一个个可可能能结结果果(任任何何样样本本点点集集合合)例如如::掷掷一一枚枚骰骰子子出出现现的的点点数数为为32.随随机机事事件件::每每次次试试验验可可能能出出现现也也可可能能不不出出现现的的事事件件例如如::掷掷一一枚枚骰骰子子可可能能出出现现的的点点数数3.必必然然事事件件::每每次次试试验验一一定定出出现现的的事事件件,,用用表表示示。。例如如::掷掷一一枚枚骰骰子子出出现现的的点点数数小小于于74.不不可可能能事事件件::每每次次试试验验一一定定不不出出现现的的事事件件,,用用表表示。。例如如::掷掷一一枚枚骰骰子子出出现现的的点点数数大大于于6四、、事事件件及及其其概概率率5.事事件件的的概概率率(1)事事件A的概率是是对事件件A在试验中中出现的的可能性大大小的一一种度量量(2)表表示事件件A出现可能能性大小小的数值值,事件件A的概率表表示为P(A)(3)概概率的定定义有::古典定定义、统统计定义义和主观概率定定义6.概率率的统计计定义在相同条条件下进进行n次随机试试验,事事件A出现m次,则比比值m/n称为事件件A发生的频率。随着n的增大,,该频率率围绕某某一常数数P上下摆动动,且波波动的幅幅度逐渐渐减小,,趋向于于稳定,,这个频率的稳稳定值即即为事件件A的概率,记为例如,投投掷一枚枚硬币,,出现正正面和反反面的频频率,随着投掷掷次数n的增大,,出现正正面和反反面的频频率稳定在1/2左左右试验的次数正面/试验次数1.000.000.250.500.750255075100125第二节随随机变量量及其分分布一、随机机变量的的概念二、离散散型随机机变量的的概率分分布三、连续续型随机机变量的的概率分分布一、随机机变量的的概念1.概念念随机事件件的数量量表现就就称为随随机变量量。例如:投投掷两两枚硬币币出现正正面的数数量;从从班级同学中中抽10个,抽抽中女生生的人数数…。2.分类类根据取值值情况的的不同分分为离散散型随机机变量和和连续型随随机变量量(1)离离散型随随机变量量如果随机机变量X的取值都可可以逐个个列举出出来X1,X2,…,则X称为离散型随随机变量量离散型随随机变量量的一些些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1(2)连连续型随随机变量量如果X的所有可能能取值不不可以逐逐个列举举出来,,而是取数轴轴上某一一区间内内的任意意点,则则称该随随机变量为连续型随随机变量量连续型随随机变量量的一些些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00

X100X0二、离散散型随机机变量的的概率分分布1.离散散型随机机变量X的所有可可能取值及其取这这些值的概率按顺序排排列起来来就形成成概率分布布。2.通常常用下面面的表格格来表示示X=xix1,x2

,…,xnP(X=xi)=pip1,p2

,…,pn3.概率率分布的的性质::随机变量量取值的的概率是是非负的的,即pi0;随机变量量所有取取值的概概率总和和等于1,即(i=1,2,,…,n)4.离散散型随机机变量的的概率分分布(实例))【例】如规定打打靶中域域Ⅰ得3分,中中域Ⅱ得得2分,,中域ⅢⅢ得1分分,中域域外得0分。今今某射手手每100次射射击,平平均有30次中中域Ⅰ,,55次次中域ⅡⅡ,10次中ⅢⅢ,5次次中域外外。则考考察每次次射击得得分为0,1,2,3这一离离散型随随机变量量,其概概率分布布为X=xi0123P(X=xi)pi0.050.100.550.305.离散散型随机机变量的的数学特特征离散型随随机变量量的数学学期望离散型随随机变量量的方差差离散型随随机变量量的数学学期望(1)在在离散型型随机变变量X的一切可可能取值值的完备备组中,,各可能能取值xi与其相对对应的概概率pi乘积之和和。(2)计计算公式式为(3)性性质第三章所所讲的平平均数的的性质也也完全适适合于数数学期望。对对于抽样样分布通通常要考考虑多个个变量的的情况,所以以还要补补充两条条性质。。①n个随随机变量量代数和和的数学学期望等等于它们们的数学学期望之之和。②n个独立随机变量量连乘积积的数学学期望等等于它们们数学期期望的乘乘积离散型随随机变量量的方差差(1)随随机变量量X的每一个个取值与与期望值值的离差差平方的数数学期望望,记为为D(X),或Var(X),,或它用来描描述离散散型随机机变量取取值的分分散程度度(2)计计算公式式为离散型随随机变量量的方差差(实例))【例】投掷一枚枚骰子,,出现的的点数是是个离散散型随机机变量,,其概率率分布为为如下。。计算数数学期望望和方差差X=xi123456P(X=xi)=pi1/61/61/61/61/61/6解:数学期望望为:方差为::三、连续续型随机机变量的的概率分分布※连续型随随机变量量可以取取某一区区间或整整个实数轴上的的任意一一个值。。※它取任何何一个特特定的值值的概率率都等于于0,所以不能能列出每每一个值值及其相相应的概概率,通通常研究它它取某一一区间值值的概率率(一))密度度函数数f(x)1.f(x)表示示随机机变量量X在在点x上的的概率率密度度,所以称称为密密度函函数。。2.f(x)不是是概率率。3.通通常把把密度度函数数的图图形称称为分分布曲曲线。。在平面面直角角坐标标系中中画出出f(x)的图图形,,则对对于任任何实实数a<b,P(aX<b)是该该曲线线下从从a到b的面积积f(x)xab概率是曲线下的面积(二))密度度函数数具有有以下下性质质:1.密密度函函数是是非非负函函数,,即2.随随机变变量X落在在区间间内内的的概率率等于于它的的密度度函数数在该该区间间上的的定积积分。。即::其几何何意义义就是是概率率等等于于区间间上分布布曲线线和X轴围围成的的面积积。3.由由于是是必必然事事件,,所以以(三))分布布函数数1.连连续型型随机机变量量的概概率也也可以以用分分布函函数F(x)来表表示2.分分布函函数定定义为为根据分分布函函数,,P(a<X<b)可以以写为为分布函函数与与密度度函数数的图图示1.密密度函函数曲曲线下下的面面积等等于12.分分布函函数是是曲线线下小小于x0的面积积f(x)xx0F(x0

)(四))连续续型随随机变变量的的期望望和方方差1.连连续型型随机机变量量的数数学期期望为为2.方方差为为第三节节抽抽样样分布布基本概概念重置抽抽样分分布及及其数数值特特征不重置置抽样样分布布及其其数值值特征征一、基基本概概念1.抽抽样分分布::从一个个总体体中抽抽取样样本容容量相相同的的所有有可能能样本之之后,,计算算样本本统计计量的的值及及取该该值的的相应概概率,,就组组成了了样本本统计计量的的概率率分布,简简称抽抽样分分布。。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样样本统计量量平均数比率(成数)方差2.参参数和和统计计量(总体体指标标和抽抽样指指标))总体参参数((总体体指标标)((parameter))根据全全及总总体各各个单单位的的标志志值或或标志志属性性计算算的,,反映映总体体某种种属性性或特特征的的综合合指标标称为为全及及指标标。全及指指标值值具有有唯一一性。。常用的的全及及指标标有总体平平均数数())(或总体成成数P)、总体标标准差差σ(或总体方方差σσ2)。●统计量量(抽抽样指指标))由抽样样总体体各单单位标标志值值计算算出来来反映映样本特特征,,用来来估计计总体体的综综合指指标称称为统计计量((抽样样指标标)。。它是一一个随随机变变量。。3.统统计量量的特特点统计量量(抽抽样指指标))是随随机变变量,,随着着抽到到的样样本单单位不不同其其取值值也会会有变变化。。统计量量是样样本变变量的的函数数,用用来估估计总总体参参数,,因此此与总总体参参数相相对应应。要了解解本班班男同同学的的身高高,从从总共共30名男男同学中抽抽取5名同同学测测量他他们的的身高高,用用这5名同学的的平均均身高高来估估计本本班男男同学学的身身高。。样本点点:样本空空间::样本统统计量量:4.统统计量量的计计算样本平平均数数:样本方方差::样本成成数::二、重重置抽抽样分分布(一))样本本平均均数的的分布布样本平平均数数的分分布是是总体体中全全部样样本平平均数数的可能取取值和和与之之相应应的概概率组组成。。下面用用一个个例子子来说说明该该问题题某班组组5个个工人人的日日工资资为34、、38、42、、46、50元元。现用重重置抽抽样的的方法法从5人中中随机机抽2个构构成样样本。。共有有52=25个样样本。。样本平平均数数的均均值、、方差差及标标准差差:抽样平平均数数的标标准差差反映映所有有的样样本平平均数数与总总体平平均数数的平平均误误差,,又称称为抽样平平均误误差,用表表示。。(二))两个个重要要结论论:1.重重置抽抽样的的样本本平均均数的的平均均数等等于总总体平平均数数,即即2.重重置抽抽样的的抽样样平均均数的的标准准差等等于总总体标标准差差除以以样本本单位位数的的平方方根。。即样本抽抽样分分布原总体体分布布以上两两个结结论具具有普普遍意意义,,其一一般推推导见见课本本p113。这一等等式可可以看看出两两项重重要事事实(1))抽样平均均误差差比总总体标标准差差小的的多,,仅为为其。。例如一一个县县的粮粮食亩亩产高高低悬悬殊,,亩产产标准准差为为80公斤,如如果随随机抽抽取100亩求求平均均亩产产,那那么样样本平平均亩产量量的差差异就就显著著减小小,平平均误误差只只及总总体亩亩产标标准差的的,,即即所以用用样本本平均均亩产产来代代表总总体平平均亩亩产是是更有有效的的.(2))抽样样平均均误差差与总总体标标准差差成正正比变变化,而而与样样本容容量n的平平方根根成反反比变变化。。例如在在同一一个总总体中中,如如果抽抽样单单位数数扩大大原来的4倍,,则抽抽样平平均误误差就就缩小小一半半,如如果抽抽样平均均误差差增加加一倍倍,则则样本本单位位数只只需要要原来的1/4。(三))总体体成数数的估估计总体成成数p是指具具有某某种特特征的的单位位在总总体中中的比比重。在在前面面我们们已经经知道道,成成数是是一个个特殊殊平均均数,设设总体体单位位总数数目是是N,总体体中有有该特特征的的单位位数是N1。设X是0、1变量,,即:总总体单单位有有该特特征,,则X取1,否则则取0,则有有:现从总总体中中抽出出n个单位位,如如果其其中有有相应应特征征的单单位数是n1,则样样本成成数是是:成数P也是一一个随随机变变量,,利用用样本本平均均数的的分布布性质质结论论,即即有::例题Eg.已知知某批批零件件的一一级品品率为为80%,,现用用重置置抽样样方法法从中中抽取取100件件,求求样本本一级级品率率的抽抽样平平均误误差。。三、不不重置置抽样样分布布(一))样本本平均均数的的分布布某班组组5个个工人人的日日工资资为34、、38、42、、46、50元元。现用不不重置置抽样样的方方法从从5人人中随随机抽抽2个个构成成样本本。共共有20个个样本本。不重置置抽样样样本本平均均数的的平均均数、、方差差及标标准差差:(二))两个个重要要结论论:1.不不重置置抽样样分布布虽然然与重重置抽抽样分分布不不同,,但它们的的样本本平均均数的的平均均数仍仍等于于总体体平均均数,即即:2.抽抽样平平均数数的标标准差差也是是反映映样本本平均均数与与总体体平均均数的的平均均误差差程度度。即即:所以抽样平平均数数的标标准差差也可可称为为抽样样平均均误差差,或抽抽样标准准误差差,不不重置置抽样样的抽抽样平平均误误差等等于重重置抽抽样的平均均误差差乘以以修正正因子子n/N称为为抽样样比。。(三))样本本成数数的分分布抽样平平均误误差为为:对于((0,,1))分布布的总总体,,总体体平均均数为为:总体方方差为为:从总体体中抽抽取容容量为为n的样本本,样样本成成数p的分分布实实质是是样本本平均均数的的分布布。有有:重置抽样不重置抽样样本平均数误差样本成数误差抽样平平均误误差公公式汇汇编回顾某企业业生产产一批批灯泡泡,共共10,000只,,随机机抽取取500只只做耐耐用试试验。。测算算结果果平均均使用用寿命命为5,000小时时,由由历史史经验验得知知总体体标准准差为为300小小时,,500之之中发发现10只只不合合格。。求平均均数和和成数数的抽抽样平平均误误差。。第四节节正正态分分布和和正态态逼近近一、正正态分分布二、正正态分分布再再生定定理三、中中心极极限定定理四、抽抽样分分布的的正态态逼近近一、正正态分分布(一))正态态分布布概述述:1.定定义一个连连续型型随机机变量量X,,如果果其密密度函函数为为那么我我们称称X服服从参参数为为x和正态分分布。。连续型型随机机变量量的一一种重重要分分布,,它是是统计计推断断的基础础2.密密度函函数f(x)的的性质质(1))对称称性;;(2))非负负性;;(3))最大大值;;(4))拐点点;f(x)(5))x和σ的意义义;位置参参数形状参参数(1))变动动平均均数(2))变动动标准准差改变分分布中心位置;;表现为为图形形的平平移。。分布疏密程度表现为为图形形的拉拉伸或或压缩缩(二))正态态分布布函数数的标标准化化1.标标准正正态分分布定定义数学期期望为为0,,方差差为1的正正态分分布,,称为为标准正态态分布布。用用N(0,1)来表表示。。变量X服从从标准准正态态分布布记为为:标准正正态分分布其其几何何意义义是将将分布布曲线线的中中心移到到原点点,使使得离离差化化为以以为为单单位的的相对离差差。2.标标准正正态分分布的的特点点:(1))分布布的平平均数数(数数学期期望))为0;(2))分布布的方方差为为1。。(3))密度度函数数为::(4))分布布函数数:3.非非标准准正态态分布布标准准化(1))为什什么要要把不不同的的正态态分布布变换换为具具有相相同参参数的的—标标准准正态态分布布:N(0,,1))?为了计计算的的方便便!计计算服服从标标准正正态分分布的的变量量取值在某某个区区间的的概率率只需需查标标准正正态概概率分分布表表(2))如何何进行行标准准化??标准正正态分分布表表的两两种形形式::本教材材后附附

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论