第六章样本及抽样分布_第1页
第六章样本及抽样分布_第2页
第六章样本及抽样分布_第3页
第六章样本及抽样分布_第4页
第六章样本及抽样分布_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章样本及抽样分布【授课对象】理工类本科二年级【授课时数】4学时【授课方法】课堂讲授与提问相结合【基本要求】1、理解总体、个体和样本的概念;2、了解经验分布函数和直方图的作法,知道格林汶科定理;3、理解样本均值、样本方差和样本矩的概念并会计算;4、理解统计量的概念,掌握几种常用统计量的分布及其结论;5、理解分位数的概念,会计算几种重要分布的分位数。【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——分布,分布,分布;分位数的理解和计算。【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。【授课内容及学时分配】§6.0前言前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。§6.1随机样本一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了的这样或那样的数值,因而这个数量指标是一个随机变量(或向量),而的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标可能取值的全体组成的集合等同起来。定义1:把研究对象的全体(通常为数量指标可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。我们对总体的研究,就是对相应的随机变量的分布的研究,所谓总体的分布也就是数量指标的分布,因此,的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。例1:考察一块试验田中小麦穗的重量:=所有小麦穗重量的全体(无限总体);个体——每个麦穗重对应的分布:例2:考察一位射手的射击情况:=此射手反复地无限次射下去所有射击结果全体;每次射击结果都是一个个体(对应于靶上的一点)个体数量化1在总体中的比例为命中率0在总体中的比例为非命中率总体由无数个0,1构成,其分布为两点分布2.样本与样本空间为了对总体的分布进行各种研究,就必需对总体进行抽样观察。抽样——从总体中按照一定的规则抽出一部分个体的行动。一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。按照一定规则从总体中抽取的一组个体称为总体的一个样本,显然,样本为一随机向量。为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了的分布相同,与总体一样。②独立性:相互独立。那么,符合“代表性”和“独立性”要求的样本称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,无放回的抽样不能保证的独立性;但对无限总体而言,无放回随机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。对每一次观察都得到一组数据(),由于抽样是随机的,所以观察值()也是随机的。为此,给出如下定义:定义2:设总体的分布函数为,若是具有同一分布函数的相互独立的随机变量,则称()为从总体中得到的容量为的简单随机样本,简称样本。把它们的观察值()称为样本值。定义3:把样本()的所有可能取值构成的集合称为样本空间,显然一个样本值()是样本空间的一个点。二、样本的分布:设总体的分布函数为,()是的一个样本,则其联合分布函数为:=。例3:设总体为其一个简单随机样本,则样本空间,因为,所以样本的联合分布列为:§6.2分布函数与概率密度函数的近似解在概率论中,我们介绍了几种常用的分布函数以及它们的性质,当时我们总假定它们都是先给定的,而在实际中,所遇到的用于描述随机现象的随机变量,事先并不知道其分布函数,甚至连其分布类型也一无所知,那么,怎么样才能确定它的分布函数呢?一般地,利用样本及样本值,建立一定的概率模型,用由此获得的概率统计信息来对总体的进行估计和推断,这就是:一、经验分布函数1.定义:设()是来自总体的样本,用表示:,中不大于的随机变量的个数,定义经验分布函数为。设()是样本的一个观察值,令这个数值由小到大的顺序排列后为:≤≤≤……≤,对∈R由定义很容易得到经验分布函数的观察值:通常也称是总体的经验分布函数,在不至于混淆的情况下统一用来表示总体的经验分布函数。显然,是单调非降右连续的跳跃函数(阶梯函数),在点处有间断,在每个间断点的跃度为,(=1,2,3,…,)且,=0,=1,它满足分布函数的三个性质,所以必是一个分布函数。一般地,随着的增大,越来越接近的分布函数,关于这一点,格列汶科(Glivenko)在1953年给了理论上的论证,即:2.定理1(Glivenko-Th):若总体的分布函数为,经验分布函数为,则对,有:[]定理表明,以概率1一致收敛于,即:可以用来近似,这也是利用样本来估计和判断总体的基本理论和依据。例4:某厂从一批荧光灯中抽出10个,测其寿命的数据(单位千时)如下:95.5,18.1,13.1,26.5,31.7,33.8,8.7,15.0,48.8,48.3求该批荧光灯寿命的经验分布函数(观察值)。解:将数据由小到大排列得:8.7,13.1,15.0,18.1,26.5,31.7,33.8,48.8,49.3,95.5,则经验分布函数为:二、利用直方图求密度函数的近似解:设()为来自总体的一个样本,其样本观察值为(),将该组数值分成组,可作分点:(各组距可以不相等),则各组为:(,],(,,……,(,,若样本观察值中每个数值落在各组中的频数分别为,,,…,,则频率分别为:,……;以各组为底边,以相应组的频率除以组距为高,建立个小矩形,即得总体的直方图。由上分析可知:直方图中每一矩形的面积等于相应组的频率设总体的密度函数为,则:总体(真实值)落在第组(,的概率为:。由Bernoulli大数定理可知:当n很大时,样本观察值(单个)落在该区间的频率趋近于此概率;即:(,上矩形的面积接近于在此区间上曲边梯形的面积,当n无限增大时,分组组距越来越小,直方图就越接近总体的密度函数的图象。(这与定积分的意义具有同样的道理)。§6.3样本的数字特征由第三章节知:随机变量的数字特征,能够反映随机事件的某些重要的概率特征,从第一节可知,样本也是一组随机变量(随机向量),为了详细刻划样本观察值中所包含总体的信息及样本值的分布情况,下面我们研究样本的数字特征。一、样本均值与样本方差(随机变量)定义1,设()是来自总体的一个样本,称为样本均值。为样本方差。为样本标准差。样本均值与样本方差分别刻划了样本的位置特征及样本的分散性特征。二、矩1.总体矩(数值)设总体的分布函数为,则称(假设它存在)为总体的阶原点矩;称为总体的阶中心矩。把总体的各阶中心矩和原点矩统称为总体矩——表示总体的数字特征。特别地:=;是总体的期望和方差。仿此,下面给出样本矩的定义:2.样本矩(r.v)定义2:设是来自总体的一个样本,则称,=1,2,3……;为样本的阶原点矩(随机变量),=1,2,3……;为样本值的阶中心矩(随机变量)。特别地,,但与却不同,由与的计算式可知:,当时,=,所以常利用来计算S(标准差)。【注】:,这就是下一章要介绍的矩估计的理论根据。由上述定义可知:样本均值、样本方差、样本均方差、样本矩都是关于样本的函数,而样本本身又是随机变量。因此,上述关于样本的数字特征也是随机变量。设为样本的观测值,则样本矩对应观测值分别为:;=;;;;=1,2,3……;在不至于混淆的情况下,这些值也分别称为样本均值、样本方差、样本标准差、样本阶原点矩、样本阶中心矩。例5:从某班级的英语期末考试成绩中,随机抽取10名同学的成绩分别为:100,85,70,65,90,95,63,50,77,86(1)试写出总体,样本,样本值,样本容量;(2)求样本均值,样本方差及二阶原点矩。解:(1)总体:该班级所有同学的英语期末考试成绩;样本:(,,,…,)样本值:=(100,85,70,65,90,95,63,50,77,86)样本容量:=10(2)(100+85+……+86)=78.1【注】本例作为学生使用计算器计算样本矩的练习。课后作业:1、仔细阅读P122-132;2、作业:P1463,43、预习:抽样分布

§6.4抽样分布0、引言有了总体和样本的概念,能否直接利用样本来对总体进行推断呢?一般来说是不能的,需要根据研究对象的不同,构造出样本的各种不同函数,然后利用这些函数对总体的性质进行统计推断,为此,我们首先介绍数理统计的另一重要概念——统计量。一、统计量(随机变量)定义1:设是来自总体的一个样本,是样本的函数,若中不含任何未知参数,则称()是一个统计量。设是对应于样本的样本值,则称是的观察值。事实上§6.3中的样本矩都是统计量;再如是来自总体的一个样本,则都是统计量,而就不是统计量。由§6.1知:()是随机变量,而统计量是样本()的函数,所以统计量也是随机变量。而统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,所以寻求统计量的分布成为数理统计的基本问题之一。我们把统计量的分布称为抽样分布。然而要求出一个统计量的精确分布是十分困难的。而在实际问题中,大多总体都服从正态分布:而对于正态分布,我们可以求出一些重要统计量的精确分布,这就是:二、几种常用的抽样分布:(正态分布中的几种统计量的分布)把分布,分布,分布,统称为“统计三大分布”。1、正态分布由正态分布的性质,可得如下结论:1)定理:设相互独立,,,是关于的任一确定的线性函数(),则也服从正态分布,且。2)结论:若()是来自总体的一个样本,为样本均值,则=1\*GB3①,由上述结论可知:的期望与的期望相同,而的方差却比的方差小的多,即的取值将更向集中。=2\*GB3②与相互独立。2、分布1)定义:设()是来自总体的一个样本,则称统计量:所服从的分布是自由度为的分布,记作:。的概率密度函数为:,其中:,显然,,且,即符合密度函数性质。事实上,2)分布的性质I、分布的可加性:设,,且与相互独立,则:+II、若,则,,事实上,因为,则:,,所以:;3)结论:设()为来自总体的一个样本,,为已知常数,则:I)统计量(当=0时也成立)事实上,令,则,所以II)样本均值与样本方差相互独立,且统计量。证明请参阅有关数理统计的课本。3、-分布1)定义:设,,且与相互独立,则称统计量:所服从的分布是自由度为的分布,记为,分布又称为学生氏(Student)分布。分布的概率密度函数为:。2)分布的特点(性质)。I、关于=0对称;II、在=0达最大值;III、的轴为水平渐近线;IV、;即时,分布,一般地,当>30时,分布与非常接近。V、当较小时,分布与有较大的差异,且对有,其中。即分布的尾部比的尾部具有更大的概率。VI、若,则时,3)结论:I)设()是来自总体的一个样本,则统计量:,事实上,由,又,且与相互独立,则与相互独立,由分布的定义,所以II)设()是来自总体的一个样本,(是来自总体的一个样本,且与相互独立,当时,则统计量,其中,,,事实上,,,且与相互独立,所以:,即:;又,,且它们相互独立,由分布的可加性,则。由分布的定义:4、-分布1)定义:设,,且与相互独立,则称统计量服从自由度为的分布,记作:,其中:为第一自由度,为第二自由度。由定义,若,则。的概率密度函数为:说明:先求出的联合密度函数,再令,求出()的联合,注意到独立,所以的边缘密度函数,也即的密度函数。2)分布的性质(特点)密度曲线不对称(偏态)若,则当时,当时,,注:(利用)3)结论:设()是来自总体的一个样本,(是来自总体的一个样本,且与相互独立,则。事实上,,,由分布的定义,可得,其中,;三、分位数1.定义:设随机变量的分布函数为,对于给定的正数,若有满足,则称为的(下侧)分位数(或分位点)。2.表示方法:=1\*GB3①.的分位数满足:。由标准正态分布的对称性可知:。=2\*GB3②.分布的分位数满足:,由附表6查其值:当时,或。=3\*GB3③.分布的分位数满足:,由附表5可查出其值。由于时,分布接近于,所以当时,可查分布分位数表。由分布的对称性可知:。=4\*GB3④.分布的分位数满足:,由分布性质,有:=。事实上,。=5\*GB3⑤.分位数的其它表示法。1)若使,则称为的上侧分位数,显然:为原分布的1-分位数,这是因为。例:若,满足:,则2)若,使,;则称为的双侧分位数,显然,为的分位数,为的1-分位数。例:设,求,使得,解:课后作业:1、认真阅读P132-145;2、作业:P14810,12,163、预习:参数估计的概念与点估计的求法。

附录资料:不需要的可以自行删除兴化大米质量技术要求选用武育粳3号,淮稻5号,华粳6号等中迟熟中粳品种。土壤有机质含量≥2%,土壤pH值6至8,灌排方便,灌溉水水质达国家标准。1.育秧:(1)种子处理:播种前用使百克、浸种灵和吡虫啉等低毒农药浸种2天,防止种传病害。(2)育秧方法:采用旱育秧或湿育秧方式。(3)播期播量:最适播期5月上中旬,每667m2(亩)大田适宜用种量<20kg。2.移栽:移栽期6月上中旬,每667m2(亩)栽插1.5至2万穴。3.田间管理:(1)施肥:每667m2(亩)施有机肥≥100kg,氮肥≤20kg至22kg(纯氮肥),N:P:K比为1:0.5:1。(2)水层管理:用无污染河水灌溉。水稻生长期间保持适宜水分,生长后期保持稻田湿润,断水时间不早于收获前十天。4.环境、安全要求:农药、化肥等的使用必须符合国家的相关规定,不得污染环境。90%以上实粒黄熟后及时收获,分品种单收单脱,脱粒扬净后晒干贮存。加工须在当地进行.加工全过程以国家大米加工质量标准执行,坚持清理、筛分、去石、砻谷、三机精白、高压纯净水蒸抛光、双面光电色选、检测、精确包装等加工程序,并进行稻米加工全过程质量监控与管理。1.感官特色:大米晶莹透亮,粒型适中。大米蒸煮时,饭粒完整,米饭柔软油润,浓香持久,米饭冷后不硬且有粘性。2.理化指标:项目垩白粒率垩白度长宽比直链淀粉含量胶稠度精米蛋白质含量指标<30%<5%1.9-2.0:111.0%-20.0%≥70mm≥7.5%3.安全要求:产品安全指标必须达到国家对同类产品的相关规定。

附件2:兴化红皮小麦质量技术要求土壤有机质含量≥2%,pH值6至8,田间内外三沟配套,排灌方便,防渍害能力强。1.播种:(1)播种期:应将播期按排在最佳播期10月25日至11月10日之间。(2)播种量:每667m2(亩)大田播种量在7kg至8kg。(3)播种方式:采用浅旋人工撒播方式或条播种机播种,播后及时窨透水。2.肥水管理:每667m2(亩)施肥量折施纯N:15kg至16kg,P2O5:6kg至7kg,K2O:6kg至7kg,N:P2O5:K2O为1:0.35:0.35,肥料种类以有机肥和复混肥为主。要重视拔节孕穗肥的施用,用量不少于总施N量的40%。除播种后窨透水促齐苗以外,其余阶段应以防水降渍为主,要及时清理内外三沟,保证排水畅通,雨后田间不积水。3.环境、安全要求:农药、化肥等的使用必须符合国家的相关规定,不得污染环境。1.收获:5月底6月初(籽粒蜡熟期),当穗下节枯黄,应及时抢收、晒干、扬净、贮藏。2.贮藏:在避光、常温、干燥和有防潮设施的地方贮藏。应保持贮藏地通风、清洁、无虫害、无鼠害,严禁与有毒、有害、有腐蚀性、易发霉、有异味的物品混存。仓库消毒、熏蒸处理所用药剂应符合国家有关食品卫生安全的规定。其它按国家有关标准和规定执行。1.感官特色:籽粒饱满整齐,红皮角质,腹沟较浅。2.理化指标:项目指标容重765g/L粗蛋白12.5%-14%出粉率67.2%-70.1%面粉白度76%-77.9%湿面筋(14%水份基)28%-33%面团吸水率60%形成时间5.5min-7.5min稳定时间5.5min-7.5min最大拉伸阻力50-60FU延伸度180mm-185mm淀粉含量75%-77%直/支比值20-213.安全要求:产品安全指标必须达到国家对同类产品的相关规定。附件3:永春老醋质量技术要求1.糯米:符合GB2715的规定,主要产自保护范围内,淀粉含量不小于72%,含水量不大于12%,不变率小于3.5%,不完善率小于6%,具有糯米正常色泽和气味,无霉变。2.红曲米:符合GB4926的规定,糖化率不小于1200mg/g.h,酒精度不小于15%(v/v),颜色呈暗红色,具有红曲米特有香气,无染杂,发酵均匀、完整。3.水:酿造用水应取自保护范围内的地下水,应符合GB5749的规定。糯米→浸泡→蒸煮→冷却→红曲糖化酒精发酵→液态醋酸发酵→陈酿→调兑→成品1.红曲糖化酒精发酵:红酒发酵周期需保证30天以上;红酒发酵用水必须是取自保护范围内的地下水;红酒发酵的酒精度控制在10%(V/V)至12%(V/V)之间。2.陈酿:(1)温度控制:陈酿房温度控制在18℃至26℃之间。(2)陈酿时间:按陈酿时间不同分为四级,其中特酿级5年以上,精酿级4年以上,优酿级3年半以上,佳酿级3年以上。(3)添加物:在陈酿过程中,根据需要可添加按特定工艺炒制的米乌(≤4.0%)、芝麻(≤0.5%)、白糖(≤3.0%)等添加物。1.感官特色:项目要求色泽棕褐或棕红色香气具有液态发酵永春老醋特有的酯香味,无其他不良气味滋味入口柔和,稍有甜味,不涩,无杂味体态澄清,允许有微量沉淀2.理化指标:项目指标特酿级精酿级优酿级佳酿级总酸(以乙酸计)(g/100ml)≥6.56.05.55.0可溶性无盐固形物(g/100ml)≥2.01.81.51.0氨基酸态氮(以氮计)(g/100ml)≥0.100.100.080.08总糖(以葡萄糖计)(g/100ml)≥2.22.01.81.53.安全要求:产品安全指标必须达到国家对同类产品的相关规定。

附件4:巴东独活质量技术要求伞形科当归属重齿毛当归(AngelicapubescensMaxim.f.biserrataShanetYuan)。保护区范围内海拔高度1200m至2000m。肥沃疏松、富含腐殖质的砂质壤土或黑色发泡土,pH值5.5至6.5,土层厚度≥30cm。1.种子采集:每年9月至10月,选择2年以上生,无病虫害的健康母本植株,忌采收枯黄过熟的种子。剪下果实及时置阴凉处备用,忌曝晒或堆积过厚,种子千粒重≥4.0g、水分≤10%。2.育苗:播种时间为每年十一月中旬至十二月上旬;每公顷播种量90kg至150kg;每公顷出苗数≤120万株。3.种植:(1)移栽:每年四月中旬定植,选择高150mm以上,根系发育良好,无腐烂,无病虫害的苗作种苗。每公顷株数6.5万至7万株。(2)直播:每年3月中旬至4月上旬播种,每公顷用种37.5kg至45kg。苗高10cm时进行第一次间苗,每隔30cm至40cm留壮苗1株。开花的独活植株不能作为药用。4.田间管理:(1)中耕除草:返青活棵后进行中耕锄草,表层松土,切勿伤根;当植株高35cm时进行第二次中耕除草;当植株高50cm至80cm时进行第三次中耕除草,并同时提畦沟土壅根。(2)排灌水:种苗移栽后要及时灌水湿润畦土。生长期要经常保持田间土壤湿润,干旱时要及时灌溉。每次大雨后要及时松土,并注意疏沟排水,防止低洼处积水引起烂根。(3)施肥原则:以施用农家肥料、有机肥料为主,杜绝施用化学肥料,以保持或增加土壤肥力及土壤中微生物的活性。5.环境、安全要求:农药、化肥等的使用必须符合国家的相关规定,不得污染环境。1.采收:育苗移栽的定植当年采收,直播的生长第2年采收,采收期为10月至11月茎叶枯萎后趁晴天采收。采收后应采取措施防止鲜独活冻伤。2.加工:切去芦头和细根

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论