




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、统计推断的研究方法抽样研究,引例:目的:检验一批药品是否合格。困难:数量大、检验方法具有破坏性方法:抽取一部分样品进行检验,从而推断这批药品的质量。,抽样分布,1,抽样研究:通过样本所携带的信息去估计、推断总体的状态及性质的研究方法称为抽样研究。抽样研究是统计学的基本方法。抽样是手段,对总体进行估计、推断是目的。,进行抽样研究时,必须注意保证样本的代表性:首先,要明确划清目标总体的同质范围,也就是确定被研究对象的同质基础,包括时间、空间、条件等;第二,必须遵循随机抽样的原则,即使总体中每一个体都以同样的概率被抽到样本中去;第三,必须保证样本中有足够的个体数,即样本含量足够大。只有保证了样本的代表性,才能对抽样研究所得结论的可靠性进行统计学评价。,2,总体:根据研究目的所确定的、性质相同的所有个体的集合。,一般说来,一个总体的指标测定值在客观上具有一定的分布,即X是一个随机变量。故对总体的研究对相应随机变量X的研究随机变量X的分布函数总体的分布函数随机变量X数字特征总体的数字特征(总体参数),注:通常情况下,我们所提到的总体对应一个随机变量,称为一元总体;若需要同时考虑两个及多个随机变量时,即:X=(X1,X2,Xn),称X为多元总体。,几个基本概念,3,样本:同一总体中一部分有代表性的个体所构成的集合。设总体为随机变量X,我们规定:从总体X中抽取n个个体进行观测在相同条件下对总体X进行n次重复独立的观测将各次观测结果依次记为X1,X2,Xn,这样得到的n个X1,X2,Xn显然是相互独立的且具有同一分布X的随机变量。称X1,X2,Xn为来自总体X的一个简单随机样本,简称样本;称n为这个样本的样本容量;对于随机变量X1,X2,Xn的一组具体的测定值x2,xn称为X1,X2,Xn的样本观测值或样本值。,4,总体参数:反映总体状态或性质的指标称为总体参数。一般用希腊字母来表示,如:总体均数:总体标准差:总体率样本统计量我们知道,对于总体而言,其性质、特征是通过数字特征(总体参数)来反映的。在抽样研究中,欲利用样本对总体进行研究,就需要根据研究目的从样本中提取相应的信息。从数学上讲,就是针对不同的问题构造关于样本的适当的函数,利用这些样本的函数来进行统计估计和推断。,5,样本统计量:设X1,X2,Xn是来自总体X的一个样本,n元函数g连续且不含任何未知参数,则称g(X1,X2,Xn)是一样本统计量,简称统计量。对于样本X1,X2,Xn的一组具体的测定值x1,x2,xn,称g(x1,x2,xn)是统计量g(X1,X2,Xn)的观测值。显然,这样定义的样本统计量g(X1,X2,Xn)仍然是一个随机变量。如,6,样本平均值样本方差样本标准差样本率,抽样误差:样本统计量和总体参数之间由于抽样引起的差异称为抽样误差。标准误:样本统计量的标准差称为标准误。它是反映样本统计量对总体参数离散程度的量,用于度量抽样误差的大小。,7,二、抽样分布由于样本统计量也是随机变量,因此它也有其概率分布。称样本统计量的分布为抽样分布。,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,设总体X的总体均数为,方差为2,X1,X2,Xn是从总体X中抽取的一个样本,则样本均数作为随机变量其均数为,方差为2/n。特别指出,样本均数的标准差又称为均数的标准误,记为:当未知时,可用样本标准差S代替,有:,4.均数的抽样分布,23,若从非正态总体X中抽样,则其均数的分布并非正态分布。但当样本含量n较大时,其均数的分布接近于均数为,方差为2/n的正态分布。,特别地,当总体X的分布为正态分布时,有,24,5.率的分布:设X服从参数为n,的二项分布B(n,),现从该总体中进行大量重复独立抽样,其样本含量为n,当n充分大时(n5或n(1)5,且n40),则样本率P=X/n的分布近似于正态分布。即样本率P的标准差又称为率的标准误为,25,1).t统计量的分布在上述假定下,统计量,服从自由度为n1的t分布,记为tt(n-1)。其中,S为样本标准差。,6.两个重要统计量的分布,26,设X1,X2,Xn是从总体中抽取的一个样本,Y1,Y2,Yn是从总体中抽取的一个样本,则统计量,其中,,2).t统计量的分布,27,三、参数估计1.点估计:直接用样本统计量的值作为相应总体参数的估计值。如:,点估计的优点是简单、直观;缺点是无法估计误差的大小。,28,2、区间估计点估计的实质是用一个数值(样本统计量的值)去估计未知参数的真值。这种估计一般是有误差的。人们希望弄清这种估计的近似程度,这就需要估计出一个范围,并了解这个范围包含未知参数的可信程度,这样的范围在数轴上就是一个区间。这种用一个区间来估计未知参数的方法称为对未知参数的区间估计。这里提到的可信程度称为可信度或置信度,估计出来的区间称为可信区间或置信区间。,29,1).总体均数的区间估计当总体标准差已知时,总体均数的可信度为(1)的可信区间为,30,当总体标准差未知时,总体均数的可信度为(1)的可信区间为,当总体标准差未知,但n足够大时,总体均数的可信度为(1)的可信区间为,(例5-3),(例5-4),31,2)两总体均数之差的区间估计实际工作中,常常需要估计两总体均数之差的大小。例如:正常成年男女的红细胞数平均相差多少?,当两总体方差相等时,两总体均数之差1-2的可信度为(1)的可信区间为,例5-5,32,3).总体率的估计例5-6、5-7当样本含量n较小时,总体率的(1-)可信区间可用查表(附表7百分率的可信区间)的方法来求得。,当样本含量n较大,且np与n(1-p)均大于5时,总体率的(1-)可信区间为:,例5-8,33,注1:这里说的可信区间实际上是随机区间,它与抽样结果有关。这个区间能否包含总体均数是一个随机事件,可信度(1)的含义是指该区间包含总体均数的可靠程度。注2:评价可信区间的标准主要有两个。一是可信度,即取得越小,则可信度1越高,即该区间包含的概率越大;二是估计精度,用区间长度来表示,当然,区间长度越小,则估计精度越高。,34,一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建泉州发展集团有限公司(第一批)人才引进招聘25人模拟试卷及完整答案详解1套
- 2025年上半年齐齐哈尔医学院附属第二医院公开招聘编制外工作人员17人考前自测高频考点模拟试题及参考答案详解1套
- 2025年致远学院第一批次人才引进考前自测高频考点模拟试题附答案详解(典型题)
- 2025江苏连云港市灌云县招聘就业困难人员公益性岗位26人模拟试卷及完整答案详解一套
- 2025江苏盐城市第七人民医院招录政府购买服务用工14人模拟试卷及完整答案详解一套
- 2025福建福州市仓山区卫健系统招聘编内31人考前自测高频考点模拟试题及完整答案详解
- 2025福建农信春季招聘194人模拟试卷附答案详解(考试直接用)
- 2025广东珠海市公安局招聘合同制职员拟聘用(第二批)考前自测高频考点模拟试题附答案详解
- 2025吉林大学白求恩第一医院泌尿外一科录入员招聘1人考前自测高频考点模拟试题及答案详解(历年真题)
- 2025广西百色市人民医院人才招聘38人(第二批)考前自测高频考点模拟试题及答案详解(夺冠)
- 科普:农药毒性分类
- 陈阅增普通生物学第1篇3细胞结构与细胞通讯教学课件
- 练习使用显微镜 全国公开课一等奖
- 【执业药师考试】执业药师历年真题
- 2023年高考地理(上海卷)-含答案
- 比重式精选机的使用与维护
- FZ/T 81004-2022连衣裙、裙套
- GB/T 34875-2017离心泵和转子泵用轴封系统
- 细胞培养技术培训课件
- 故障录波器课件
- 管片质量问题原因分析及控制措施
评论
0/150
提交评论