版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 抽样(chu yn)推断抽样(chu yn)推断的基本概念 抽样误差 抽样推断(tudun)的方法 抽样的组织形式 第一页,共八十页。9/1/202216.1 抽样(chu yn)推断的基本概念 抽样推断,从其内涵(nihn)来说,包括抽样调查和抽样推断两部分,前者着重调查,后者着重推断。 抽样推断是在抽样调查(chu yn dio ch)的基础上利用样本的实际资料计算出的样本数据,并运用概率估计方法,推算总体相应的数量指标的一种统计分析方法。第二页,共八十页。9/1/20222抽样推断(tudun)具有如下几个特点抽样推断(tudun)是由部分推算整体的一种认识方法。 抽样推断(tu
2、dun)是建立在随机取样的基础上。 抽样推断是运用概率估计的方法,利用样本指标来估计总体参数。 抽样推断的误差是可以事先控制的,用样本指标值推断总体指标值是存在一定误差的。 第三页,共八十页。9/1/20223抽样(chu yn)推断的作用应用于某些不可能作全面(qunmin)调查或很难作全面(qunmin)调查的场合。在可以使用(shyng)全面调查的场合,抽样调查仍有其独特的作用。用于假设检验。第四页,共八十页。9/1/202246.1.1 总体(zngt)和样本 1总体(population)也称全及总体,是指所研究(ynji)现象的整体,即包括所要调查的所有单位。 例如,从1000名学
3、生中,抽取(chu q)50名学生进行抽样调查,以计算学生的平均体重。这1000名学生是全及总体,一般用英文大写字母N来表示总体的单位数,取N=1000人。全及总体按其各单位性质的不同,可以分为变量总体和属性总体两类。对于一个总体来说,若被研究的单位标志属于品质标志,则该总体为属性总体,若被研究的单位标志属于数量标志,则该总体为变量总体。 第五页,共八十页。9/1/202252样本(sample)又称子样,它是从全及总体中随机(su j)抽取出来,作为代表这一总体的那部分单位组成的集合体。 样本的单位数是有限的,相对来说,它的数目(shm)比较小,一般用英文小写字字母n来表示样本的单位数。如上
4、例n=50人。 作为推断对象的总体是确定的,而且是唯一的。但作为观察(gunch)对象的样本就不是这样。从一个总体可以抽取很多个样本,每次可能抽到哪个样本不是确定的。也不是唯一的,而是可变的。 第六页,共八十页。9/1/202266.1.2 参数(cnsh)和统计量 1参数(parameter)。根据(gnj)总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。 全及指标是总体变量的函数,其数值是由总体各单位的标志值决定的。由于总体是唯一确定的,因此(ync),全及指标也是唯一确定的,所以也称参数。常用的参数有总体平均数,总体成数、总体方差和总体标准差。 第七页,共八十
5、页。9/1/20227(1)总体(zngt)平均数 Population mean 对于变量总体,由于(yuy)各单位的标志可以用数量表示,因此可以计算总体平均数,通常用 表示。 设X为总体(zngt)的某一变量,其N项变量值为X1、X2、Xn,则总体平均数为: 第八页,共八十页。9/1/20228(2)总体(zngt)成数 Proportion对于属性总体,由于各单位标志不能用数量表示(biosh),因此总体参数常以成数或比重来表示(biosh)。通常以P表示(biosh)总体中具有某种标志表现即“是”的单位数在总体单位数中所占的比重;以Q表示(biosh)不具有某种标志表现即“非”的单位数
6、所占的比重。 设总体N个单位中,有N1个单位具有某种标志(biozh)表现,N0个单位不具有某种标志表现,且N=N1+N0,则总体成数为: 第九页,共八十页。9/1/20229【实例(shl)61】红光灯泡厂生产的10000只灯泡中,有9550只是合格品,有450只是不合格产品,则总体成数即灯泡的合格率和不合格率分别为: 需要指出,统计上把只表现(bioxin)为“是”与“非”的标志称为是非标志,也称交替标志,如性别标志等。 第十页,共八十页。9/1/202210(3)总体(zngt)方差和总体(zngt)标准差Variance & standard deviation就变量总体而言,其总体方
7、差(fn ch)和标准差计算公式分别为: 在属性总体条件下,则可以把“是”与“非”两种标志表现进行量化处理(chl),用“1”表示“是”,即具有某种标志表现,用“0”表示“非”,即不具有某种标志表现,那么“是”的成数就可视为是非标志的平均数,从而计算出属性总体的方差和标准差,即 =(1-P)2P+(0-P)2Q=Q2P+P2Q=PQ(P+Q)=PQ=P(1-P) 第十一页,共八十页。9/1/2022112统计量(statistic) 。根据样本各单位标志值计算的反映样本特征的指标称为统计量,也称作样本指标sample statistic 。它是用来估计(gj)总体参数的。与总体(zngt)参数
8、相对应,统计量主要有样本平均数 表示(biosh)样本内各单位某一标志值的一般水平样本方差,反映样本中各单位标志值的离散程度,从而可说明样本平均数的代表性大小,记作S2,称S为样本标准差或均方差样本成数,指具有某种性质的单位在样本中所占比重(如抽样产品的合格率),记作p;样本成数的方差是p(1-p)第十二页,共八十页。9/1/202212(1)样本(yngbn)平均数 Sample mean(2)样本(yngbn)成数 (3)样本(yngbn)方差和样本(yngbn)标准差 Sample variance第十三页,共八十页。9/1/202213样本是非标志的方差(fn ch)S2和标准差S的计
9、算公式分别为 第十四页,共八十页。9/1/2022146.1.3 样本(yngbn)容量和样本(yngbn)个数 是两个有联系但又完全不同(b tn)的概念。 样本容量是指一个(y )样本所包含位数 样本个数又称样本可能数目。是指从一个总体上可能抽取的样本个数。 第十五页,共八十页。9/1/2022156.1.4 重复(chngf)抽样和不重复(chngf)抽样 重复(chngf)抽样又叫重置sampling with replacement 抽样,也叫做有放回的抽样或重置抽样不重复(chngf)抽样又叫不重置sampling without replacement 也叫做无放回抽样或非重置抽
10、样样本可能数目样本可能数目第十六页,共八十页。9/1/2022166.2 抽样误差6.2.1 抽样误差的概念(ginin) 抽样误差(sampling error)是指由于随机抽样的偶然因素使各单位的结构不足以代表总体各单位的结构,而引起抽样指标(zhbio)和全及指标(zhbio)之间的绝对离差。 Sampling error is the difference between a sample statistic and its corresponding population parameter and is due purely to chance.是一种由于(yuy)随机抽样引起的偶
11、然的代表性误差,或随机误差random error chance error。抽样误差不可消除,但可以计算和控制。第十七页,共八十页。9/1/202217抽样调查中误差(wch)有以下两个来源 一个是登记性误差。也叫调查误差data recording error,是指在调查登记过程中发生(fshng)的误差,这类误差是可以避免的。二是代表性误差representative error,在抽样调查中,是指由于用抽样指标去代替(dit)总体指标时所产生的误差。代表性误差的发生的两种情况:第一,非随机的代表性误差;第二,随机性误差。 第十八页,共八十页。9/1/202218Dubious Samp
12、ling: The Literary Digest CaseA classic case of both selection bias and nonresponse bias occurred in 1936. The Literary Digest magazine, which had correctly predicted the winner in every U.S. presidential election since 1916, predicted confidently a comfortable victory for Alfred M. Landon, the Repu
13、blican candidate, over Franklin D. Roosevelt, the Democratic candidate, by a margin of 57 to 43. Yet Roosevelt won by a landslide never before seen in U.S. history, receiving 62 percent of the votes cast. What had gone wrong?第十九页,共八十页。9/1/202219First, there was selection bias. The Digest mailed ques
14、tionnaires to 10 million people whose names had been taken from various lists such as its own subscribers, telephone directories, and automobile-registration rolls. During the Great Depression, higher-income people typically voted Republican, and these people were well represented in the Digests sam
15、ple. On the other hand, lower-income people, who heavily favored the Democrats, were underrepresented because a lower percentage could afford magazine subscriptions, telephones, and automobiles.第二十页,共八十页。9/1/202220Second, there was nonresponse bias. Only 2.4 million of the l0 million questionnaires
16、were mailed back. Although this made the survey the largest sample ever taken, more educated people are more likely to respond to mail questionnaires than less educated ones. The former, again, tended to favor Republicans; the latter, the Democrats. Thus, a much larger percentage of the nonresponden
17、ts than of the respondents were for Roosevelt. This bias reinforced the selection bias.第二十一页,共八十页。9/1/202221Note: The Digest never survived the debacle and folded shortly thereafter. At the same time, George Gallup was setting up his survey organization, and he correctly forecast the Roosevelt Victo
18、ry from a mere sample of 50,000 people. Yet in 1948, using another dubious procedure (a form of judgment sampling, called quota sampling), Gallups organization (along with Crossleys and Ropers) incorrectly predicted the victory of Thomas Dewey over Harry S Truman.第二十二页,共八十页。9/1/2022226.2.2 抽样(chu yn
19、)平均误差standard error 是根据随机原则抽样时,所有可能出现(chxin)的样本平均数的标准差。它反映样本平均数(样本成数)与总体平均数(总体成数)的平均误差程度,常用(chn yn)表示。The standard error of the sample mean is the standard deviation of the sampling distribution of sample means.第二十三页,共八十页。9/1/2022231抽样(chu yn)平均数的平均误差 (1)重复(chngf)抽样的抽样平均误差计算公式 但是,是全及总体标准差,这是不知道的。如果知
20、道,就无需(wx)进行抽样调查了。在这种情况下可用样本的方差s2来代替。其计算公式如下 第二十四页,共八十页。9/1/202224(2)不重复(chngf)抽样的抽样平均误差计算公式 当全及总体单位数N很大时,N-1接近(jijn)于N,即可用N代替,则上列公式可简化如下 第二十五页,共八十页。9/1/202225【实例65】从某学院2022级的2000名学生中,按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均成绩为78.75分,标准差为12.13分,试根据(gnj)重复抽样和不重复抽样的方法分别计算抽样平均误差。 (1)按重复(chngf)抽样计算抽样平均误差 (
21、2)按不重复(chngf)抽样计算抽样平均误差 第二十六页,共八十页。9/1/2022262抽样(chu yn)成数的抽样(chu yn)平均误差 (1)重复(chngf)抽样的抽样平均误差计算公式 (2)不重复(chngf)抽样的抽样平均误差计算公式 以上两个公式中的P,是总体成数,这是不知道的。而P(1-P)是总体方差,它等于 ,即也是不知道的。在这种情况下,可用样本的成数P和样本方差P(1-P)来代替,或者用过去类似调查的成数和成数方差来代替。成数方差的最大值为第二十七页,共八十页。9/1/202227【实例66】从40000件产品中,随机(su j)抽取200件进行检验,结果有10件不
22、合格,求合格率的抽样平均误差。 (1)按重复(chngf)抽样计算抽样平均误差 (2)按不重复抽样(chu yn)计算抽样(chu yn)平均误差 第二十八页,共八十页。9/1/2022286.2.3 抽样(chu yn)极限误差 1抽样极限误差(wch)的概念 抽样极限(jxin)误差又称抽样允许误差,是指样本指标与总体指标之间产生抽样误差被允许的最大可能范围,它是根据所研究对象的变异程度和分析任务的要求来确定的可允许的误差范围,凡是在这个范围内的数字都算有效,统计上把这种可允许的误差范围称为抽样极限(jxin)误差。 根据样本指标估计总体指标必会产生误差,但误差不能太大,以免使抽样估计失去
23、意义;但误差也不是愈小愈好,因为这样就要增加样本单位数,必然提高很多费用,所以要确定一个误差范围。 第二十九页,共八十页。9/1/202229抽样极限(jxin)误差通常用样本指标可允许变动的上限或下限与总体指标的绝对离差表示。设和分别表示抽样平均数和抽样成数的抽样极限(jxin)误差,则有 上式可变换(binhun)为下列不等式 上式表明总体平均数 是以抽样(chu yn)平均数 为中心,在 的范围内变动。总体成数P也是如此,这个变动范围被称为估计区间。 第三十页,共八十页。9/1/2022302抽样误差的概率(gil)度 基于概率估计的要求,抽样极限误差通常需要(xyo)以抽样平均误差或为
24、标准单位来衡量。把极限误差或分别除以或,得相对数t,它表示误差范围为抽样平均误差的若干倍,t是测量估计可靠程度的一个参数,称为抽样平均误差的概率度。 第三十一页,共八十页。9/1/20223163 抽样(chu yn)推断的方法 抽样估计(gj)是指利用实际调查计算的样本指标值来估计(gj)相应的总体指标的数值。由于总体指标是表明总体数量特征的参数,所以也称为参数估计(gj)。 总体(zngt)参数估计有点估计和区间估计两种 1点估计。点估计(point estimation)的基本特点是,根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值作为相应总体参数的估计值(例
25、如以样本平均数的实际值作为相应总体平均数的估计值,以样本成数的实际值作为相应总体成数的估计值等)。 第三十二页,共八十页。9/1/202232When the estimation of a population is expressed as a single numerical value, it is referred to as a point estimation. 第三十三页,共八十页。9/1/202233常用概率(gil)度与概率(gil)保证度表概率度t 概率F(t) (%) 1.002.003.001.641.962.58 68.2795.4599.7390.0095.009
26、9.00 第三十四页,共八十页。9/1/202234抽样估计(gj)的优劣标准无偏性 unbiasedness有效性 efficiency一致性 consistency第三十五页,共八十页。9/1/202235无偏性 unbiasedness抽样指标的平均数等于全及指标。即:抽样指标的估计(gj),平均说来是没有误差的。第三十六页,共八十页。9/1/202236有效性 efficiency作为优良估计量的方差(fn ch)应比其它估计量的方差(fn ch)小。即:方差(fn ch)最小原则。第三十七页,共八十页。9/1/202237一致性 consistency当样本容量充分大时,抽样(chu
27、 yn)指标也充分地靠近全及指标。即:时,第三十八页,共八十页。9/1/2022382区间(q jin)估计 区间估计(interval estimation)是在一定的概率把握程度下,根据(gnj)样本指标和抽样极限误差去估计总体指标所在可能范围的方法。 在总体指标的区间估计公式中,有两个(lin )要素,一个是置信区间,另一个是置信概率。 第三十九页,共八十页。9/1/202239置信区间(confidence interval)又称为(chn wi)估计区间,是指由低限到高限两个数值所构成的可能范围,由样本指标和极限误差组成。 置信概率(confidence probability)是指
28、区间估计的概率保证程度,也称为置信度。它是表明样本指标与总体指标的误差(wch)不超过一定范围的概率有多大 估计(gj)的准确性问题 估计的可靠性问题 第四十页,共八十页。9/1/202240置信区间第四十一页,共八十页。9/1/202241总体平均数的估计就是(jish)用抽样平均数来估计总体平均数 【实例】某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查(dio ch),所得资料如下: 考试成绩(分)学生(xu sheng)人数(人)60以下1060-702070-802280-904090以上8按重复抽样方法以95.45%概率估计该校学生英语平均成绩的范围。 下限=
29、 =74.32分 上限= =78.88分 所以,在95.45%的概率保证程度下,该校学生英语考试的平均成绩的范围在74.32-78.88分之间。 第四十二页,共八十页。9/1/202242总体(zngt)成数的估计就是用抽样成数来估计总体(zngt)成数 仍按上例资料,以同样的概率估计该校学生成绩在80分以上(yshng)的学生所占的比重的范围。 解:样本合格率为 抽样(chu yn)平均误差为: 抽样极限误差为:所以,在95.45%的概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%-57.99%之间。 第四十三页,共八十页。9/1/2022436.3.2 样本容量
30、的确定(qudng) 1确定(qudng)必要样本容量的意义 样本单位数越多,样本的代表性越大,抽样误差越小,抽样估计就越可靠。但样本容量过多会增加不必要的人力、物力和费用开支,造成浪费。样本容量减少,又会使抽样误差增大,达不到所需要的准确(zhnqu)程度。 基本原则是,在保证预期的抽样估计可靠程度的要求下,抽取的样本单位数不宜过多。 第四十四页,共八十页。9/1/2022442影响(yngxing)样本容量的因素 (1)总体各单位标志变异程度(chngd)。总体标志变异程度(chngd)大,要求样本容量大些;反之,总体标志变异程度(chngd)小,样本容量可以小些。 (2)抽样方法。在其他
31、条件(tiojin)相同的情况下,重复抽样要比不重复抽样多抽取一些样本单位。 (3)抽样组织形式 。一般来说,类型抽样和等距抽样的样本容量要小于简单随机抽样的样本容量。 (4)极限误差的大小。如果允许误差大,样本容量就小;反之,如果允许误差小,样本容量就大。 (5)抽样估计的可靠程度即概率F(t)的大小。如果估计的可靠程度要求越高即F(t)越大,样本容量就越多;反之,如果估计的可靠程度要求越低,即F(t)越小,样本容量就越少。 第四十五页,共八十页。9/1/2022453必要(byo)样本容量的计算公式 (1)平均数的必要样本容量的计算公式在重复(chngf)抽样的条件下为:在不重复抽样的条件
32、下为:第四十六页,共八十页。9/1/202246(2)成数的必要样本容量的计算公式在重复抽样(chu yn)的条件下为:在不重复抽样的条件下为: 第四十七页,共八十页。9/1/202247【实例】对某罐头厂生产的罐头质量进行抽样调查,抽样极限误差(wch)为5%,概率为0.9545,并知过去进行同样抽样调查,其不合格率为10%,试求必要的样本容量。 根据题意可知:t=2、P=90%、=5%在重复(chngf)抽样的条件下: (盒) 第四十八页,共八十页。9/1/2022484计算必要(byo)样本容量应注意的问题 第一,在实际中采用不重复抽样。但常用重复抽样下的公式近似代替。 第二,若2,P未
33、知,其处理方式是: 用过去(近期)的数据代替;用样本数据代替;取P=0.5或最接近(jijn)0.5的P值。 第三,对同一总体,若求出的nx、np不等,这时取较大的一个作为必要抽样数目,以同时满足作两种调查的需要。 第四,在实际工作中,常使用重复抽样下的简单随机抽样公式。 第四十九页,共八十页。9/1/2022496.3.3 抽样的组织(zzh)形式 抽样的基本组织形式可分为简单(jindn)随机抽样(纯随机抽样)、类型抽样、机械抽样、整群抽样等几种。第五十页,共八十页。9/1/2022501 简单(jindn)随机抽样 simple random sampling又称纯随机抽样。它是按随机原
34、则直接从总体N个单位(dnwi)中抽取n个单位(dnwi)作为样本。不论是重复抽样或不重复抽样,都要保证每个单位(dnwi)在抽选 中都有相等的中选机会。 是一种最简单而又最基本的抽样组织形式,它往往带有盲目性 ,因此(ync)多用于对总体的初期研究。第五十一页,共八十页。9/1/202251简单随机抽样中抽选样本(yngbn)的常用方法有三种 第一种是直接抽取法第二种是抽签摸球法第三种是利用随机数表法第五十二页,共八十页。9/1/202252The 1970 Draft Lottery FiascoDuring both World Wars I and II, it became nece
35、ssary to establish an order in which men were to be drafted into the U.S. military, In 1917, accordingly,10,500 black capsules, containing numbers previously assigned to eligible men, were drawn from a glass fish-bowl. In l940, a similar procedure was adopted to draw 9,000 numbers, but there were cr
36、iticisms: The small, wooden paddle (Which was made from a piece of rafter traceable to Independence Hall in Philadelphia) used to stir the capsules in the bowl would not reach deep enough into the bow. 第五十三页,共八十页。9/1/202253It also broke open some of the capsules, impeding the mixing process further.
37、 In the end, the numbers drawn looked like anything but random ones; they were concentrated in certain clusters of hundreds, apparently reflecting the fact that the numbers had been poured into the bowl in lots of 100 each. The lesson was clear: thorough physical mixing of capsules in a bowl is diff
38、icult.第五十四页,共八十页。9/1/202254Apparently the lesson had been forgotten when thel970 draft lottery was instituted. Some 366 capsules, containing all the possible birthdates in a year, were poured into a bowl but not stirred. (There had been some mixing during the process of inserting dated slips of pape
39、r into the capsules). Then capsules were drawn out, the order of their withdrawal determining the priorities for the draft. 第五十五页,共八十页。9/1/202255The observed sequence strongly reflected the order in which the capsules were created (one month at a time), with late-in-the-year birthdays (that were enc
40、apsulated last) being drawn first and early-in-the-year birthdays(that were encapsulated first) being drawn last and, therefore, less subject to the draft. Several young men filed suit in federal court seeking to have the 1970 lottery voided on the basis of the apparent lack of randomization. Note:
41、A 1971 draft lottery, in response to widespread criticism of the 1970 lottery, made use of random-numbers tables .第五十六页,共八十页。9/1/2022562 分层抽样 又称类型抽样。它是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽选(chu xun)一定单位构成样本。 stratified random sampling类型抽样(chu yn)的方法又分两种:等比例抽样和不等比例抽样。第五十七页,共八十页。9/1/202257如果按比例分配(fnpi)样本单位,可
42、以得到类型抽样误差公式 1 在重复抽样条件下 变量总体: 其中 是各组方差的加权平均数,习惯上称为平均(pngjn)组内方差。 属性总体 其中 是各组比率的方差加权平均数,是属性总体的平均组内方差。 第五十八页,共八十页。9/1/2022582在不重复抽样(chu yn)条件下 以上总体 参数、是未知的,习惯(xgun)用样本值 、 代替 第五十九页,共八十页。9/1/2022593 等距抽样(chu yn) systematic sampling也称机械抽样或系统抽样。它先按某一标志对总体各单位进行排队,然后依一定顺序和间隔来抽取(chu q)样本单位的一种抽样组织 可分为按无关标志(bio
43、zh)排队和按有关标志(biozh)排队两种按无关标志排队指采用的排队标志与所研究的问题没有直接关系或联系较少按有关标志排队指采用的排队标志与所研究的问题有直接关系。第六十页,共八十页。9/1/2022604 整群抽样(chu yn) cluster sampling又称聚点抽样或群体抽样,它是先将总体(zngt)划分为若干群(R群),再从中任意抽取几群(r群),然后对抽中的群作全面调查,并据此结论对总体(zngt)加以推断。整群抽样尤其(yuq)适用于存在自然群的场合因为整群抽样是成群地抽选样本,故整群抽样的误差较大。由于整群抽样是成群地抽样,从而使样本对总体的代表性会降低。 第六十一页,共
44、八十页。9/1/202261 由于对抽中的群作全面调查,因此整群抽样的误差主要受各群间的差异即群间方差的影响(yngxing),而群内却不存在抽样误差问题。 整群抽样下的平均误差公式如下: 其中(qzhng) , 称为群间方差第六十二页,共八十页。9/1/202262必要抽样群数r的确定公式类同简单随机抽样中有关(yugun)公式。只不过现在确定的是r,并用组内方差 取代 。 【实例(shl)】某产品合计生产3000批,每批产量大致相同,抽样检查产品合格品率。要求其允许误差不超过2%,若根据过去该产品质量资料,其各批群间方差为3%,问在95.45%(t=2)可靠程度下需抽多少批产品为宜? 即要
45、在全部(qunb)产品中抽273批产品检查 第六十三页,共八十页。9/1/2022635 多阶段(jidun)抽样 multi-stage sampling 是在组织抽样(chu yn)时,不是从总体中一次直接抽取样本单位,而是把抽样(chu yn)过程分成几个过渡阶段进行。到最后才具体抽取样本单位。它是先抽大单位,再在大单位中抽小单位,在小单位中抽更小单位,直到抽出最终能取得推断总体的基本单位为止。 一般在总体(zngt)很大,单位分布面积广时,如从总体(zngt)中采取一次直接抽取足够多的样本很困难时,可采用多阶段抽样。 第六十四页,共八十页。9/1/2022646.4 参数(cnsh)假
46、设检验6.4.1 假设检验的基本概念假设检验(Hypothesis testing)是利用样本的实际资料来检验事先(shxin)对总体某些数量特征所作的假设是否可信的一种统计分析方法。第六十五页,共八十页。9/1/202265它和参数估计一样,都是利用样本资料对总体特征进行(jnxng)某种推断。但二者推断角度不同。参数估计是根据样本指标以一定的把握程度估计总体参数取值范围,更准确地说,是对总体参数进行了区间估计;假设检验则先对总体参数值提出一个假设,然后利用样本信息,以一定的概率水平去判断这个假设是否成立。第六十六页,共八十页。9/1/2022666.4.2 假设检验的步骤一个完整的假设检验
47、过程,通常包括以下四步骤:第一,提出原假设和备择假设;第二,选取和计算检验统计量;第三(d sn),根据显著性水平查临界值;第四,进行比较并做出决策。 第六十七页,共八十页。9/1/2022676.4.3 假设检验中的两类错误假设检验可能犯两种类型的错误。第一类错误(Type I error)指的是H0客观(kgun)上真实但被检验所拒绝,这种错误也称为弃真错误。犯这种错误的概率就是显著水平;第二类错误(Type II error)指的是H0客观上不真实但被检验所接受,这种错误也称为纳伪错误。犯这种错误的概率我们用(读作“贝塔”)来表示。 第六十八页,共八十页。9/1/2022686.4.4
48、总体均值和总体成数检验1大样本(yngbn)情况下总体均值检验在大样本(n30)情况下,总体均值的假设检验可以应用正态分布检验法。2小样本(yngbn)情况下总体均值检验在小样本(n30)情况下,总体均值的假设检验可以应用t分布检验法。此时,检验统计量为t统计量,它服从自由度为n-1的t分布。第六十九页,共八十页。9/1/202269【实例6.13】 某食品公司生产一种罐头,按标准每罐净重为227克,根据(gnj)以往生产经验罐头重量的标准差为5克。现随机抽查该公司产品100罐,测得平均净重为228克,判断这批罐头是否符合标准?解:第一步提出原假设和备择假设。H0:227 H1:227 第二步
49、选取和计算检验统计量。 , 代入数值,计算得 Z=3.33 第三步根据显著性水平查临界值。 由=0.05,得临界值-Z0.025=-1.96,Z0.025=1.96 第四步进行比较并做出决策。Z=3.33Z0.025=1.96 拒绝(jju)H0 即这批罐头不符合标准。 第七十页,共八十页。9/1/202270【实例6.14】 某轮胎制造商在广告中声称,该公司生产的汽车轮胎在正常行使条件下平均寿命高于28000公里。检测(jin c)部门随机挑选了40个轮胎进行测试,结果显示平均行使里程28200公里,样本标准差为1000公里,问该制造商广告是否属实?解:第一步提出假设。这需要确定检验的方向。
50、题中制造商称轮胎寿命高于28000公里,表述为28000,其余(qy)集为28000,由于等号在原假设上,故28000为原假设H0,28000为备择假设H1,此为右单侧检验。第二步计算统计量。由于总体标准差s未知,用样本标准差S替 代。Z 统计量为 代入数值,得Z=1.26第三步查临界值。因为是右单侧检验,=0.05时其临界值Z0.05=1.645第四步比较做决策。Z=1.26Z0.05=1.645 接受H0 轮胎平均使用寿命不高于28000公里 制造商广告不属实。第七十一页,共八十页。9/1/202271【实例6.15】 某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的平均使用寿命不能低于
51、1000小时。从产品中随机(su j)抽取100只灯泡,测得平均寿命为960小时,标准差为200小时,请问批发商是否应该购买这批灯泡?解:第一步提假设(jish)。H0:1000 H1:1000 第二步计算检验统计量。采用Z统计量 , 代入数值,计算得Z=-2 第三步查临界值。由=0.05,左单侧检验得临界值 - Z0.05=-1.645 第四步比较做决策。 Z=-2- Z0.05=-1.645 拒绝H0 即批发商不应当购买这批灯泡。第七十二页,共八十页。9/1/202272【实例6.16】某食品公司生产袋装食品,采用自动打包机打包。每包标准净重应为1000克,每天开工后需要检验一次打包机工作
52、是否正常。现从产品中随机抽取9包,实测每包净重如下:987,993,1012,1005,997,983,1021,995,1005,给定显著性水平=0.05,问该日打包机工作是否正常?解:由于本题关心的是每包净重是否为1000克,因此是双侧检验问题。又因为是小样本资料(zlio),故采用t分布检验法。 第一步提假设。H0:1000 H1:1000 第二步计算检验统计量。 , 样本平均数=999.8 样本标准差S=1.212 代入数值,计算得t=-0.495 第三步查临界值。=0.05,由于是双侧检验,自由度= n-1=8, 查t分布表,得临界值- t0.025(8)=-2.306,t0.025
53、(8)=2.306 第四步比较做决策。 - 2.306t=-0.4952.306 接受H0 该日打包机工作正常第七十三页,共八十页。9/1/2022733总体成数(chngsh)检验方法(fngf)及步骤与总体均值检验一样,只是在统计量公式中需要用到成数的标准差。其统计量公式为 【实例6.17】一家杂志声称(shngchng)其读者中至少有25%是在校大学生。从该杂志读者中抽取200名读者进行调查,发现其中42人是在校大学生。请问该杂志的论断是否正确(=0.05)解:第一步提假设。H0:p25% H1:p25% 第二步计算检验统计量。p = n1/n=42/200=21% 代入公式,计算得到 Z=-1.31 第三步查临界值。由=0.05,双侧检验得临界值- Z0.05=-1.645 第四步比较做决策。Z=-1.31- Z0.05=-1.645 接受H0 即该杂志的论断正确。 第七十四页,共八十页。9/1/2022746.5 Excel在抽样推断(tudun)中的应用6.5.1 利用Excel进行区间估计第一步:输入(shr)样本数据。第二步:输入相关变量的名称。本例中为C列的内容,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卫生光荣户评选制度
- 卫生院院感相关工作制度
- 综合市场卫生间管理制度
- 卫生许可证安全管理制度
- 卫生院安全责任公示制度
- 卫生院药品储备管理制度
- 社区卫生志愿者管理制度
- 卫生院公卫科室管理制度
- 理发店安全卫生管理制度
- 农产品卫生保障制度
- 升降平台车辆安全培训课件
- 2025年工业和信息化局公务员面试技巧与模拟题解析
- 部编版2025年八年级上册道德与法治教材习题参考答案汇编
- 止血材料行业分析研究报告
- 湖南省娄底市新化县2024-2025学年高一上学期期末考试生物试题(解析版)
- 军犬专业考试题及答案
- (一模)乌鲁木齐地区2025年高三年级第一次质量英语试卷(含答案)
- 人教版七年级上册数学有理数计算题分类及混合运算练习题(200题)
- 2025年云南省普洱市事业单位招聘考试(833人)高频重点提升(共500题)附带答案详解
- 电力行业网络与信息安全管理办法
- 兰州彤辉商贸有限公司肃南县博怀沟一带铜铁矿矿产资源开发与恢复治理方案
评论
0/150
提交评论