统计学专业教授的讲座(续)_第1页
统计学专业教授的讲座(续)_第2页
统计学专业教授的讲座(续)_第3页
统计学专业教授的讲座(续)_第4页
统计学专业教授的讲座(续)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 授课目录第1章 导论第2章 统计资料的整理与描述第3章 机率导论第4章 常用的机率分布与统计分布第5章 描样方法与描样分布第6章 统计估计第7章 统计检定第8章 变异数分析第9章 相关分析与回归模式第10章 无母数统计检定第11章 类别数据分析-列联表与卡方检定第五章 抽樣方法與抽樣分佈从被研究的母体中,随机抽取具有代表性的样本来进行分析,即是抽样调查。从人力、财力或时间的观点来看,抽样调查是比普查有效率。5.1 抽样方法抽样调查的方法很多,若考虑人力、财力、时间或母体性质等因素,可分为:(1) 简单随机抽样、(2) 分层抽样、(3) 群落抽样、(4) 系统抽样。(1) 简单随机抽样(Sim

2、ple Random Sampling)系指母体中的任一元素被选中的机率均一样的抽样方法。常以抽签方式或随机数表进行。由简单随机抽样法所得的样本称之简单随机样本,简称随机样本。此法可分为抽出放回(每次为1/N)或抽出不放回1/N,1/(N-1),1/(N-n-1)的抽样方式。(2) 分层抽样(Stratified Sampling)第1層第2層第k層樣本1a%×NRandomSamplinga%×n2b%×Nb%×n:k1-(a+b+k)%×N1-(a+b+k)%×n母体(N)样本(n)(3) 群落抽样(Clustered Sampl

3、ing)群落1群落2群落n1群2群k群樣本(4) 系统抽样(Systematic Sampling)系将母体的元素排列序后,每隔一定时间选取一样本,直到选满为止。间隔可以时间或空间为单位。5.2 抽样分布5.2.1 样本比例的抽样分布母体的比例p未知,须以抽样方法来估计。通常从母体抽取n个样本,观察其中具有某种属性的个数为x,并以= x/n表示样本比例。为p的估计值,即估计母体中具有某种属性的比例p。根据二项分布,执行n次试验中,若每次成功发生的机率为p,则随机变量X的期望值与变异数分别为Ex = np,Varx = np(1-p)。因此可得样本比例的期望值与变异数:E =Ex/n =Ex/n

4、= (np)/n = p (5.1)Var =Vx/n =Vx/ n2 = np(1-p)/ n2= p(1-p)/n(5.2)依中央极限定理,当n很大时,之抽样分布近似常态分布,即N(p, p(1-p)/n)(5.3)当样本数n愈大,的变异数愈趋近于零,表示样本比例会因样本愈大而愈接近母体比例p。将转为标准常态分布,即Z = (-p)/p(1-p)/n1/2 N(0, 1)例、致远管理学院学生有10%的比例有体重过重的现象,兹随机抽取400位该校学生,试问体重过重的比例之期望值与变异数? 又体重过重比例大于12%之机率?SOL:(a) E = p = 0.1Var = p(1-p)/n =

5、0.1*0.9/400 = 0.000225(b) P(> 0.12) =P(-0.1)/(0.000225)1/2 > (0.12-0.1) /(0.000225)1/2)= P(Z >1.33) = 0.0918公式、查表、Excel例、致远管理学院学生之统计学检定,正常下PASS之机率80%,兹200位该校学生进行该课程检定,试问PASS的比例 (a) 介于0.750.85之机率? (b) 大于0.9之机率?SOL:(a) E = p = 0.8Var = p(1-p)/n = 0.8*0.2/200 = 0.0008P(0.75 < < 0.85) = P

6、(-1.77 < Z<1.77)= 0.9232(b) P(>0.9) » P(Z >3.5) » 0公式、查表、Excel5.2.2 样本平均值的抽样分布利用样本平均值来推论母体的的平均值m,藉此了解母体集中趋势。依中央极限定理,从任何以期望值m,变异数s2的母体中,随机抽出n个样本x1, x2,xn(当n很大),则样本平均值将趋近母体的期望值为m、变异数为s2/n,即为标准常态分布(-m)/s2/n1/2= Zn®N(0, 1)(5.4)即样本平均值N(m, s2/n)。5.2.3 两样本平均值的抽样分布通常是应用在不同母体间某性质差异

7、之比较,如工管系两班学生统计学成绩的差异。由两样本平均值的抽样分布,去衡量推论母体平均值差m1 - m2的状况。两母体分别为(m1, s21)、(m2, s22),且两者的分布并不一定是常态。倘各自从中取出两组样本,因此两组样本互为独立,且®N(m1 , s21/n1),®N(m2 , s22/n2),故-®N(m1 - m2, (s21/n1)+( s22/n2)(5.5)例、某工厂有2条独立的生产线,平均每天产500匹布,即m1 = m2= 500,s1= 9, s2= 12,假设第1条生产线生产81天,第2条生产线生产36天,求每天平均生产量,之差小于1匹的

8、机率?SOL:(s21/n1)= 81/81=1,®N(500, 1)( s22/n2)=144/36 = 4,®N(500, 4)-®N(m1 - m2, (s21/n1)+( s22/n2) = N(0, 5)P(|<1) = P(-1<<1)= P(<<) = 0.345/ =normsdist(0.447)-normsdist(-0.447)/例、A公司债券x1每日殖利率之平均值为0.2,标准差为0.3,B公司债券x2每日殖利率之平均值为0.1,标准差为0.2。倘A与B公司债券彼此独立,兹取49天殖利率为样本,则求 (a) 样

9、本平均值差之期望值 (b) 样本平均值差之变异数 (c) 样本平均值差小于0.2的机率?SOL:®N(0.2, 0.32/49),®N(0.1, 0.22/49)-®N(m1-m2, (s21/n1)+( s22/n2)=N(0.1, 0.32/49+ 0.22/49)(a) E-= E-E = 0.1(b) Var-= Var+Var = 0.32/49+ 0.22/49= 0.00265(c) P(-<0.2)=P(<)=P(Z<1.94) = 0.9738/ = normsdist(1.94)/5.3 t分布的应用(s未知时使用)在介绍样本

10、平均值的抽样分布时,得知随机样本来自期望值m,变异数s2的母体时,则样本平均值N(m, s2/n)。倘母体的变异数s2为未知,则s2/n之值无法求得。此时,若母体是来自常态分布时,可用t分布。t分布考虑母体是常态分布,但母体变异数s2未知时,以样本变异数S2取代之。t = = tn-1(5.6)例、某宝石公司卖出蓝宝石之平均价为8.5万元/克拉,变异数未知之常态母体,上周卖出25克拉蓝宝石中,其价格标准差为1.9万元/克拉。求上周卖出25克拉蓝宝石中之平均价大于9万元/克拉的机率?SOL:t = = tn-1,= t24P(>9) = P(>)= P(t24 >1.3) =

11、0.1/ = tdist(1.3, 24, 1)/5.4 样本变异数S2的抽样分布利用样本变异数S2来推论母体的的变异数s2,藉此了解母体离散程度。产品质量变异数愈小愈好,以减少不合格率,降低成品,增加利润。5.4 .1 卡方分布的应用:样本变异数S2的抽样分布假设x1, x2,xn是一个来自N(m, s2)分配的随机样本。则其平方和除以s2后就依循卡方分配。SS/s2= åni =1 (xi-)2/s2=c2n-1另S2=åni =1 (xi-)2/(n-1) = SS/(n-1)c2n-1= (n-1) S2 /s2 = åni =1 (xi-)2/s2(5.

12、7)S2的分布为s2/(n-1)c2n-1。故样本变异数的抽样分布为一个常数乘以卡方分布。另卡方分布的性质:Ex c2n-1 = n-1Þ Ex c2n-1= E(n-1) S2/s2 = (n-1) /s2ES2 = n-1ÞES2 = s2(5.8)Varx c2n-1= 2(n-1)Þ Varx c2n-1 = Var(n-1) S2/s2= (n-1)2/s4 VarS2=2(n-1)ÞVarS2 = 2s4/(n-1)(5.9)例、某公司生产机车引擎,品管部门以引擎轴长的变异数来判断生产过程是否一致性。假设每个引擎轴长的变异数为0.8,整批产品

13、的变异数超过1.3,表示此批产品不佳,须重新调整生产过程。兹抽样10个引擎,试问须重新调整生产过程的机率?SOL:P(S2 >1.3) =P(n-1)S2/s2 >9(1.3)/0.8)= P(c29>14.6) = 0.1/=chidist(14.6,9)/5.4.2 F分布的应用:两样本变异数比S12/S22的抽样分布比较两母体的的变异数是否相等时,可利用样本变异数比S12/S22来判定。如比较两超商连锁店营业额之变异、比较两基金操作获利之变异等,以观察两者间之稳定情形。S12/S22®1,显示两母体的的变异数s12, s22相当接近。假设分别来自二个不同母体的

14、随机样本,各取样本n1, n2其各别样本变异数为S12与S22则(S12/s12)/S22/s22)=(5.10)利用F的抽样分配,可求得样本变异数比S12/S22的抽样分配。其中样本变异数比S12/S22会因样本愈大而愈接近母体变异数比s12 /s22。投资风险的大小,一般由短期投资的可能结果而定。最常用以衡量短期投资之方法即计算可能结果的变异数。例、假设有A、B两种投资组合,其平均报酬率为20%,但A投资组合10年来获利的变异数为8.4, B投资组合8年来获利的变异数为3.1,倘两种投资组合的母体变异数均相等,即s12 /s22,试问A、B两种投资组合变异数比大于2.7的机率?SOL:P(

15、S12/S22>2.7) =P(S12/s12)/S22/s22>2.7)=P(>2.7)= P(F9, 7 >2.7) = 0.1/= fdist(2.7, 9, 7) /习题1. 从一个常态母体N(30,400)中抽出100样本,令为样本平均值,则(a) 会服从何者分布- N(30, 22=400/100),期望值与变异数为何? (b) P(< 32) =0.8413。2. 从一个p = 0.4的白努利试验中抽出100样本,组成样本比例。则 (a) 会近似何种分布- N(0.4, 0.24/100)期望值与变异数为何? (b) P(< 0.45) =0.

16、8461)。3. 致远夜市55%的顾客是女性,从中随机抽取200位顾客,且为这200位顾客中女性所占的比例,则 (a) 之抽样分布- N(0.55, 0.012375) (b) P(> 0.56) =0.388。4. 某公司生产汽车轮轴,而轮轴的直径呈N(30,0.12),单位为cm。兹要生产4个汽车轮轴,并由此4个样本组成样本平均值。则(a) 会服从何者分布- N(30, 0.0025)。 (b) P(< 29.875) =0.0062。5. 有两相互独立的常态母体N(57,122 )、N(25,62 )中分别抽出36个样本,试问(a) 会服从何者分布- N(32, 5)。 (b

17、) P(> 35) = 0.09。6. 致远管理学院入学考试英文成绩平均值为68分、变异数25;数学成绩平均值为54分、变异数30,又二科成绩相互独立。兹由所有参加者中,抽取50位,令表示英文成绩样本平均值;表示数学成绩样本平均值。试问(a) 会服从何者分布- N(14, 1.1)。(b) P(> 16) = 0.028。7. 设X1, X2,Xn为抽取自常态分布N(m, s2)的一组随机样本,S为样本标准差。试写出以下各个统计量所服从的抽样分布(A)= N(m, s2/n) (B) = N(0,1) (C)= c2n-1 (D) = t n-1。8. 某养鸡场中,成鸡重量为平均体

18、重2公斤,变异数s2未知之常态分布。目前欲批发1000只成鸡,但是不知其平均体重为多少。于是从中抽出26只鸡来称重(抽出放回),假设其样本平均数公斤,样本变异数S2=0.25。试问大于2.2公斤之机率是多少=0.025。9. 某学生在致远夜市打工,卖新潮牛仔裤,他决定以新潮牛仔裤卖出价格的变异数来判定开价是否合理。假定每条新潮牛仔裤的卖出价格变异数为100。若整批新潮牛仔裤卖出价格变异数超过180,即表示此批新潮牛仔裤开价不合理,需要重新调整开价。从昨天新潮牛仔裤卖出价格中随机挑取17次交易,试求重新调整开价之机率P(S2>200)= P(n-1)S2/s2>16*180/100) =P(c29>28.8)=0.025。10. 有两个互相独立的常态母体N(m1, s12)、N(m2, s22),若由这两个母体各自抽出n1,n2个样本,令其样本变异数分别为S12、S22。试写出统计量 (S12/s12)/(S22/s22)所服从的抽样分布F(n1-1,n2-1)。11.自由度= ,P(t>ta)= 0.05,ta=( 1.645 )。自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论