统计学大题(1-3)要点_第1页
统计学大题(1-3)要点_第2页
统计学大题(1-3)要点_第3页
统计学大题(1-3)要点_第4页
统计学大题(1-3)要点_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。抽取零售企业105家的销售收入如下表:月销售额(万元)分销店(个)组中值40以下153040 601950me 60-80mo 267080-1002090100 12014110120以上11130解:先求出组中值,如上表所示。直接按计算器,可得:算术平均数=76.09标准差=30.65中位数=60+ (105/2 ) -34/26 *20=74.23众数=60+ (26-19 ) / (26-19 ) + (26-20 ) *20=70.77附:计算器按法:开机一 mode2shift-mode - 1一二 一输入数据(30 sh

2、ift ,15 m+ 50 shift , 19 m+ )fshift -2一计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差2,区间估计求置信区间的方法与步骤:第一步 根据中心极限定理,构造一个含未知参数的分布第二步对给定的置信度,1-“查表得到标准分 zo/2第三步 利用不等式变形,求出未知参数1-遭信区间.给定置信度1 -)就有:总体均值r的置信区间为:_ctxw n,二,总体均值的区间估计正态总体,方差已知,(大、小)样本已知总体例1 ,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4 mm标准差o=0.15mm,试建立该种零件平均长度的置信

3、区间,给定置信水平为0.95。解:已知 x-n(n, 0.152), 7=2.14, n=9, 1-ct = 0.95 , zct/2=1.96总体均值n的置信区间为1 仃 仃、,0.150.15、,x-za2-=,x+zcy2-= = 21.4-1.96,21.4+1.96 =(21.302,21.498)1 vnn j 5%时,需要修正,n: xz nn j n -n赤丫瓦二,例2,某企业生产某种产品的工人有 1000人,某日采用非重复抽样抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。已知

4、:n =1000,n =100 30=10% 5% nx =35,1- =4.5,1 -: =95.45%求:1 ;:x2 口解:由1ot =95.45% 知zg = 222.n -nn -14.51000-100重复抽样vs不重复抽样大样本:(x =p: pzp,s2 =pq)pq=2 x -,100 , 1000-1= 0.86(件)2 口: x_ 4 = 35二0.86 = 34.14,35.86正态总体,大样本,当方差未知时,以样本方差替代即可总体比例的区间估计pi p”,叵 jnhj 豺 n , n -1 ,例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了2

5、00人组成一个样本。在对其进行访问时, 有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。解:已知 n=200 , p=0.7 , g 0.95 , zw2=1.96 o伙1-?)?-z:2,.n= 0.7 -1.96. 0.7(1 -0.7),2000.636,0.76463.6%76.4%结论:我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在 之间。1 - az 土68.26%180%1.2890%1.64595%1.9695.45%299%2.5899.73%3t分布:正态总体、当样本容量

6、nv 30,总体标准差未知时,用样本标准是 s代替。 / 自由度为(n-1)置信区间为:x 士tsk例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为 789、780、794、762、 802、813、770、785、810、806,如果袋装重量服从正态分布,要求以 95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差ox已知:x =n789 780+80610= 791.1= xl (x-xf = 2642.9s n -1 一,10-1= 17.1361 - 95%求:1 22 口解:由1ct =95%知t-.=t005=2.2622xx = t17.13

7、6= 2.2622 万 n, 一 nj0= 12.26便)口: x _ x = 791.1-12.26=778.84,803.36三,样本容量的计算估计总体均值时样本容量的确定:根据均值区间估计公式可得样本容量n。z22 二根据比例区间估计公式可得样本容量n为 n =z22p(1 -p):2(若总体比例p未知时,可用样本比例来代替)例:某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过 已知:。-160, :x =20,1 - : - 0.95求:n20元,应抽多少顾客作样本?解:由1a= 0.9

8、5 知 z. =1.962.n即:20 =1.96 160n1.96x160、2i =246120)总体方差未知时样本容量的确定0.05,且置信度为例1,某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有关人员到该地区查询资料,以便 估计一下该地区有电脑的家庭所占的比例。公司希望这一比例的估计允许误差不超过95%。问:要抽取多大容量的样本?(事先对总体一无所知)解:已知a=0.05 , a=0.05 , z决=1.96 ,当p未知时用最大方差0.25代替应抽取的样本容量为r 2z:.2 p(1 -p)0 二(1.96)2(0.5)(1 -0.5)(0.5)2 :3855000件,过去几

9、次同类调查所得的产品合格 3% ,在99.73%的概率下应抽查多少件产品例2,某企业对一批产品进行质量检查,这批产品的总数为 率为93%、95%、和96% ,为了使合格率的允许误差不超过 已知:n =5000, , p =3%,1 - : - 99.73%求:n解:应用最大标志值计算样 本容量由 1 a =99.73% 知za =34 .假设检验步骤:1、提出原假设和备择假设原假设:有待检验的假设备择假设:拒绝原假设后可供选择的假设。原则:(1) “不轻易拒绝原假设(2)原假设总是与等号连在一起 假设的三种形式:(1)双侧检验:(2)左侧检验:如果指标越大越好以及要求指标是否明显降低。(3)右

10、侧检验:如果指标越小越好以及要求指标是否明显增加2、选择适当的统计量,并按照中心极限定理确定其分布形式3、选择选择显著性水平,确定临界值。显著性水平1a表示h为真时拒绝h的概率,即拒绝原假设的风险。(二总是与h相对应)4、抽取样本,计算样本统计量,比较统计量与临界值的大小。5、作出统计结论和经营管理决策结。例题1 :(右侧检验)根据过去大量资料,某厂生产的产品的使用寿命服从正态分布n(1020,100 2),现从最近生产的一批产品中随机抽取 16件,测得样本平均寿命为 1080小时。试 在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?已知:为=1020,。=100,n =16,x

11、 =1080,: =0.05正态总腕差已朱样本求:1020右检验解:h 0 : 口 m 1020 , h 1 : 11020由口 = 0.05知 z0.05 = 1 .645x - j01080 -1020/ = =2.41.645二拒绝原假设 h 0,接受h 1即这批产品的使用寿命有显著提高.例题2:(左侧检验)一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的平均温度是1250 c,在过去,供货商提供的产品都符合要求,并从大量的数据获知零件抗热的标准差为150 c,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200 c,能否接受这批产品?工厂希望对实际产品符合要

12、求而错误地加以拒绝的风险为0.05。已知: = 1250,二=150,n = 10030, x = 1200o 0.05证明j 1 2 5 0333 j.645解:h 0 :一 1250 , h 1 :1250由口 = 0.05知 z1 仃=z095 = - 1.645 .1200 - 1250=- 3.33- 1.645拒绝h 0,接受h 1产品不合格,拒收.例题3: (t-检验)相关知识:正态总体、方差未知、小样本时服从t分布某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查 9包,测得样本平均重量为 986克,样本标准差 为24克。试问在0

13、.05的检验水平上,能否认为这天自动包装机工作正常?已知:x n 1000:2 , % =1000n=9 3qx=986,s = 24,: =0.05;求:二二1000解:h :=1000 , h 1 :二 1000由 a =0.05知 ta = 1 0 025 f8 = 2.3062 n二 一1.75, t = 1 .75 2.306接受h 0,拒绝h 1.这天自动包装机工作正常例题4: (z-检验)相关知识:对总体比例的假设检验通常是在大样本的条件下进行的,根据正态分布来确定临界值,即采用z-检验法。某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了 200个家庭,其中68个家庭拥

14、有电脑。试问该研究者的估计是否可信(a =10% ?已知:巳=30%, n = 200 3068p 0.34,: =10%200求:p = 30%解:h 0 : p = 30 %, h i p = 30 % 由 u =10%知:2=1.645=1 .23 : 1 .645二接受h 0,拒绝h 1.即:该研究者的估计是可信的.5 .相关与回归分析:相关知识:(1)相关系数的计算公式:一般用明表示总体相关系数,用r表示样本相关系数。相关系数r的平方等于可决系数。n% 刈-、xx yn xx2、n% y2- y2(2)估计标准误差:用来说明回归方程代表性大小的统计分析指标。若估计标准误差小,表明回归

15、方程-y2 - a- y- b-xy代表性大;反之,若估计标准误差大,表明回归方程代表性小。sy = 1, n- 2例题:现有8个企业的月产量和生产费用资料如下表:月产量(吨)1.223.13.856.17.28生产费用(万兀)628680110115132135160求:(1)计算相关系数,指出两者之间的相关程度;(2)计算判定系数,并解释;(3)用最小平方法配合生产费用又脱1产量的回归直线模型;指出回归系数的经济含义;(4)求可决系数,并解释。(4)估计回归的标准误差;解:(1)r =n x xy- x x ynz x2 -(z x 2 j n y2 -3 y 28 45446-364 8

16、80,8 20754-36.42 ,8 104214-8802= 0.96971(2)? = y - &?二 qx、y 3nz x2 -x 2:? 8 4544 .6 - 36.4 8808 207 .54 - 36.42=12.9 2。880?=-12.98=51.305 136 .4(3)回归系数的经济含义为当月产量每变动1吨时,生产费用同方向平均变动12.9万元。(2分)(4) r2=0.9697=0.940生产费用白增加 94应由于月产量白增加,有6必其他因素引起的。(注意:不确定是不是这样答)(5) sy =-y2 - a- y - b-xyn- 2=(10421451.305 x

17、88012.9 x 4544.6 ) + 60.5=233.476.统计指数:计算原则:(1)在计算综合指数时,同度量因素必须固定在同一期。(2)在计算质量指标综合指数时,同度量因素选择数量,且必须固定在报告期。一 “ p1q1kp =_曰(帕氏指数)、pqi(3):在计算数量指标综合指数时,同度量因素选择质量,且必须固定在基期。kq = e p0q1 (拉氏指数)例题:设某粮油商店2006年耨2cpiq种商品的零售价格和销售量资料如表。计算三种商品的价格综合指数和销售量综合指数。并利用指数体系分析价格和销售量变动对销售额的影响某粮粮油商店三种商品的价格和销售量商品名称fh1 单位销售量单价(

18、元)2006200720062007粳 米公斤120015003.64.0标准粉公斤150020002.32.4花生油公斤5006009.810.6计算过程:商品名称单位销售量单价(元)销售额(元)2006 q02007 q12006 p02007 p12006 p0q02007 p1q1p0q1p1q0梗 米kg120015003.64.04320600054004800标准粉kg150020002.32.43450480046003600花生油kg5006009.810.64900636058805300合计一一一一一12670171601588013700,“ piqi17160 (1)

19、价格综合指数为:kp = = 108.06%p p0q 15880(2)销售量综合指数为:kqpq1poq。1588012670= 125.34%(3)销售额指数 =二 = 17160 = 135 .44 % pq01267025.34% ,销售额平结论:与2006年相比,三种商品的零售价格平均上涨了8.06%,销售量平均上涨了均上涨了 35.44%。、一销售额变动= p1q1 -z p0q0 =17160 -12670 =4490(元)价格变动的影响额=qr p1q1 -z p0q )=1716015880 = 1280(元)销售量变动的影响额= p。- poq。=15880-12670=

20、3210(元)分析: 三者之间的相对数量关系135.44%=108.06% x 125.34%三者之间的绝对数量关系4490(元)=1280(元)+3210(元)结论:2007年与2006年相比,三种商品的销售额增长35.44%,增加销售额4490元。其中由于零售价格变动使销售额增长 8.06%,增加销售额1280元;由于销售量变动使销售额增长25.34% ,增加销售额3210元。7.填表相关知识:发展速度=父100% 基期数据(1)环比发展速度:亘,包,包,.,ana0 a1 a2 and(2)定基发展速度:亘,曳,总,.,ana a aa0一者关系:(1)观察期内各环比发展速度的连乘积等于

21、最末期的定基发展速度n工=连口为连乘符号 亘ma2m也m父旦=anyi 1 y0a0 a1 a2an-1a0(2)两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度yl入二工y0y0yi-1增长速度=增减量基期水平报告期水平-基期水平基期水平报告期水平 基期水平- 100 %- 100 %环比增长速度=anan 1an -1卫1an-1发展速度二环比发展速度-100%定基增长速度=an1=定基发展速度-100%注意:定基增长速度与环比增长速度之间不存在直接的换算关系。通常要先将增长速度转化为发展速度, 再进行计算。已知:年份出口总值(万 美元)差额对比(力美兀)环比( )定基比(% )逐期发展速度增长速度发展避度噌长速度199695.219974.819988.81999105.820004.52001128.2结果:年份出口总值 (力美兀)差额对比(力美兀)环比()定基比(% )逐期累计发展速度增长速度发展速度增长速度199695.2-一一100一1997100.04.84.81

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论