下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、指出下面的数据类型:某研究部门准备抽取一家研究机构从 IT 从业者中随机抽取?一项调查表明, 消费者每月在网上购物的平均花费是200指出下面的数据类型:某研究部门准备抽取一家研究机构从 IT 从业者中随机抽取?一项调查表明, 消费者每月在网上购物的平均花费是2000 个职工家庭推断该城市所有职工家庭的年人均收入。要求:1 000 人作为样本进行调查, 其中 60回答他们的月收入在200 元,他们选择在网上购物的主要原因是5“价二、主观题 (共4 道小题) 6.(1) 年龄(2) 性别(3) 汽车产量(4) 员工对企业某项改革措施的态度(赞成、中立、反对)(5) 购买商品时的支付方式(现金、信用
2、卡、支票)参考答案:(1) 年龄:离散 数值数据(2) 性别:分类数据(3) 汽车产量:离散 数值数据(4) 员工对企业某项改革措施的态度(赞成、中立、反对):顺序数据(5) 购买商品时的支付方式(现金、信用卡、支票):分类数据7.(1) 描述总体和样本。(2)指出参数和统计量。参考答案:(1)总体:全市所有职工家庭;样本:2000个职工家庭(2)参数:全市所有职工家庭的人均收入;统计量:2000个职工家庭的人均收入。8.000 元以上, 50的人回答他们的消费支付方式是用信用卡。要求:(1) 这一研究的总体是什么 ?(2) 月收入是分类变量、顺序变量还是数值型变量(3) 消费支付方式是分类变
3、量、顺序变量还是数值型变量(4) 这一研究涉及截面数据还是时间序列数据 ?参考答案:(1) 所有 IT 从业者。(2) 月收入十数值型变量(3) 消费支付方式是分类变量 (4) 涉及截面数据9.?200 元”是参数还是统计?200 元”是参数还是统计量 ?(1) 这一研究的总体是什么 ?(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量(3) 研究者所关心的参数是什么 ?(4) “消费者每月在网上购物的平均花费是 (5) 研究者所使用的主要是描述统计方法还是推断统计方法参考答案:(1) 网上购物的所有消费者(2) 分类变量(3) 所有消费者网上购物的平均花费、所有消费者选择网
4、上购物的主要原因(4) 统计量(5) 描述统计统计学 A第二次作业二、主观题 (共1 道小题) 31. 自填式、面访式、电话式各有什么长处和弱点 ? 参考答案:自填式优点:调查成本最低;适合于大范围的调查;适合于敏感性问题的调查。自填式缺点:较低的回收率;不适用于较复杂的问题的调查;调查中回答问题的情况不受控制(比如多人采用相同的回答);调查周期长。面访式优点:较高的回答率;调查员可以对回答进行解释、确认、澄清,避免含混不清的回答。面访式缺点:调查成本高;不适用于敏感性问题;调查员的素质会影响调查质量。电话式优点:速度快;便于调查控制;适合于大范围的调查。电话式缺点:受电话安装情况的限制;在涉
5、及复杂问题,或问题较多时,容易被拒绝回答。为评价家电行业售后服务的质量,随机抽取了由BCDDCCBDDC为评价家电行业售后服务的质量,随机抽取了由BCDDCCBDDC100 个家庭构成的一个样本。服务质量的等级分AECDBEADCBEEBCCBECBC(注意:若有主观题目,请按照题目,离线完成,完成后纸质上交学习中心,记录成绩。在线只需提交客观题答案。 ) 二、主观题 (共5 道小题) 16.别表示为: A好;B较好;C一般;D较差; E.差。调查结果如下:B E C C A D CD A C B C D EA D B C C A EB A C D E A BC B C E D B CD A
6、C B C D EB E C C A D CB A C E E A BA D B C C A EC B C E D B C要求:(1) 指出上面的数据属于什么类型。(2) 用 Excel 制作一张频数分布表。(3)绘制一张条形图,反映评价等级的分布。(4)绘制评价等级的帕累托图。参考答案:(1) 顺序数据(2) 用数据分析直方图制作:接收 频率E 16 (3) 用数据分析直方图制作:D 17C 32B 21A 14(4) 逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率 (%)C 32 32 32B 21 21 53D 17 17 70E 16 16 86A 14 14 100
7、某行业管理局所属124 129119 114108 10588 123- 频数23912742140频率%1012994040 个企业 2002 年的产品销售收入数据如下:116115110115最小值)频率% 累计频数5.07.522.530.017.510.05.02.5100.0累计频数25.030.022.522.5100.0100某行业管理局所属124 129119 114108 10588 123- 频数23912742140频率%1012994040 个企业 2002 年的产品销售收入数据如下:116115110115最小值)频率% 累计频数5.07.522.530.017.51
8、0.05.02.5100.0累计频数25.030.022.522.5100.010087107119组数=(114-42)6=10.83,取 1累计频率 %25142633373940累计频率 %102231401031031371385.012.535.065.082.592.597.5100.025.055.077.5100.0921181201129514213614612713511711310412510812615210511797要求:(1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。(2)按规定,销售收入在 125万元以上为先进企业, 11512
9、5万元为良好企业,105115 万元为一般企业, 105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。参考答案:(1)1、确定组数:,取 k=62、确定组距:组距( 最大值03、分组频数表销售收入80.00 - 89.0090.00 - 99.00100.00 - 109.00110.00 - 119.00120.00 - 129.00130.00 - 139.00140.00 - 149.00150.00+总和(2)频数先进企业良好企业一般企业落后企业总和一种 袋装食品用 生产线自动 装填,每袋重量大约为 50g,但由于某些原因,每袋重4660515152524459
10、4753一种 袋装食品用 生产线自动 装填,每袋重量大约为 50g,但由于某些原因,每袋重46605151525244594753- - 百分比40.00 - 42.00924192414710049524846535957454857最小值)最小值)累计频数39.024.019.024.014.07.0100.054545348475352454449组数=(61-40)6=3.5,取3或组数=(61-40)7=3,累积百分比3.0123655799310055515047455042465756312.036.055.079.093.0100.0585552534843495247563.
11、049604047545343555357量不会恰好是 50g。下面是随机抽取的 100 袋食品,测得的重量数 据如下:单位:g57515352504949515455要求:(1) 构建这些数据的频数分布表。(2) 绘制频数分布的直方图。(3) 说明数据分布的特征。参考答案:解:(1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:,取 k=6或 72、确定组距:组距( 最大值者 4、5组距( 最大值3、分组频数表组距 3,上限为小于频数有效43.00 - 45.0046.00 - 48.0049.00 - 51.0052.00 - 54.0055.0
12、0 - 57.0058.00+合计直方图:百分比= 40.007282822131100累计频数17.028.028.022.013.01.0100.0累积百分比1.083664869910018.036.064.086.099.0100.01.0组距 4,上限为小于等于百分比= 40.007282822131100累计频数17.028.028.022.013.01.0100.0累积百分比1.083664869910018.036.064.086.099.0100.01.0频数有效41.00 - 44.0045.00 - 48.0049.00 - 52.0053.00 - 56.0057.00
13、 - 60.0061.00+合计直方图:百分比= 45.003734161100累计频数1237.034.016.01.0100.0累积百分比12.049.083.099.0100.012.049.083.099.0100.012.0组距 5,上限为小于等于百分比= 45.003734161100累计频数1237.034.016.01.0100.0累积百分比12.049.083.099.0100.012.049.083.099.0100.012.0频数有效46.00 - 50.0051.00 - 55.0056.00 - 60.0061.00+合计直方图:甲乙两个班各有 40名学生,期末统计学
14、考试成绩的分布如下:甲班甲乙两个班各有 40名学生,期末统计学考试成绩的分布如下:甲班19.人数考试成绩优 3良 6中 18及格 9不及格 4要求:(1) 根据上面的数据,画出两个班考试成绩的对比条形图和环形图。(2) 比较两个班考试成绩分布的特点。(3) 画出雷达图,比较两个班考试成绩的分布是否相似。参考答案:(1)(2)甲班成绩中的人数较多,高 分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。(3)已知 1995 2004 年我国已知 1995 2004 年我国的国内生产总值数据如下( 按当年价格计算):国内生产总值第一产业58478.167884674462678345
15、2820675894681973148105172.311739021368759第二1199313844.21421121455241447196146282154118161173169281207680728533637238640544948752961272320.单位:亿元年份1995199619971998199920002001200220032004要求:(1) 用 Excel 绘制国内生产总值的线图。(2) 绘制第一、二、三产业国内生产总值的线图。(3) 根据 2004 年的国内生产总值及其构成数据绘制饼图。参考答案:(1)(2)1521202720293815212027
16、20293819223125221934172418162423统计学 A第四次作业二、主观题 (共7 道小题) 18.随机抽取 25个网络用户,得到他们的年龄数据如下:单位:周岁1923302341频率1111321232411111111=25/4=6.25 ,因此 Q1=19,Q3位置=325/4=18.75 ,因此 Q3=27,或者,累计频数4.04.04.04.012.08.04.08.012.024.04.04.04.04.04.04.04.0累计频率123479101215频率1111321232411111111=25/4=6.25 ,因此 Q1=19,Q3位置=325/4=1
17、8.75 ,因此 Q3=27,或者,累计频数4.04.04.04.012.08.04.08.012.024.04.04.04.04.04.04.04.0累计频率1234791012158.01819202122232425171(1)计算众数、中位数: (2) 根据定义公式计算四分位数。(3)计算平均数和标准差;(4)计算偏态系数和峰态系数:(5)对网民年龄的分布特征进行综合分析:参考答案: (1)1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄频数151617181920212223Valid2527293031343841Total 25 100.0从频数看出,众数 Mo有两
18、个:19、23;从累计频数看,中位数 Me=23。(2)Q1位置由于 25和 27都只有一个,因此 Q3也可等于 25+0.752=26.5。(3)均值 =24.00;标准差 =6.652(4)偏度系数 SK=1.080;峰度系数 K=0.773(5)分布,均值 =24、标准差 =6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:频30007.0237749.3331.1631.302累计频数4.032.036.012.08.04.04.0100.0累计频率1918212324254.036
19、.072.084.092.096.0100.0,取 k=6频30007.0237749.3331.1631.302累计频数4.032.036.012.08.04.04.0100.0累计频率1918212324254.036.072.084.092.096.0100.02、确定组距:组距 ( 最大值 - 最小值) 组数=(41-15)6=4.3,取 53、分组频数表网络用户的年龄 (Binned)频数= 1516 - 2021 - 2526 - 30Valid31 - 3536 - 4041+Total分组后的均值与方差:均值标准差方差偏度系数 Skewness峰度系数
20、 Kurtosis分组后的直方图:3 排等待。为比较哪种排队方式使顾客等待的时9 名顾客。得到第一种排队方式的平均等待时间为(单位:分钟 )如下:茎叶图(=5.5)6 . 7 . 7 . 70.7141430.51企业数(个)3 排等待。为比较哪种排队方式使顾客等待的时9 名顾客。得到第一种排队方式的平均等待时间为(单位:分钟 )如下:茎叶图(=5.5)6 . 7 . 7 . 70.7141430.51企业数(个)1930421811计72 分钟,标准差67813488120进入一个等待队列:另种是顾客在三千业务窗口处列队间更短两种排队方式各随机抽取为197 分钟。第二种排队方式的等待时间55
21、 6 6 6 7 6 8 7 1 7 3 7 4 7 8 7 8要求:(1) 画出第二种排队方式等待时间的茎叶图。(2) 计算第二种排队时间的平均数和标准差。(3) 比较两种排队方式等待时间的离散程度。(4)如果让你选择一种排队方式,你会选择哪种?试说明理由。参考答案:(1)第二种排队方式的等待时间 (单位:分钟 ) Stem-and-Leaf Plot频数1.00 3.00 3.00 2.00 (2)(3) 第二种排队方式的离散程度小。(4) 选择第二种,均值小,离散程度小。均值标准差方差20. 在某地区抽取 120 家企业,按利润额进行分组,结果如下:按利润额分组 (万元)20030030
22、0400400500500600600以上合要求:(1) 计算 120 家企业利润额的平均数和标准差。(2) 计算分布的偏态系数和峰态系数。有效0426.6667116.484450.208-0.62560kg ,标准差为 5kg有效0426.6667116.484450.208-0.62560kg ,标准差为 5kg ;女生的平均体重为?为什么?55kg一 65kg之间?40kg60kg之间?120解:Statistics企业利润组中值 Mi(万元)N缺失均值标准差偏度系数 Skewness峰度系数 Kurtosis21. 一项关于大学生体重状况的研究发现男生的平均体重为50kg ,标准差为
23、 5kg 。请回答下面的问题:(1) 是男生的体重差异大还是女生的体重差异大(2) 以磅为单位 (1ks 22lb) ,求体重的平均数和标准差。(3)粗略地估计一下,男生中有百分之几的人体重在(4)粗略地估计一下,女生中有百分之几的人体重在参考答案:(1)55kg一 65kg之间?=3 700 件,标准差为 50 件。如果某一天的产量低于或高于平均产周二五3 850 590 周一 周二 周三 周四 周五 周55kg一 65kg之间?=3 700 件,标准差为 50 件。如果某一天的产量低于或高于平均产周二五3 850 590 周一 周二 周三 周四 周五 周六 周日3850 3670 3690
24、 3720 3610 3590 3700370050-0.2-2 -22 2一种产品需要人工组装, 现有三种可供选择的组装方法。15 个工人分别用三种方法在相同的时间内组装的产品数量:=-1;Z2=-2;Z2=周三周六3 670 3 7000.4-22为检验哪种方法更好, 随机抽取 15 个工人,=周四周日3 690 -1.8-22=1,根据经验规则,男生=2,根据经验规则,女生大周3 720 -2.2-223 610 0-223 -22散程度是男生的小。(2)都是各乘以 2.21,男生的平均体重为 60kg2.21=132.6 磅,标准差为 5kg2.21=11.05 磅;女生的平均体重为
25、50kg2.21=110.5 磅,标准差为 5kg2.21=11.05 磅。(3) 粗略地估计一下,男生中有百分之几的人体重在计算标准分数:Z1= 大约有 68%的人体重在 55kg一 65kg之间。(4)计算标准分数:Z1=约有 95%的人体重在 40kg一 60kg之间。22. 一条产品生产线平均每天的产量为量,并落人士 2 个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制 ? 时 周一间产量(件)参考答案:解:时间产量(件)日平均产量日产量标准差标准分数 Z 3 -0.6标准分数界限周六超出界限,失去控制。23.让他们分别用三种方法组装。下面
26、是单位:个方法 B12913012913013130129127128128127128128125132?试说明理由。方法 方法 B12913012913013130129127128128127128128125132?试说明理由。方法 B165.6平均V ,VA方法。在金融证券领域, 一项投资的预期收益率的变化通常用该项投资的风险来衡量。200 种商?方法 C125126126127126128127126127127125126116126125方法 C128.7333333平均A=0.01287076,VB= 0.013603237 C= 0.022097949预期收益率的变化越12
27、5.5333333164167168165170165164168164162163166167166165要求:(1) 你准备采用什么方法来评价组装方法的优劣(2) 如果让你选择一种方法,你会作出怎样的选择参考答案:解:对比均值和离散系数的方法,选择均值大,离散程度小的。方法 A平均标准差 2.131397932标准差 1.751190072标准差 2.774029217离散系数:均值 A方法最大,同时 A的离散系数也最小,因此选择24.小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了业类股票和 200 种高科技类股票的收益率分布。在股票市场上,高收益率往
28、往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1) 你认为该用什么样的统计量来反映投资的风险 (2) 如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3) 如果进行股票投资,你会选择商业类股票还是高科技类股票参考答案:(1) 标准差或者离散系数。(2) 选择离散系数小的股票,则选择商业股票。(3) 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。盎司,通过观察这台装瓶机对每个瓶子的灌装量盎司的正态分布。随机抽取由这台机器灌装的0.3 盎司的概率。的正态分布,z=2=0.6318,2(n),则,查概率表得: b=12.599 个瓶子形成一个样本,
29、并测定每个瓶-1,查标准正态分布表得,那么由概率,因此,样本均值不=0.8159盎司,通过观察这台装瓶机对每个瓶子的灌装量盎司的正态分布。随机抽取由这台机器灌装的0.3 盎司的概率。的正态分布,z=2=0.6318,2(n),则,查概率表得: b=12.599 个瓶子形成一个样本,并测定每个瓶-1,查标准正态分布表得,那么由概率,因此,样本均值不=0.8159表示从标准正态总体中随机抽取的容量,可n=6 的一个样本,试确定常数b,使二、主观题 (共3 道小题) 12. 调节一个装瓶机使其对每个瓶子的灌装量均值为服从标准差子的灌装量。试确定样本均值偏离总体均值不超过参考答案:解:总体方差知道的情
30、况下,均值的抽样分布服从由正态分布,标准化得到标准正态分布:超过总体均值的概率 P为:=因此,13.得参考答案:解:由于卡方分布是由标准正态分布的平方和构成的:设 Z1,Z2,Zn是来自总体 N(0,1) 的样本,则统计量服从自由度为 n的2分布,记为 2因此,令知:b=的标准正态分布。假定我们计划随机抽10 个观测值,用这 10 个观测值我们可以求出样本,确定一个合适的范围使得有较大的概率保证1,所以统计量=3.325,=1.88S2落入其中是有用的,试=19.919,则的标准正态分布。假定我们计划随机抽10 个观测值,用这 10 个观测值我们可以求出样本,确定一个合适的范围使得有较大的概率
31、保证1,所以统计量=3.325,=1.88S2落入其中是有用的,试=19.919,则取10 个瓶子组成样本,观测每个瓶子的灌装量,得到方差求b ,b2,使得参考答案:解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,根据卡方分布的可知:又因为:因此:则:查概率表:=0.369,统计学 A第六次作业3 周的时间里选取120元,求总体均值 =1.96 2.143=4.2置信区间为:在全校 7 500 名学生中采取重复抽样方法随机抽取(单位:小时 ):5.82.65.12.9903 周的时间里选取120元,求总体均值 =1.96 2.143=4.2置信区间为:在全校 7 500 名学生
32、中采取重复抽样方法随机抽取(单位:小时 ):5.82.65.12.990,95和 9=3.32,样本标准差 s=1.61;=49 名顾客组成了一个简的95的置信区间。36 人,调查2.36.44.33.5=1.61/6=0.2684.11.84.22.45.43.53.60.54.55.70.83.63.22.31.52.524. 某快餐店想要估计每位顾客午餐的平均花费金额。在为期单随机样本。(1) 假定总体标准差为 15 元,求样本均值的抽样标准误差。(2)在 95的置信水平下,求边际误差。(3) 如果样本均值为参考答案:(1)=2.143(2),由于是大样本抽样, 因此样本均值服从正态分布
33、, 因此概率度 t=因此,(3) = =(115.8,124.2)25. 某大学为了解学生每天上网的时间,他们每天上网的时间,得到下面的数据3.3 3.1 6.24.4 2.0 5.42.1 1.9 1.24.7 1.4 1.2求该校大学生平均上网时间的置信区间,置信水平分别为9。参考答案:解:(1)样本均值(2)抽样平均误差:重复抽样:=0.2680.998=0.267置信水平下的概率度:= = = =1.645=1.96=2.576=1.6450.268=0.441=1.6450.267=0.439=1.960.268=0.525=1.960.267=0.523=2.5760.268=0.
34、69=2.5760.267=0.688=(2.88,3.76)不重复抽样:=0.2680.998=0.267置信水平下的概率度:= = = =1.645=1.96=2.576=1.6450.268=0.441=1.6450.267=0.439=1.960.268=0.525=1.960.267=0.523=2.5760.268=0.69=2.5760.267=0.688=(2.88,3.76)=0.268(3)=0.9,t= =0.95,t=0.99,t= (4) 边际误差(极限误差):=0.9,重复抽样:不重复抽样:=0.95,重复抽样:不重复抽样:=0.99,重复抽样:不重复抽样:(5)置
35、信区间:=0.9,重复抽样:=16 个人组成的一个随机样本,他们到单95的置信t 统计量=(7.18一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了(单位:小时 ):20=(2.79=(2.63,4.01)=(2.63=16 个人组成的一个随机样本,他们到单95的置信t 统计量=(7.18一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了(单位:小时 ):20=(2.79=(2.63,4.01)=(2.63,4.01)=(2.88,3.76)=(2.80,3.84)=2.13,11.57)18 个员工。得到7,3.85)081629重复抽样:=0.
36、99,重复抽样:不重复抽样:不重复抽样:不重复抽样:26. 某居民小区为研究职工上班从家里到单位的距离,抽取了由位的距离 (单位:km) 分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的区间。参考答案:解:小样本,总体方差未知,用均值=9.375,样本标准差 s=4.11置信区间:=0.95,n=16,=27.他们每周加班的时间数据如下6 21 178估计网络公司员工平均每周加班时t 统计量=(10.36 ,16.75 )随机抽取了 200 个居民户, 调查他们是否拥有某一品牌的电视机。8估计网络公司
37、员工平均每周加班时t 统计量=(10.36 ,16.75 )随机抽取了 200 个居民户, 调查他们是否拥有某一品牌的电视机。23。求总体比例的置信区间,置信水平分别为z 统计量=12=1.7369其中拥有90% 和95% 。=1.64511921251516假定员工每周加班的时间服从正态分布。间的 90% 的置信区间。参考答案:解:小样本,总体方差未知,用均值=13.56,样本标准差 s=7.801置信区间:=0.90,n=18,=28. 在一项家电市场调查中该品牌电视机的家庭占参考答案:解:总体比率的估计大样本,总体方差未知,用样本比率=0.23置信区间:=0.90,=10 名顾客,他们在
38、办理业务时所等待的时间6.54.295的置信区间。95的置信区间。? =3.318=1.96(单6.6 6.7=10 名顾客,他们在办理业务时所等待的时间6.54.295的置信区间。95的置信区间。? =3.318=1.96(单6.6 6.75.4 5.8=19.02 ,6.8 7.16.2 6.7=7.3 7.47.7 7.7=2.77.7 7.78.5 9.37.710=(0.1811 ,0.2789 )=0.95,=(0.1717,0.2883)29. 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某
39、银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取位:分钟 )如下:方式 1方式 2要求:(1) 构建第一种排队方式等待时间标准差的(2)构建第二种排队方式等待时间标准差的(3)根据(1)和(2)的结果,你认为哪种排队方式更好参考答案:解:估计统计量经计算得样本标准差置信区间:=0.95,n=10,=(0.1075 ,0.7574 )估计统计量=0.2272=(1.57,11.06)来自总体 2的样本=23=20100 ,求10,10,=(0.1075 ,0.
40、7574 )估计统计量=0.2272=(1.57,11.06)来自总体 2的样本=23=20100 ,求10,10,=,求=19.02,的 95的置信区间。 =,求,求的95的置信区间。=,求的 95的置信区间。的 95的置信区间。=2.的95的置信区间。因此,标准差的置信区间为( 0.3279,0.8703)(2)经计算得样本标准差置信区间:=0.95,n=10,7=因此,标准差的置信区间为( 1.25,3.33)(3)第一种方式好,标准差小!30. 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:来自总体 1的样本=25=16差如下表所示:(1) 设(2)设(3)
41、 设(4)设 n10,n220。(5) 设 n110,n220。参考答案:=4.243=1.96=2.101解:(1)=4.243=1.96=2.101大样本,总体方差未知,统计量:=0.95,置信区间为:=(0.824,3.176)(2)小样本,总体方差未知,总体方差相等,统计量:=0.95,n1+n2-2=18,=置信区间为:=(-1.986 ,5.986)(3)小样本,总体方差未知,总体方差不相等,统计量:=18=(-1.986 ,5.986)=4.326=(-1.43=18=(-1.986 ,5.986)=4.326=(-1.432 ,5.432 )=2.101=2.048=0.95,
42、 =18,置信区间为:=(4)小样本,总体方差未知,总体方差相等,统计量:=0.95,n1+n2-2=28,=置信区间为:=(5)小样本,总体方差未知,总体方差不相等,统计量:=20=(-1.364 ,5.364 )来自总体 B的样本0765和=20=(-1.364 ,5.364 )来自总体 B的样本0765和分别为总体 A和总体 B的均值,构造=1.75,小样本,配对样本,总体方差未知,用=2.086。的 95的置信区间。=2.62996t 统计量=3.182=0.95, =18,置信区间为:=31. 下表是由 4对观察值组成的随机样本。配对号 来自总体 A的样本1 22 53 104 8(
43、1) 计算 A 与 B 各对观察值之差,再利用得出的差值计算(2) 设参考答案:(1) (2)均值=1.75,样本标准差 s=2.62996置信区间:=0.95,n=4,=(-2.43,5.93)(单位:g)的数据:机器 23.222.983.753.383.453.483.18/=0.006=(-2.43,5.93)(单位:g)的数据:机器 23.222.983.753.383.453.483.18/=0.006=3.93.73.283.353.23.123.25的95的置信区间。=2.4645,=0.40583.223.383.33.33.343.283.33.283.193.23.293
44、.353.163.343.353.33.053.333.273.283.2532. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是两部机器生产的袋茶重量机器 13.453.23.223.52.953.163.2要求:构造两个总体方差比参考答案:解:统计量:置信区间:=0.058,n1=n2=21=0.95,=根据以往的生产数据,某种产品的废品率为? =47.06,取 n=48或者 50。根据过去的经验, 标准差大约为 120 元,现要求2根据以往的生产数据,某种产品的废品率为? =47.06,取 n=48或者 50。根据过去的经验, 标准差大约为 12
45、0 元,现要求20 元,应抽取多少个,,估计两个总体均值之差,2。如果要求 95 的置信区间,若要求边际误差不超=1.96=0.95 ,若要求误差范围不超过时所需的样本量为多大=0.95 ,=5,相应的置信水平为? =1.96,=1.96,33.过4,应抽取多大的样本参考答案:解:=0.95,=34. 某超市想要估计每个顾客平均每次购物花费的金额。以95 的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过顾客作为样本 ? 参考答案:解:=138.3,取 n=139或者 140,或者 150。35. 假定两个总体的标准差分别为:95,假定参考答案:解:n1=n2= =,边际误差
46、E005,相应的置信水平为,=56.7 ,取=,边际误差 E005,相应的置信水平为,=56.7 ,取 n=58,或者 60。95,估计两个总体比例之差=0.95 ,=768.3,取 n=769,或者时所=1.96,36. 假定需的样本量为多大 ? 参考答案:解:n1=n2=取 p1=p2=0.5,n1=n2=780或 800。100 千克。每天开工后需要检验一次打包机工作是否正常。(a005)?0: 1:99.9778 -0.0552.262。因为250 克。今从一批该食品中任意抽取5就不得出厂,问该批食品能否出厂0: 1:2.2711.645。因为 100 千克。每天开工后需要检验一次打包
47、机工作是否正常。(a005)?0: 1:99.9778 -0.0552.262。因为250 克。今从一批该食品中任意抽取5就不得出厂,问该批食品能否出厂0: 1:2.2711.645。因为 zx(单位:小时 )服从正态分布。现测得225 小时(a005)?0: 1:241.5 S1.2122150 袋,发现有 6 袋(a005)? ,样本统计量落在拒绝区域,故拒16 只元件的寿命如下:s98.726,样二、主观题 (共8 道小题) 42. 糖厂用自动打包机打包,每包标准重量是某日开工后测得 9 包重量(单位:千克 )如下: 99 3 98 7 100 5 101 2 98 3 99 7 99
48、5 102 1 100 5已知包重服从正态分布,试检验该日打包机工作是否正常参考答案:解:H 100;H 100经计算得:检验统计量:当0.05,自由度 n19时,查表得本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。43. 某种大量生产的袋装食品,按规定不得少于低于 250 克。若规定不符合标准的比例超过参考答案:解:H 0.05;H 0.05已知: p6/50=0.12检验统计量:当0.05,查表得绝原假设,接受备择假设,说明该批食品不能出厂。44. 某种电子元件的寿命 159 280 101 212 224 379 179 264 222 362 168 250 1
49、49 260 485 170问是否有理由认为元件的平均寿命显著地大于参考答案:解:H 225;H 225经计算知:0.66912 件产品,记录各自的装配时间 (a0:12=0 1: 1 212,0.66912 件产品,记录各自的装配时间 (a0:12=0 1: 1 212,=2.46183。(单位:分钟 )如下:=12,2.074,此题中31.75,3.19446,28.当0.05,自由度 n115时,查表得 1.753。因为 t ,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于 225小时。45. 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取甲方法:31 34 29 32 35 38 34 30 29 32 31 26乙方法:26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年定制化隧道工程施工合同书
- 2026年度一站式校企合作合同
- 2025年黑龙江省安达市高二生物下册期末考试检测卷含答案(夺分金卷)
- 2026年山东省高密市高二生物下册期末考试模拟卷及参考答案【基础题】
- 2026年贵州省凯里市高二生物下册期末考试模拟卷及答案(典优)
- 2026年福建省石狮市高二生物下册期末考试考试卷及答案【典优】
- 2026年甘肃省合作市高二生物下册期末考试模拟卷【综合题】附答案
- 2025年黑龙江省同江市高二生物下册期末考试考试卷及答案【新】
- 2025年黑龙江省五大连池市高二生物下册期末考试模拟卷附答案(A卷)
- 2026年河北省黄骅市高二生物下册期末考试考试卷含答案(培优A卷)
- 出纳员职业技能鉴定考试复习题库(附答案)
- 加油站风险辨识与安全管控培训
- 2025年四川省自贡市地理生物会考真题试卷+答案
- GB 26396-2026洗涤用品安全技术规范
- 2026年上海市宝山区中考一模化学试卷
- 2026年郴州思科职业学院《形势与政策》期末考试练习题及答案详解
- 2026年科级干部任职资格政治理论考核要点
- 林可霉素A中反式4-正丙基脯氨酸单元生物合成机制探秘
- 《药物真实世界研究设计与方案框架指导原则(试行)》
- 新员工岗前考试及答案解析
- 东南大学2024综评数学试卷
评论
0/150
提交评论