统计学练习题及答案_第1页
统计学练习题及答案_第2页
统计学练习题及答案_第3页
统计学练习题及答案_第4页
统计学练习题及答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学练习题及答案一、变量类型与统计量基础1.某高校2023级新生入学调查数据包含以下指标:性别(男/女)、年龄(岁)、高考数学成绩(分)、家庭所在地(城镇/农村)、每周课外阅读时长(小时)。请判断每个指标的变量类型(定性变量/定量变量;若为定性变量,进一步区分名义型/顺序型;若为定量变量,区分离散型/连续型)。答案:-性别:定性变量(名义型,无顺序意义)-年龄(岁):定量变量(连续型,理论上可无限细分)-高考数学成绩(分):定量变量(离散型,实际取值为整数)-家庭所在地:定性变量(名义型,城镇与农村无顺序优劣)-每周课外阅读时长(小时):定量变量(连续型,可精确到分钟或秒)二、描述统计量计算2.某班级10名学生的统计学考试成绩如下(单位:分):78,85,92,65,88,72,95,80,75,85。(1)计算均值、中位数、众数;(2)计算样本方差与样本标准差;(3)判断数据分布的偏态方向(左偏/右偏/对称)。答案:(1)均值计算:均值=(78+85+92+65+88+72+95+80+75+85)/10=815/10=81.5分中位数计算:将数据从小到大排序:65,72,75,78,80,85,85,88,92,95共10个数据,中位数为第5、6个数的平均值:(80+85)/2=82.5分众数:85分(出现2次,其他数仅出现1次)(2)样本方差计算:首先计算各数据与均值的离均差平方和:(78-81.5)²=12.25;(85-81.5)²=12.25;(92-81.5)²=110.25;(65-81.5)²=272.25;(88-81.5)²=42.25;(72-81.5)²=90.25;(95-81.5)²=182.25;(80-81.5)²=2.25;(75-81.5)²=42.25;(85-81.5)²=12.25离均差平方和=12.25×3+110.25+272.25+42.25×2+90.25+182.25+2.25=885.5样本方差=离均差平方和/(n-1)=885.5/9≈98.39样本标准差=√98.39≈9.92分(3)偏态判断:均值(81.5)<中位数(82.5),说明数据左偏(负偏态),即左侧(低分端)有较长的尾巴。三、分组数据描述统计3.某城市50家超市2023年12月的销售额(单位:万元)分组如下:|销售额区间(万元)|频数(家)||-------------------|------------||[50,70)|8||[70,90)|15||[90,110)|20||[110,130]|7|(1)计算销售额的均值(用组中值近似);(2)计算中位数所在组,并估计中位数;(3)计算众数所在组,并估计众数。答案:(1)均值计算:组中值分别为60,80,100,120(万元)均值=(60×8+80×15+100×20+120×7)/50=(480+1200+2000+840)/50=4520/50=90.4万元(2)中位数所在组:累计频数:第一组8,第二组8+15=23,第三组23+20=43,第四组43+7=50n=50,中位数位置为第25个数,落在第三组[90,110)(累计频数23<25≤43)中位数估计公式:中位数=L+[(n/2-F)/f]×i其中L=90(中位数组下限),F=23(前一组累计频数),f=20(中位数组频数),i=20(组距)中位数=90+[(25-23)/20]×20=90+2=92万元(3)众数所在组:频数最大的组是第三组[90,110)(频数20)众数估计公式(皮尔逊经验法或金氏公式,此处用金氏公式):众数=L+[Δ₁/(Δ₁+Δ₂)]×iΔ₁=20-15=5(众数组频数与前一组频数之差),Δ₂=20-7=13(众数组频数与后一组频数之差)众数=90+[5/(5+13)]×20≈90+5.56≈95.56万元四、概率与抽样分布4.某批次电子元件的次品率为5%,从中随机抽取20个元件进行检测。(1)求恰好有2个次品的概率;(2)求至少有1个次品的概率;(3)若用正态分布近似二项分布,计算抽取20个元件中次品数不超过3个的概率(需验证近似条件)。答案:设X为次品数,X~B(n=20,p=0.05)(1)恰好2个次品的概率:P(X=2)=C(20,2)×(0.05)²×(0.95)^18C(20,2)=190,(0.05)²=0.0025,(0.95)^18≈0.400P(X=2)=190×0.0025×0.400≈0.190(2)至少1个次品的概率:P(X≥1)=1-P(X=0)=1-C(20,0)×(0.05)^0×(0.95)^20≈1-1×1×0.358≈0.642(3)正态近似条件:np=20×0.05=1,n(1-p)=19,通常要求np≥5且n(1-p)≥5,此处np=1<5,严格来说不满足近似条件,但假设仍使用近似:μ=np=1,σ=√[np(1-p)]=√(1×0.95)≈0.9747X~N(μ=1,σ²≈0.95)求P(X≤3),需连续性修正,计算P(X≤3.5)Z=(3.5-1)/0.9747≈2.56查标准正态分布表,Z=2.56对应概率≈0.9948因此P(X≤3)≈0.9948(注:因np<5,此近似误差较大,实际精确值为P(X≤3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)≈0.358+0.377+0.189+0.059≈0.983,近似值偏高)五、假设检验(单样本Z检验)5.某品牌宣称其生产的电池平均续航时间为200小时,标准差为15小时(已知总体标准差)。质检部门随机抽取36个电池测试,测得平均续航时间为195小时。在显著性水平α=0.05下,检验该品牌电池的平均续航时间是否低于宣称值。答案:步骤1:设定假设H₀:μ=200(平均续航时间等于宣称值)H₁:μ<200(平均续航时间低于宣称值,单侧检验)步骤2:计算检验统计量Z=(x̄-μ)/(σ/√n)=(195-200)/(15/√36)=(-5)/(15/6)=-5/2.5=-2步骤3:确定临界值或p值α=0.05,单侧检验临界值Zα=-1.645(左侧检验)计算得Z=-2<-1.645,落在拒绝域内步骤4:结论拒绝原假设,在α=0.05水平下,认为该品牌电池的平均续航时间显著低于宣称的200小时。六、两样本t检验(独立样本)6.为比较两种教学方法的效果,随机将40名学生分为两组,每组20人。甲组采用传统教学,乙组采用互动式教学,期末统计学成绩如下(单位:分):甲组:72,75,80,68,78,82,70,76,85,79,65,81,73,77,83,69,74,84,71,86乙组:85,88,92,79,90,87,83,95,81,89,78,91,84,86,93,80,82,94,77,85假设两总体方差未知但相等,在α=0.05下检验两种教学方法的平均成绩是否有显著差异。答案:步骤1:计算两组均值与样本方差甲组数据求和:72+75+…+86=1560,均值x̄₁=1560/20=78分甲组离均差平方和:计算得Σ(x₁i-x̄₁)²=(72-78)²+…+(86-78)²=36+9+…+64=672,样本方差s₁²=672/19≈35.37乙组数据求和:85+88+…+85=1740,均值x̄₂=1740/20=87分乙组离均差平方和:Σ(x₂i-x̄₂)²=(85-87)²+…+(85-87)²=4+1+…+4=440,样本方差s₂²=440/19≈23.16步骤2:计算合并方差s_p²=[(n₁-1)s₁²+(n₂-1)s₂²]/(n₁+n₂-2)=(19×35.37+19×23.16)/38=(672+440)/38=1112/38≈29.26步骤3:计算t统计量t=(x̄₁-x̄₂)/[s_p×√(1/n₁+1/n₂)]=(78-87)/[√29.26×√(1/20+1/20)]=(-9)/[5.41×√0.1]=(-9)/(5.41×0.316)≈-9/1.71≈-5.26步骤4:确定临界值与结论自由度df=n₁+n₂-2=38,α=0.05双侧检验,临界值t₀.025(38)≈2.024(近似用t₀.025(40)=2.021)计算得|t|=5.26>2.024,拒绝原假设,认为两种教学方法的平均成绩有显著差异(乙组更高)。七、卡方独立性检验7.某医院调查1000名患者的吸烟习惯与肺癌患病情况,数据如下:||患肺癌|未患肺癌|合计||------------|--------|----------|------||吸烟|120|380|500||不吸烟|30|470|500||合计|150|850|1000|在α=0.05下检验吸烟与肺癌是否独立。答案:步骤1:设定假设H₀:吸烟与肺癌独立(无关联)H₁:吸烟与肺癌不独立(有关联)步骤2:计算期望频数E_ijE_吸烟患肺癌=(500×150)/1000=75E_吸烟未患肺癌=(500×850)/1000=425E_不吸烟患肺癌=(500×150)/1000=75E_不吸烟未患肺癌=(500×850)/1000=425步骤3:计算卡方统计量χ²=Σ[(O_ij-E_ij)²/E_ij]=(120-75)²/75+(380-425)²/425+(30-75)²/75+(470-425)²/425=(2025/75)+(2025/425)+(2025/75)+(2025/425)=27+4.76+27+4.76≈63.52步骤4:确定临界值与结论自由度df=(r-1)(c-1)=(2-1)(2-1)=1,α=0.05时临界值χ²₀.05(1)=3.841计算得χ²=63.52>3.841,拒绝原假设,认为吸烟与肺癌患病情况不独立(存在关联)。八、相关与回归分析8.某地区10个城镇的人均教育支出(x,万元)与人均GDP(y,万元)数据如下:x:0.8,1.2,1.5,2.0,2.5,3.0,3.5,4.0,4.5,5.0y:5.2,6.8,7.5,9.0,10.5,12.0,13.5,15.0,16.5,18.0(1)计算Pearson相关系数;(2)建立y关于x的简单线性回归方程;(3)解释回归系数的实际意义;(4)预测当人均教育支出为6.0万元时,人均GDP的估计值。答案:(1)Pearson相关系数r计算:首先计算均值:x̄=(0.8+…+5.0)/10=27/10=2.7万元;ȳ=(5.2+…+18.0)/10=103/10=10.3万元计算离均差乘积和:Σ(xi-x̄)(yi-ȳ)=(0.8-2.7)(5.2-10.3)+(1.2-2.7)(6.8-10.3)+…+(5.0-2.7)(18.0-10.3)=(-1.9)(-5.1)+(-1.5)(-3.5)+(-1.2)(-2.8)+(-0.7)(-1.3)+(-0.2)(0.2)+(0.3)(1.7)+(0.8)(3.2)+(1.3)(4.7)+(1.8)(6.2)+(2.3)(7.7)=9.69+5.25+3.36+0.91-0.04+0.51+2.56+6.11+11.16+17.71=57.21计算x的离均差平方和:Σ(xi-x̄)²=(-1.9)²+(-1.5)²+…+(2.3)²=3.61+2.25+1.44+0.49+0.04+0.09+0.64+1.69+3.24+5.29=18.78计算y的离均差平方和:Σ(yi-ȳ)²=(-5.1)²+(-3.5)²+…+(7.7)²=26.01+12.25+7.84+1.69+0.04+2.89+10.24+22.09+38.44+59.29=180.78r=57.21/√(18.78×180.78)=57.21/√(3395.5)=57.21/58.27≈0.982(高度正相关)(2)回归方程y=α+βxβ=Σ(xi-x̄)(yi-ȳ)/Σ(xi-x̄)²=57.21/18.78≈3.05α=ȳ-βx̄=10.3-3.05×2.7≈10.3-8.235≈2.065回归方程:y=2.065+3.05x(3)回归系数β=3.05表示:人均教育支出每增加1万元,人均GDP平均增加约3.05万元。(4)当x=6.0万元时,y=2.065+3.05×6=2.065+18.3=20.365万元,即人均GDP估计值约为20.37万元。九、置信区间估计9.某网站随机抽取500名用户,调查其日均使用时长(单位:分钟),样本均值为120分钟,样本标准差为30分钟。(1)计算总体均值的95%置信区间;(2)若要求置信区间宽度不超过10分钟,至少需要调查多少用户(置信水平95%)?答案:(1)总体均值的95%置信区间(大样本,用Z分布):置信区间=x̄±Zα/2×(s/√n)Z₀.025=1.96,s=30,n=500边际误差E=1.96×(30/√500)=1.96×(30/22.36)≈1.96×1.34≈2.63置信区间=120±2.63,即(117.37,122.63)分钟(2)要求置信区间宽度≤10分钟,即2E≤10,E≤5E=Zα/2×(s/√n)≤5→√n≥Zα/2×s/E→n≥(Zα/2×s/E)²代入Z=1.96,s=30,E=5:n≥(1.96×30/5)²=(11.76)²≈138.29,故至少需要调查139名用户。十、方差分析(单因素)10.某企业研发三种新型涂料,测试其干燥时间(单位:分钟),数据如下:涂料A:45,48,50,52,47涂料B:55,58,60,56,59涂料C:65,68,70,66,67在α=0.05下检验三种涂料的平均干燥时间是否有显著差异。答案:步骤1:计算各组均值与总均值涂料A均值x̄₁=(45+48+50+52+47)/5=242/5=48.4涂料B均值x̄₂=(55+58+60+56+59)/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论