版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(2025年)《应用统计学》练习题及答案一、数据整理与描述统计某城市环保部门2024年监测了120天的PM2.5浓度(单位:μg/m³),原始数据经排序后部分如下:28,32,35,38,41,43,45,47,50,52,55,58,60,62,65,68,70,72,75,78(注:完整数据按等距分组后频数分布表见答案部分)。1.以组距10μg/m³进行分组(第一组为20-30,含下限不含上限),编制频数分布表(包括频数、频率、累积频数、累积频率)。2.计算该组数据的均值、标准差(保留两位小数)。3.绘制直方图并描述PM2.5浓度的分布特征。二、概率分布应用1.某电商平台用户下单转化率为8%(即单个用户下单概率p=0.08),随机抽取100个独立用户,求至少8个用户下单的概率(提示:用正态分布近似二项分布)。2.某品牌新能源汽车电池寿命服从正态分布N(5000,300²)(单位:小时),求电池寿命超过5500小时的概率(Φ(1.67)=0.9525,Φ(1.66)=0.9515)。三、参数估计1.某高校为研究学生每日学习时间,随机抽取50名学生,测得平均学习时间为6.2小时,样本标准差为1.5小时。计算该校学生每日平均学习时间的95%置信区间(t₀.₀₂₅(49)=2.01)。2.某手机厂商调查用户满意度,在1000名用户中,780人表示“满意”。计算该品牌用户总体满意度的90%置信区间(Z₀.₀₅=1.645)。四、假设检验1.某食品厂声称其产品保质期达标率不低于98%(即次品率≤2%)。质检部门随机抽取200件产品,发现5件次品。检验该厂声明是否成立(α=0.05,Z₀.₀₅=1.645)。2.为比较两条生产线的产品强度,A生产线抽取25件,样本均值为28MPa,样本标准差为2MPa;B生产线抽取30件,样本均值为26MPa,样本标准差为3MPa。假设两总体方差不等,检验两条生产线的产品强度是否有显著差异(α=0.05,t₀.₀₂₅(50)=2.009)。五、单因素方差分析某农业研究所研究三个地区(A、B、C)的小麦亩产量(单位:kg),各地区抽样数据如下:A区(5块地):350,360,345,355,340B区(6块地):370,365,380,375,360,370C区(4块地):330,325,340,335检验三个地区小麦亩产量是否有显著差异(α=0.05,F₀.₀₅(2,12)=3.89)。六、简单线性回归分析某研究收集了12个城市的人均可支配收入(x,万元)与人均消费支出(y,万元)数据,计算得:∑x=84,∑y=60,∑xy=456,∑x²=650,∑y²=3201.计算人均可支配收入与消费支出的相关系数(保留三位小数)。2.建立y关于x的线性回归方程。3.检验回归系数的显著性(α=0.05,t₀.₀₂₅(10)=2.228)。4.预测当人均可支配收入为10万元时,人均消费支出的估计值。答案一、数据整理与描述统计1.频数分布表:分组(μg/m³)频数频率(%)累积频数累积频率(%)20-3054.1754.1730-401815.002319.1740-503226.675545.8350-603529.179075.0060-702016.6711091.6770-80108.33120100.002.均值计算:组中值分别为25,35,45,55,65,75,均值=(25×5+35×18+45×32+55×35+65×20+75×10)/120=(125+630+1440+1925+1300+750)/120=6170/120≈51.42μg/m³。标准差计算:先计算方差,方差=[(25-51.42)²×5+(35-51.42)²×18+(45-51.42)²×32+(55-51.42)²×35+(65-51.42)²×20+(75-51.42)²×10]/(120-1)=(698.01×5+269.61×18+41.22×32+12.82×35+184.42×20+555.82×10)/119=(3490.05+4852.98+1319.04+448.7+3688.4+5558.2)/119≈19357.37/119≈162.67,标准差≈√162.67≈12.76μg/m³。3.直方图显示PM2.5浓度主要集中在40-60μg/m³区间(占比55.84%),分布略呈右偏(高浓度尾部较长)。二、概率分布应用1.设X为100个用户中下单数,X~B(100,0.08),μ=np=8,σ²=np(1-p)=7.36,σ≈2.71。P(X≥8)=1-P(X≤7)≈1-Φ((7+0.5-8)/2.71)=1-Φ(-0.184)≈1-0.4279=0.5721(连续性修正)。2.设电池寿命为X~N(5000,300²),P(X>5500)=1-Φ((5500-5000)/300)=1-Φ(1.666)≈1-0.9522=0.0478(取Φ(1.67)=0.9525,Φ(1.66)=0.9515,线性插值得Φ(1.666)≈0.9522)。三、参数估计1.总体均值的95%置信区间为:x̄±t_(α/2)(n-1)×(s/√n)=6.2±2.01×(1.5/√50)=6.2±2.01×0.212≈6.2±0.426,即(5.77,6.63)小时。2.样本满意度p̂=780/1000=0.78,90%置信区间为:p̂±Z_(α/2)×√(p̂(1-p̂)/n)=0.78±1.645×√(0.78×0.22/1000)=0.78±1.645×0.0131≈0.78±0.0216,即(0.7584,0.8016)。四、假设检验1.原假设H₀:p≤0.02,备择假设H₁:p>0.02。样本次品率p̂=5/200=0.025,检验统计量Z=(0.025-0.02)/√(0.02×0.98/200)=0.005/0.0099≈0.505。Z=0.505<Z₀.₀₅=1.645,不拒绝H₀,认为该厂声明成立。2.原假设H₀:μ₁=μ₂,备择假设H₁:μ₁≠μ₂。检验统计量t=(28-26)/√(2²/25+3²/30)=2/√(0.16+0.3)=2/√0.46≈2/0.678≈2.95。自由度df=(0.16²/25+0.3²/30)²/[(0.16²/25)²/24+(0.3²/30)²/29]≈(0.0001+0.0003)²/(0.0000007+0.0000011)≈0.00000016/0.0000018≈88(近似取50),t=2.95>t₀.₀₂₅(50)=2.009,拒绝H₀,认为两条生产线强度有显著差异。五、单因素方差分析计算各地区均值:x̄₁=(350+360+345+355+340)/5=350,n₁=5;x̄₂=(370+365+380+375+360+370)/6=370,n₂=6;x̄₃=(330+325+340+335)/4=332.5,n₃=4;总均值x̄=(350×5+370×6+332.5×4)/15=(1750+2220+1330)/15=5300/15≈353.33。组间平方和SSB=5×(350-353.33)²+6×(370-353.33)²+4×(332.5-353.33)²=5×11.09+6×277.89+4×434.09≈55.45+1667.34+1736.36≈3459.15;组内平方和SSW=∑(x_ij-x̄ᵢ)²:A区:(350-350)²+…+(340-350)²=0+100+25+25+100=250;B区:(370-370)²+…+(370-370)²=0+25+100+25+100+0=250;C区:(330-332.5)²+…+(335-332.5)²=6.25+56.25+56.25+6.25=125;SSW=250+250+125=625;总平方和SST=SSB+SSW=3459.15+625=4084.15。均方MSB=SSB/(k-1)=3459.15/2≈1729.58,MSW=SSW/(n-k)=625/12≈52.08;F=MSB/MSW≈1729.58/52.08≈33.21>3.89,拒绝原假设,地区对小麦产量有显著影响。六、简单线性回归分析1.相关系数r=[n∑xy-∑x∑y]/√[(n∑x²-(∑x)²)(n∑y²-(∑y)²)]=[12×456-84×60]/√[(12×650-84²)(12×320-60²)]=(5472-5040)/√[(7800-7056)(3840-3600)]=432/√[744×240]=432/√178560≈432/422.56≈0.833。2.回归系数b₁=[n∑xy-∑x∑y]/[n∑x²-(∑x)²]=(5472-5040)/(7800-7056)=432/744≈0.581;b₀=ȳ-b₁x̄=(60/12)-0.581×(84/12)=5-0.581×7≈5-4.067≈0.933;回归方程:ŷ=0.933+0.581x。3.检验H₀:b₁=0,H₁:b₁≠0;残差平方和SSE=∑y²-b₀∑y-b₁∑xy=320-0.933×60-0.581×456≈320-55.98-265.90≈-1.88(计算误差,实际应为SSE=∑(y-ŷ)²,更准确的计算:SST=∑y²-(∑y)²/n=320-3600/12=320-300=20;SSR=b₁²×[n∑x²-(∑x)²]/n=0.581²×744/12≈0.337×62≈20.99;SSE=SST-SSR=20-20.99≈-0.99,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院医疗器械正常破损报废管理制度
- 杂散电流排流固态去耦合器的应用场景
- 金融借款合同 (二)
- 电子商务合规税务处理工作手册
- 建设股份有限公司销售人员管理新规制度
- 经济体制改革和民营经济政策
- 教师招聘(中学)考试真题带答案
- 语文中考试题文档及答案
- 2026年物业管理员(师)职业能力等级评价考试(助理物业管理师)练习试题及答案
- 2026年四川省机关事业单位考调、选调工作人员考试(综合知识、综合应用能力测试)仿真试题及答案
- 请结合马克思主义基本原理中有关科学社会主义的重要阐述理论联系实际谈一谈你对科学社会主义基本原则的认识(二)
- 食品安全体系FSSC22000-V6版标准要求及内审员培训教材
- 2026届山东省青岛市高三5月三模历史试题(含答案)
- 输变电工程多维立体参考价(2025年版)
- 贵州省遵义市(2024年-2025年小学六年级语文)统编版小升初模拟((上下)学期)试卷及答案
- 《中国心力衰竭诊断和治疗指南2024》解读(下)
- 侵袭性肺曲霉病课件
- 电梯维保人员奖惩制度
- 商务英语专业四级
- 煤矿淘汰设备目录(全六批)
- 重庆市南川区-2023学年五年级下学期期末数学试卷
评论
0/150
提交评论