版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山西大学2026年《统计学导论》期末试题及答案一、单项选择题(每题2分,共20分)1.某研究者想比较三种不同教学方法对学生成绩的影响,最适合的统计方法是A.单样本t检验 B.配对t检验 C.单因素方差分析 D.卡方检验答案:C解析:比较三个及以上独立组的均值差异,应使用单因素方差分析(One-wayANOVA)。t检验仅适用于两组,卡方检验用于分类变量。2.若随机变量X~N(μ,σ²),则P(μ-1.96σ≤X≤μ+1.96σ)约为A.90% B.95% C.99% D.68%答案:B解析:标准正态分布在±1.96σ之间的面积约为0.95,即95%。3.在简单线性回归中,若决定系数R²=0.81,则相关系数r的绝对值为A.0.81 B.0.9 C.0.656 D.无法确定答案:B解析:R²=r²,故|r|=√0.81=0.9。4.下列哪项不是时间序列的构成要素A.长期趋势 B.季节变动 C.循环波动 D.抽样误差答案:D解析:抽样误差属于抽样调查概念,与时间序列分解无关。5.在假设检验中,增大样本量会导致A.α一定减小 B.β一定减小 C.检验功效一定增大 D.临界值一定增大答案:C解析:样本量增大,标准误减小,检验功效(1-β)提高;α由研究者事先设定,与样本量无关。6.对同一总体进行重复抽样,样本均值的分布称为A.样本分布 B.抽样分布 C.总体分布 D.经验分布答案:B解析:样本统计量的概率分布称为抽样分布。7.若两变量完全负线性相关,则其Pearson相关系数为A.0 B.1 C.-1 D.无法计算答案:C解析:完全负线性相关时,所有点落在一条斜率为负的直线上,r=-1。8.在列联表检验中,当期望频数小于5的单元格比例超过20%时,应A.增大样本量 B.使用Fisher精确检验 C.合并行列 D.以上均可答案:D解析:卡方检验要求期望频数不宜过小,可通过增大样本、合并类别或改用精确方法解决。9.若某指数今年为120,去年为100,则今年相对于去年的增长速度为A.20% B.120% C.16.7% D.1.2%答案:A解析:增长速度=(120-100)/100=20%。10.在Bootstrap估计中,重复抽样的次数通常建议不少于A.100 B.500 C.1000 D.10000答案:C解析:为保证估计稳定,Bootstrap重复次数一般≥1000。二、多项选择题(每题3分,共15分,多选少选均不得分)11.下列属于描述统计方法的有A.直方图 B.箱线图 C.假设检验 D.茎叶图 E.散点图答案:ABDE解析:假设检验属于推断统计,其余为描述统计。12.关于p值,正确的说法有A.p值越小,拒绝原假设的证据越强B.p值表示原假设为真的概率C.p值大于显著性水平时,不能拒绝原假设D.p值与样本量无关E.p值依赖于检验统计量的观测值答案:ACE解析:p值是原假设成立下出现当前或更极端结果的概率,非原假设本身概率;样本量影响标准误,从而间接影响p值。13.下列哪些情况可能导致“伪回归”A.序列存在单位根且未协整B.遗漏重要解释变量C.解释变量与被解释变量互为因果D.残差存在异方差E.样本量过小答案:ABC解析:单位根非平稳且未协整时,t统计量分布扭曲;遗漏变量与双向因果造成估计偏误;异方差与小样本影响效率而非伪回归本质。14.关于置信区间,正确的有A.95%置信区间指参数有95%概率落入该区间B.区间宽度与样本量成反比C.置信水平越高,区间越宽D.重复抽样构造的区间中,约95%包含真值E.置信区间中心是样本统计量答案:BCDE解析:参数是固定常数,置信区间是随机的,A表述错误。15.下列属于非参数检验的有A.Wilcoxon符号秩检验 B.Kruskal-Wallis检验 C.Mann-WhitneyU检验 D.符号检验 E.单因素ANOVA答案:ABCD解析:E为参数检验,要求正态性与方差齐性。三、判断题(每题1分,共10分,正确打“√”,错误打“×”)16.标准差一定小于均值。 答案:×解析:标准差与均值量纲相同,但数值大小无必然关系,如N(0,1)均值0,标准差1。17.若两变量独立,则其协方差一定为零。 答案:√解析:独立⇒Cov(X,Y)=0;反之不成立,除非联合正态。18.在泊松分布中,均值与方差相等。 答案:√解析:Poisson(λ)的期望与方差均为λ。19.增大显著性水平α必然导致β减小。 答案:√解析:α与β呈反向关系,在样本量固定时。20.决定系数R²可用来评价逻辑回归模型的拟合优度。 答案:×解析:逻辑回归使用似然比、伪R²(如NagelkerkeR²),而非线性回归的R²。21.峰度大于3表示分布比正态分布更尖峭。 答案:√解析:超额峰度=峰度-3,正值为尖峰。22.系统抽样属于概率抽样。 答案:√解析:系统抽样按固定间隔抽取,每个单元入样概率已知。23.若残差呈现漏斗形,说明存在多重共线性。 答案:×解析:漏斗形提示异方差,多重共线性表现为方差膨胀因子增大。24.中位数对极端值比均值更敏感。 答案:×解析:中位数是位置统计量,对极端值稳健。25.在指数平滑中,平滑系数α越接近1,模型对历史数据越依赖。 答案:×解析:α→1表示给予最新观测值更大权重,对历史衰减更快。四、填空题(每空2分,共20分)26.若X~B(n=100,p=0.2),则E(X)=____,Var(X)=____。答案:20;16解析:二项分布期望np,方差np(1-p)。27.在假设检验中,同时控制α与β的有效方法是____。答案:增大样本量解析:样本量增加可同时降低α与β。28.若样本均值x̄=50,s=10,n=25,则均值标准误为____。答案:2解析:标准误=s/√n=10/5=2。29.拉氏价格指数使用____期数量作为权重。答案:基解析:Laspeyres指数以基期数量为权。30.若随机变量Z~N(0,1),则P(Z>1.645)=____。答案:0.05解析:单侧5%临界值。31.在聚类分析中,衡量样本间距离的常用度量是____距离。答案:欧氏解析:Euclidean距离最常用。32.若回归模型出现序列相关,可采用____检验。答案:DW(Durbin-Watson)解析:DW检验检测一阶自相关。33.若样本偏度为-0.8,则分布呈____偏。答案:左解析:负偏度表示左偏,长尾在左。34.在贝叶斯框架中,先验与似然的乘积正比于____。答案:后验解析:Bayes定理:后验∝先验×似然。35.若将5点李克特量表视为连续变量进行Pearson相关,需满足____性假设。答案:近似正态解析:虽然有序,但大样本下近似正态即可。五、简答题(每题8分,共24分)36.说明中心极限定理的内容及其在统计推断中的作用。答案:中心极限定理(CLT)指出,从任意总体(均值为μ,方差为σ²有限)中抽取容量为n的随机样本,当n足够大时,样本均值的分布近似服从N(μ,σ²/n)。作用:1.无需知道总体分布即可对均值进行正态近似推断;2.构建置信区间:x̄±zα/2·s/√n;3.进行假设检验:t或z检验均依赖该近似;4.为大样本理论奠定基础,如Bootstrap、渐近分布。37.比较分层抽样与整群抽样的优缺点。答案:分层抽样:优点:1.层内同质、层间异质可提高估计精度;2.可对各层分别估计,灵活;3.便于组织与管理。缺点:1.需完整抽样框且分层变量已知;2.分层变量选择不当反降低精度;3.加权复杂。整群抽样:优点:1.仅需群框,无需个体框,成本低;2.现场调查集中,节省交通费用;3.适合自然成群总体。缺点:1.群间差异大导致设计效应高,精度低;2.样本量相同时误差大于简单随机;3.统计分析需考虑群内相关,复杂。38.解释多重共线性对回归模型的影响及诊断方法。答案:影响:1.系数估计方差膨胀,t值不显著;2.系数符号与理论相反;3.模型对样本微小变化敏感,预测不稳定;4.难以区分各自变量边际贡献。诊断:1.方差膨胀因子VIF>10为严重;2.特征值与条件指数,>30提示问题;3.相关系数矩阵,|r|>0.9需警惕;4.系数符号与理论背离;5.剔除或合并变量、主成分、岭回归可缓解。六、计算与综合题(共61分)39.(10分)某生产线袋装面粉标称500g,随机抽取16袋,测得x̄=495g,s=8g。假定质量服从正态分布,检验是否显著不足(α=0.05)。答案:H0:μ=500;H1:μ<500t=(495-500)/(8/√16)=-5/2=-2.5临界值t0.05,15=-1.753∵-2.5<-1.753,拒绝H0结论:袋装面粉平均质量显著低于标称。解析:单侧检验,使用t分布,自由度n-1=15。40.(12分)随机调查200名本科生,记录月消费(元)与性别,得:男生n1=120,x̄1=1800,s1=300;女生n2=80,x̄2=1650,s2=250。(1)检验男女月消费差异是否显著(α=0.05);(2)求均值差μ1-μ2的95%置信区间。答案:(1)H0:μ1=μ2;H1:μ1≠μ2合并标准误:Sp²=((119·300²+79·250²))/(198)=77525SE=√(Sp²(1/120+1/80))=√(77525·0.0208)=√1612.5≈40.16t=(1800-1650)/40.16≈3.73t0.025,198≈1.972|t|>1.972,拒绝H0,差异显著。(2)置信区间:(1800-1650)±1.972·40.16=150±79.2=(70.8,229.2)元解析:方差齐性下用合并方差t检验;区间不含0,与检验一致。41.(12分)某市近12个月二手房均价(万元/㎡)如下:3.2,3.3,3.5,3.4,3.6,3.8,3.7,3.9,4.0,4.1,4.2,4.3(1)用3期简单移动平均预测第13个月价格;(2)计算指数平滑(α=0.3)第12期平滑值S12;(3)比较两种方法哪种对本期误差更小。答案:(1)F13=(4.1+4.2+4.3)/3=4.2(2)S1=3.2S2=0.3·3.3+0.7·3.2=3.23迭代至S12=3.89(3)实际第12期为4.3移动平均误差:|4.2-4.3|=0.1平滑误差:|3.89-4.3|=0.41∴移动平均更小。解析:指数平滑需递推,α小则平滑度高,对近期变化反应慢。42.(13分)为研究广告投入x(万元)对销售额y(万元)的影响,收集15个城市数据,拟合得:ŷ=20+1.5x,SST=1200,SSE=300(1)求决定系数R²并解释;(2)检验x对y的线性关系是否显著(α=0.01);(3)若x=10,求y的90%预测区间(x̄=8,Σ(x-x̄)²=200,s=√(300/13)=4.8)。答案:(1)R²=1-SSE/SST=1-300/1200=0.75,解释75%销售变动。(2)F=(SSR/1)/(SSE/(n-2))=(900/1)/(300/13)=39F0.01,1,13=9.0739>9.07,拒绝H0,关系显著。(3)预测值:20+1.5·10=35标准误预测:s_pred=4.8√(1+1/15+(10-8)²/200)=4.8√1.0867≈5.0t0.05,13=1.771区间:35±1.771·5.0=(26.1,43.9)万元解析:预测区间含未来随机误差,比置信区间宽。43.(14分)某电商平台想比较三种快递包装方案对破损率的影响,随机分配90个订单,每种30个,记录破损情况:方案A:破损5件;B:破损3件;C:破损10件。(1)构建3×2列联表;(2)用卡方检验判断破损率差异是否显著(α=0.05);(3)若差异显著,进一步比较哪两种方案差异主要来源。答案:(1)列联表:方案 破损 完好 合计A 5 25 30B 3 27 30C 10 20 30合计 18 72 90(2)期望频数:A破损=18·30/90=6,同理B=6,C=6χ²=Σ(O-E)²/E=(5-6)²/6+(3-6)²/6+(10-6)²/6+(25-24)²/24+(27-24)²/24+(20-24)²/24=1/6+9/6+16/6+1/24+9/24+16/24=26/6+26/24=4.33+1.08=5.41df=(3-1)(2-1)=2χ²0.05,2=5.995.41<5.99,不拒绝H0,差异不显著。(3)因整体差异不显著,无需事后比较。解析:期望频数均>5,卡方近似有效;若显著可用Bonferroni校正两两比较。七、软件应用题(共20分)44.使用R语言完成下列任务,并写出关键代码与结果解读。数据集:shauni.csv,包含变量height(cm)、weight(kg)、gender(M/F)、college(文理法医工)。(1)读取数据并计算男女平均身高差异的t检验(方差齐性);(2)绘制weight对height的散点图,并添加回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026西藏山南市融媒体中心招聘保洁员公益性岗位1人笔试备考题库及答案解析
- 2026湖北恩施州宣恩县万德昌智能机器人有限公司招聘1人笔试模拟试题及答案解析
- 2026山西省中西医结合医院招聘博士研究生20人考试备考题库及答案解析
- 2026云南众城现代产业合作发展有限责任公司招聘笔试备考题库及答案解析
- 2026上半年云南事业单位联考怒江州招聘137人考试参考题库及答案解析
- 2026四川绵阳市五八机器人科技有限责任公司外部招聘工作人员34人(2026年第一批次)笔试参考题库及答案解析
- 2026四川成都市简阳市射洪坝沱江幼儿园公益性岗位招聘1人考试备考试题及答案解析
- 2026年保山市市直事业单位遴选管理人员和专业技术人员(18人)考试备考试题及答案解析
- 2025年农学考研复试的专业笔试真题及答案
- 2025年人事人才考试及答案
- 林区道路设计合同范本
- 江苏省南京市建邺区2026届物理九上期末复习检测模拟试题含解析
- 家居行业投资合作合同(2025修订版)
- 2025年高三语文10月考联考作文汇编(解析+立意+范文)
- 2025年人工智慧行业人工智能技术与智能操作系统研究报告
- 自动化设备维护保养操作手册
- 危重病人的院前急救课件
- 矿井突水机理研究-洞察及研究
- 2025-2026秋“1530”安全教育记录表
- 骨密度检测的临床意义
- 钻探原始班报表试行版
评论
0/150
提交评论