高等教育自学考试《统计学原理》试题及答案_第1页
高等教育自学考试《统计学原理》试题及答案_第2页
高等教育自学考试《统计学原理》试题及答案_第3页
高等教育自学考试《统计学原理》试题及答案_第4页
高等教育自学考试《统计学原理》试题及答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高等教育自学考试《统计学原理》试题及答案一、单项选择题(每小题1分,共20分)1.某市2022年人口普查资料显示常住人口为1236万人,该数据属于A.定类数据 B.定序数据 C.定距数据 D.定比数据答案:D解析:人口数具有绝对零点,且可计算倍数关系,符合定比尺度特征。2.在抽样调查中,若总体方差未知,且样本容量n=35,则总体均值μ的1–α置信区间应选用的分布为A.标准正态 B.t分布 C.χ²分布 D.F分布答案:B解析:n<50且总体方差未知,按t分布处理,自由度34。3.下列关于相关系数r的叙述,正确的是A.|r|越接近0,线性关系越强 B.r=0.8表示解释变量能解释80%的变异C.r无量纲 D.r>0时,两变量一定存在因果关系答案:C解析:相关系数标准化后无单位,取值–1~1,仅度量线性相关强度,不隐含因果。4.若随机变量X~N(μ,σ²),则P(μ–σ<X<μ+σ)约为A.50% B.68.27% C.95% D.99%答案:B解析:正态分布经验法则,±1σ区间概率68.27%。5.在假设检验中,增大样本容量会导致A.α一定减小 B.β一定减小 C.检验功效1–β一定增大 D.临界值不变答案:C解析:样本量↑→标准误↓→分布更集中,β↓,功效↑;α由研究者事先设定,不受n直接影响。6.对同一组数据分别计算众数、中位数、均值,若分布右偏,则三者大小关系为A.众数<中位数<均值 B.均值<中位数<众数C.中位数<众数<均值 D.众数=中位数=均值答案:A解析:右偏时,右侧极端值将均值拉向较大值,众数最小,中位数居中。7.在单因素方差分析中,若F统计量显著,则A.各总体方差不全相等 B.各总体均值不全相等C.各样本方差不全相等 D.各样本容量必须相等答案:B解析:F检验的原假设H₀:μ₁=μ₂=…=μk,拒绝即至少一对均值不等。8.某时间数列环比增长率依次为2%,–1%,3%,则定基(以第0期为100)第三期值为A.104.00 B.104.06 C.103.94 D.102.97答案:B解析:100×1.02×0.99×1.03≈104.06。9.若回归模型ŷ=25+3x,x每增加1单位,y平均A.增加25 B.增加3 C.增加28 D.减少3答案:B解析:斜率3即为x边际效应。10.在指数编制中,拉氏价格指数使用A.基期数量加权 B.报告期数量加权 C.基期价格加权 D.报告期价格加权答案:A解析:Laspeyres指数公式∑p₁q₀/∑p₀q₀,权数固定为基期数量。11.对某批产品进行不放回抽样,若总体N=500,样本n=50,则样本比例的标准误计算应使用修正因子A.√[(N–n)/(N–1)] B.√[n/(N–1)] C.(N–n)/N D.1答案:A解析:有限总体修正因子为√[(N–n)/(N–1)],可缩小标准误。12.若事件A、B互斥且P(A)=0.3,P(B)=0.5,则P(A∪B)=A.0.15 B.0.8 C.0.2 D.0.5答案:B解析:互斥时P(A∪B)=P(A)+P(B)=0.8。13.在箱线图中,箱体长度表示A.全距 B.四分位距 C.标准差 D.方差答案:B解析:箱体上边缘Q3,下边缘Q1,长度=Q3–Q1即IQR。14.若随机变量X服从参数λ=2的泊松分布,则E(X²)=A.2 B.4 C.6 D.8答案:C解析:泊松分布E(X)=λ,Var(X)=λ,E(X²)=Var(X)+[E(X)]²=2+4=6。15.对同一总体采用同样样本量,分别用简单随机抽样与分层抽样,一般而言A.前者方差更小 B.后者方差更小 C.两者方差相等 D.无法比较答案:B解析:分层抽样层内同质性高,可降低估计量方差。16.在多元线性回归中,若某自变量VIF=8,则一般认为A.不存在多重共线 B.存在轻微共线 C.存在严重共线 D.模型无效答案:C解析:方差膨胀因子>10为严重,>5已需关注,8属较高。17.若某指标季节指数第一季度为115%,说明A.该季受随机因素影响大 B.该季比全年平均高15%C.该季比去年同季高15% D.该季数据错误答案:B解析:季节指数>100表示该季水平高于全年平均。18.对同一组数据,若峰度系数K>3,则分布形态为A.低阔峰 B.高尖峰 C.正态峰 D.无法判断答案:B解析:峰度>3称尖峰厚尾,比正态更集中顶部。19.在统计质量控制图中,中心线CL通常取A.规格上限 B.规格下限 C.过程均值 D.公差中心答案:C解析:控制图中心线即过程稳定时的μ估计值。20.若两独立样本t检验结果p=0.032,显著性水平α=0.05,则A.拒绝H₀,犯第一类错误概率为3.2% B.拒绝H₀,犯第一类错误概率为5%C.不拒绝H₀,可能犯第二类错误 D.无法判断答案:B解析:p<α拒绝H₀,第一类错误概率即α=5%,与p值无关。二、多项选择题(每小题2分,共10分,多选少选均不得分)21.下列属于描述统计方法的有A.直方图 B.箱线图 C.假设检验 D.散点图 E.参数估计答案:ABD解析:描述统计用图表概括数据,C、E属推断统计。22.影响样本容量确定的因素包括A.总体方差 B.允许误差 C.置信水平 D.抽样方式 E.问卷长度答案:ABCD解析:样本量公式均含σ、E、Zα/2及设计效应,与问卷长度无直接关系。23.下列关于移动平均法的说法正确的有A.可消除季节变动 B.阶数越大,平滑效果越强 C.会损失首尾数据 D.可用于趋势预测 E.对随机波动敏感答案:BCD解析:移动平均削弱短期波动,阶数大则更平滑,首尾无法计算,不能消除季节,需季节调整。24.若回归模型存在异方差,则A.OLS估计有偏 B.OLS估计仍无偏 C.标准误失效 D.t检验不可靠 E.可用加权最小二乘修正答案:BCDE解析:异方差下OLS仍线性无偏,但方差非最小,标准误估计偏,检验失效,可用WLS。25.下列属于时间数列构成要素的有A.长期趋势 B.季节变动 C.循环变动 D.不规则变动 E.抽样误差答案:ABCD解析:时间数列经典四要素,抽样误差属调查误差。三、判断题(每小题1分,共10分,正确打“√”,错误打“×”)26.标准差一定小于均值。答案:×解析:标准差与均值量纲相同,但数值大小无必然关系,如N(0.01,1)即反例。27.若两变量完全线性相关,则回归直线通过所有样本点。答案:√解析:|r|=1时残差平方和为0,拟合完美。28.泊松分布的均值与方差始终相等。答案:√解析:泊松分布参数λ同时等于期望与方差。29.在假设检验中,p值越大,拒绝原假设的证据越强。答案:×解析:p值越大,越不能拒绝H₀。30.指数平滑法平滑系数α越接近1,对历史数据遗忘速度越慢。答案:×解析:α→1表示最新观测权重极高,遗忘速度越快。31.对正态总体,样本均值的标准误随样本量增大而减小。答案:√解析:标准误=σ/√n,n↑则↓。32.若置信水平从95%提高到99%,则置信区间宽度一定变窄。答案:×解析:置信水平↑→Zα/2↑→区间变宽。33.中位数对极端值比均值更敏感。答案:×解析:中位数仅依赖位次,对极端值稳健。34.在列联表χ²检验中,期望频数小于5的单元格比例应低于20%。答案:√解析:Cochran准则建议,否则需合并或改用Fisher精确检验。35.若随机变量X~N(10,4),则2X~N(20,8)。答案:×解析:线性变换Var(aX)=a²Var(X),故Var(2X)=4×4=16,应为N(20,16)。四、填空题(每空2分,共20分)36.若样本数据5,7,8,9,11,则其极差为6。37.设随机变量T服从自由度为15的t分布,则其方差为15/13(保留分数)。38.在指数体系中,销售额指数=价格指数×数量指数。39.若回归决定系数R²=0.64,则解释变量对因变量的变异解释比例为64%。40.对总体比例进行估计时,若样本比例p̂=0.4,n=100,则其标准误为0.04899(保留5位小数)。41.某企业2020—2023年利润(万元)依次为200,230,270,则几何平均增长率为10.63%(保留两位小数)。42.若X~B(n=10,p=0.3),则P(X=0)=0.0282(保留4位小数)。43.在质量控制中,过程能力指数Cp=1.33,说明过程不合格品率约为0.0064%(双侧,正态,查表)。44.若季节指数之和为400%,说明该数据为季度数据。45.对同一组数据,若偏度系数为–0.8,则分布左尾比右尾长。五、简答题(每小题8分,共24分)46.简述中心极限定理的主要内容及其在统计推断中的作用。答案:中心极限定理指出,从任意总体(均值μ、有限方差σ²)中抽取容量为n的简单随机样本,当n足够大时,样本均值的抽样分布近似服从N(μ,σ²/n)。该定理奠定了大样本推断的基础:(1)使未知分布总体的均值置信区间构建成为可能;(2)使大样本下Z检验无需假定总体正态;(3)为比例、两均值差等非正态问题的近似正态解法提供理论依据;(4)解释了为何许多自然、社会现象叠加后呈钟形分布,提升模型泛化能力。47.说明多重共线性对多元回归模型的影响,并给出两种诊断及两种解决办法。答案:影响:(1)OLS估计量仍无偏,但方差膨胀,导致t检验失效,系数符号可能反常;(2)模型对样本微小变化极度敏感,预测稳定性下降;(3)难以评估单个自变量对因变量的边际贡献。诊断:①方差膨胀因子VIF>10(或>5)提示严重共线;②特征值条件数κ>30表明设计矩阵病态。解决办法:①删除或合并高度相关的自变量;②采用岭回归、Lasso等正则化技术,在偏差—方差间权衡。48.比较简单随机抽样与分层抽样在估计总体均值时的效率差异,并给出分层抽样精度更高的前提条件。答案:简单随机抽样方差V(ȳ)=S²/n;分层抽样方差V(ȳ_st)=∑W_h²S_h²/n_h,若层内方差S_h²远小于总体方差S²,且层均值差异大,则分层估计量方差显著降低。前提:(1)分层变量与调查变量高度相关;(2)各层内部同质、层间异质;(3)层权准确、无非抽样误差;(4)合理分配样本(如Neyman最优分配),才能充分发挥分层效率优势。六、计算题(共46分)49.(10分)某高校自考办随机抽取36名考生,统计得平均成绩74分,标准差9分。假定成绩近似正态,试求:(1)该校全体考生平均成绩μ的95%置信区间;(2)若希望估计误差不超过2分,置信水平仍为95%,求所需样本量。答案:(1)n=36,ȳ=74,s=9,α=0.05,t₀.₀₂₅(35)=2.03标准误=9/√36=1.5区间:74±2.03×1.5=74±3.05→(70.95,77.05)(2)E=2,Z₀.₀₂₅=1.96(大样本用Z)n=(Z²s²)/E²=(1.96²×81)/4≈77.8→至少78人。50.(12分)为比较两种教学方法效果,随机将60名学生均分为两组。实验组采用翻转课堂,对照组传统讲授。期末成绩如下:实验组:n₁=30,ȳ₁=82,s₁²=64对照组:n₂=30,ȳ₂=76,s₂²=49假定两总体近似正态且方差齐性,试在α=0.05下检验两种方法平均成绩是否有显著差异。答案:H₀:μ₁=μ₂,H₁:μ₁≠μ₂合并方差s_p²=[(29×64+29×49)]/58=56.5标准误=√[56.5×(1/30+1/30)]=1.94t=(82–76)/1.94=3.09双侧临界值t₀.₀₂₅(58)=2.00|t|=3.09>2.00,拒绝H₀,两种方法成绩差异显著。51.(12分)某市近10年GDP(亿元)数据如下:年份t:12345678910GDPy:120135150168185205228252278310(1)用最小二乘法拟合线性趋势方程ŷ=a+bt;(2)预测第12年GDP;(3)计算趋势值与实际值的平均绝对误差MAE。答案:(1)n=10,∑t=55,∑y=2031,∑t²=385,∑ty=12455b=[10×12455–55×2031]/[10×385–55²]=2155/825=21.34a=(2031–21.34×55)/10=84.23方程:ŷ=84.23+21.34t(2)t=12,ŷ=84.23+21.34×12=340.31(亿元)(3)计算各ŷ与y绝对差平均:MAE=14.7(亿元)(过程略)。52.(12分)某超市想研究顾客满意度(Y,1~10分)与等候时间(X₁,分钟)、商品价格指数(X₂,%)的关系,抽取25组数据,得到以下部分结果:回归方程:ŷ=8.5–0.35x₁–0.08x₂SSR=60,SSE=40(1)完成方差分析表并检验模型整体显著性(α=0.05);(2)计算调整后的决定系数R̄²;(3)解释x₁系数含义。答案:(1)SST=SSR+SSE=100dfR=2,dfE=22,dfT=24MSR=30,MSE=1.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论