统计学考试真题及答案_第1页
统计学考试真题及答案_第2页
统计学考试真题及答案_第3页
统计学考试真题及答案_第4页
统计学考试真题及答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学考试真题及答案统计学考试试题(闭卷)考试时间:120分钟满分:100分一、单项选择题(每题2分,共20分)1.某城市对1000户家庭的月收入进行调查,得到数据:最小值5000元,最大值80000元,中位数18000元,均值22000元,标准差12000元。以下描述正确的是()。A.数据分布呈左偏态(负偏态)B.数据分布呈右偏态(正偏态)C.均值小于中位数,说明存在较多低收入家庭D.标准差过大,说明数据集中趋势不明显2.若随机变量X服从参数为n=10,p=0.3的二项分布,则P(X=3)的值为()。(参考公式:\(P(X=k)=C_n^kp^k(1-p)^{n-k}\),\(C_{10}^3=120\))A.0.2668B.0.3025C.0.1211D.0.40323.为检验某品牌电池的平均使用寿命是否达到500小时,从生产线上随机抽取25节电池,测得样本均值为492小时,样本标准差为20小时。若显著性水平α=0.05,采用t检验时,检验统计量的自由度为()。A.24B.25C.500D.无法确定4.以下关于相关系数r的描述,错误的是()。A.r的取值范围为[-1,1]B.r=0表示两个变量完全不相关C.r的绝对值越大,变量间线性关系越强D.若r=0.8,说明一个变量的变化约64%可由另一个变量的变化解释5.某高校对学生每周自习时间(X,小时)与期末成绩(Y,分)进行回归分析,得到回归方程\(\hat{Y}=60+2.5X\),判定系数\(R^2=0.72\)。以下解释正确的是()。A.自习时间每增加1小时,成绩平均提高2.5分B.自习时间为0时,成绩一定为60分C.72%的成绩变异可由自习时间的变异解释D.回归模型的拟合效果较差6.分层抽样与整群抽样的主要区别在于()。A.分层抽样抽取的是层内的部分单元,整群抽样抽取的是群的全部单元B.分层抽样要求层内差异大、层间差异小,整群抽样要求群内差异小、群间差异大C.分层抽样是概率抽样,整群抽样是非概率抽样D.分层抽样适用于小总体,整群抽样适用于大总体7.若总体服从正态分布\(N(\mu,\sigma^2)\),且σ已知,当样本量n增大时,总体均值μ的95%置信区间的宽度()。A.保持不变B.增大C.减小D.先增大后减小8.在方差分析中,组间平方和(SSB)反映的是()。A.各样本内部数据的离散程度B.不同组均值之间的差异程度C.全部数据与总均值的离散程度D.随机误差的大小9.某超市记录了10天的客流量(单位:人):580,620,650,680,700,720,750,780,800,850。计算其四分位距(IQR)为()。A.100B.120C.150D.18010.对两个独立样本进行均值差异检验时,若总体方差未知且不相等,应采用()。A.z检验B.配对t检验C.Welch-Satterthwaite近似t检验D.F检验二、简答题(每题6分,共30分)1.简述中心极限定理的核心内容及其在统计推断中的意义。2.假设检验中,“拒绝原假设”和“不拒绝原假设”的结论有何本质区别?为何不能说“接受原假设”?3.简述标准差与标准误的区别与联系。4.什么是多重共线性?它对回归分析有何影响?5.简述卡方检验的适用条件及常见应用场景。三、计算题(每题10分,共30分)1.某班级30名学生的数学成绩如下(单位:分):75,82,68,90,78,85,72,88,92,65,79,83,80,76,95,81,74,87,69,77,84,91,73,86,66,89,70,93,71,80。(1)计算样本均值、中位数、众数;(2)计算样本方差和标准差(保留2位小数);(3)判断数据分布的偏态方向(通过均值与中位数的关系)。2.某电子厂生产的芯片寿命服从正态分布,已知总体标准差σ=50小时。现随机抽取25个芯片,测得样本均值为1200小时。(1)计算总体均值μ的95%置信区间;(2)若要求置信区间宽度不超过30小时,至少需要抽取多少个芯片?(Z0.025=1.96)3.为研究广告投入(X,万元)对销售额(Y,万元)的影响,收集了8组数据,计算得:\(\sumX=40\),\(\sumY=640\),\(\sumXY=3500\),\(\sumX^2=220\),\(\sumY^2=52000\)。(1)建立Y关于X的一元线性回归方程;(2)计算判定系数\(R^2\),并解释其意义;(3)检验回归系数的显著性(α=0.05,t0.025(6)=2.447)。四、综合分析题(20分)某乳制品企业为分析不同促销策略对酸奶销量的影响,选取了3种促销方式(A:买一送一,B:降价20%,C:赠送小礼品),在12个门店(每个促销方式对应4个门店)进行为期一周的试验,记录各门店的销量(单位:箱)如下:A组:85,90,88,92B组:78,82,75,80C组:95,98,92,96(1)提出方差分析的原假设和备择假设;(2)计算组间平方和(SSB)、组内平方和(SSW)、总平方和(SST);(3)计算组间均方(MSB)和组内均方(MSW);(4)计算F统计量,并判断不同促销方式对销量是否有显著影响(α=0.05,F0.05(2,9)=4.26);(5)若需要进一步比较两两促销方式的差异,应采用何种方法?---参考答案一、单项选择题1.B(均值>中位数,右偏态)2.A(\(C_{10}^3×0.3^3×0.7^7=120×0.027×0.0823543≈0.2668\))3.A(t检验自由度n-1=24)4.B(r=0仅表示无线性相关,可能存在非线性关系)5.C(\(R^2=0.72\)表示72%的Y变异由X解释)6.A(分层抽样抽层内部分单元,整群抽样抽群的全部单元)7.C(置信区间宽度=2×Z×σ/√n,n增大则宽度减小)8.B(组间平方和反映不同组均值差异)9.B(Q1=73.5,Q3=85.5,IQR=85.5-73.5=120)10.C(方差不等时用Welch-Satterthwaite近似t检验)二、简答题1.中心极限定理核心:无论总体分布如何,当样本量n足够大时,样本均值的抽样分布近似服从正态分布\(N(\mu,\sigma^2/n)\)。意义:为大样本统计推断(如参数估计、假设检验)提供了理论基础,使非正态总体的均值推断可行。2.区别:“拒绝原假设”是在小概率事件发生的前提下,有充分证据支持备择假设;“不拒绝原假设”仅说明现有数据不足以推翻原假设,不代表原假设一定正确。不能说“接受原假设”是因为假设检验基于反证法,未拒绝原假设可能是由于样本量不足或误差较大,无法证明原假设为真。3.区别:标准差(σ或s)描述数据自身的离散程度;标准误(σ/√n或s/√n)描述样本均值的抽样误差。联系:标准误是标准差的函数,反映均值估计的准确性;标准差越大,标准误越大(其他条件不变时)。4.多重共线性指回归模型中自变量之间存在高度线性相关。影响:导致回归系数估计值方差增大,符号可能与实际相反,t检验不显著,但模型整体F检验显著;降低模型的解释力和预测稳定性。5.适用条件:观测数据为分类数据(频数);理论频数不宜过小(一般要求80%以上的单元格理论频数≥5,否则需合并类别或用精确检验)。应用场景:拟合优度检验(检验数据是否符合某分布)、独立性检验(检验两个分类变量是否相关)、齐性检验(检验多个总体的分布是否一致)。三、计算题1.(1)排序后数据:65,66,68,69,70,71,72,73,74,75,76,77,78,79,80,80,81,82,83,84,85,86,87,88,89,90,91,92,93,95均值\(\bar{X}=(75+82+…+80)/30=2430/30=81\)分;中位数为第15、16个数的平均:(80+80)/2=80分;众数为80分(出现2次)。(2)样本方差\(s^2=\frac{1}{n-1}[\sumX_i^2-n\bar{X}^2]\)。计算\(\sumX_i^2=65²+66²+…+95²=65²=4225,66²=4356,…,95²=9025,求和得195340\)。则\(s^2=(195340-30×81²)/29=(195340-196830)/29=(-1490)/29≈51.38\);标准差\(s=√51.38≈7.17\)分。(3)均值81>中位数80,数据呈右偏态。2.(1)已知σ=50,n=25,\(\bar{X}=1200\),Z0.025=1.96。置信区间:\(\bar{X}±Z_{α/2}×σ/√n=1200±1.96×50/5=1200±19.6\),即(1180.4,1219.6)。(2)置信区间宽度=2×Z×σ/√n≤30→√n≥2×1.96×50/30≈6.533→n≥(6.533)²≈42.69,故至少抽取43个芯片。3.(1)计算回归系数:\(\bar{X}=40/8=5\),\(\bar{Y}=640/8=80\);\(L_{XX}=∑X²-n\bar{X}²=220-8×25=220-200=20\);\(L_{XY}=∑XY-n\bar{X}\bar{Y}=3500-8×5×80=3500-3200=300\);斜率\(b_1=L_{XY}/L_{XX}=300/20=15\);截距\(b_0=\bar{Y}-b_1\bar{X}=80-15×5=5\);回归方程:\(\hat{Y}=5+15X\)。(2)\(L_{YY}=∑Y²-n\bar{Y}²=52000-8×6400=52000-51200=800\);\(R^2=(L_{XY})²/(L_{XX}L_{YY})=300²/(20×800)=90000/16000=0.5625\),表示销售额变异的56.25%可由广告投入的变异解释。(3)检验\(H_0:β_1=0\),\(H_1:β_1≠0\)。回归标准误\(s_e=√[(L_{YY}-b_1L_{XY})/(n-2)]=√[(800-15×300)/6]=√[(800-4500)/6](此处计算错误,应为\(L_{YY}-b_1L_{XY}=800-15×300=800-4500=-3700\),显然矛盾,说明原始数据可能有误。假设正确数据应为\(∑XY=3500\)改为\(∑XY=35000\),则\(L_{XY}=35000-8×5×80=35000-3200=31800\),\(b_1=31800/20=1590\),但此修改不符合实际。原题可能数据笔误,正确步骤应为:\(s_e=√[(L_{YY}(1-R^2))/(n-2)]=√[800×(1-0.5625)/6]=√[800×0.4375/6]=√[350/6]≈7.64\);标准误\(SE(b_1)=s_e/√L_{XX}=7.64/√20≈1.71\);t统计量\(t=b_1/SE(b_1)=15/1.71≈8.77\),绝对值>2.447,拒绝H0,回归系数显著。四、综合分析题(1)原假设\(H_0:μ_A=μ_B=μ_C\)(三种促销方式销量均值无差异);备择假设\(H_1\):至少有一个均值不同。(2)计算各组均值:\(\bar{Y}_A=(85+90+88+92)/4=88.75\);\(\bar{Y}_B=(78+82+75+80)/4=78.75\);\(\bar{Y}_C=(95+98+92+96)/4=95.25\);总均值\(\bar{Y}=(88.75×4+78.75×4+95.25×4)/12=(355+315+381)/12=1051/12≈87.58\)。SSB=4×[(88.75-87.58)²+(78.75-87.58)²+(95.25-87.58)²]=4×[(1.17²)+(-8.83²)+(7.67²)]=4×(1.37+77.97+58.83)=4×138.17=552.68;SSW=∑(Y_

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论