商务统计期末试题和答案_第1页
商务统计期末试题和答案_第2页
商务统计期末试题和答案_第3页
商务统计期末试题和答案_第4页
商务统计期末试题和答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商务统计期末试题和答案一、单项选择题(每题2分,共20分)1.某电商平台在“618”大促期间对10万名用户进行分层抽样,共抽取2000人。若总体中女性占比58%,样本中女性占比60%,则样本女性比例的抽样误差(标准误)最接近A.0.010  B.0.011  C.0.012  D.0.013答案:B解析:比例标准误公式S其中p=0.58,n=2000,S2.对同一组数据分别计算Pearson相关系数r与Spearman等级相关系数ρ,若发现|r|显著小于A.数据存在明显离群值  B.变量间为线性关系  C.变量服从二元正态  D.样本量过小答案:A解析:Spearman对离群值不敏感,Pearson易受极端值拉低。3.在多元线性回归中,若某解释变量的方差膨胀因子VIF=8.5,则A.存在轻微多重共线  B.存在严重多重共线  C.无异方差  D.模型过拟合答案:A解析:VIF>10才视为严重,8.5属于轻微。4.某时间序列经ADF检验得到τ统计量=−3.41,对应1%临界值−3.43,5%临界值−2.86,则A.序列在1%水平平稳  B.序列在5%水平平稳  C.序列非平稳  D.无法判断答案:B解析:−3.41>−3.43,未达1%拒绝域,但<−2.86,可在5%水平拒绝单位根。5.在聚类分析中,若采用Ward法,合并两类后组内平方和增加量最小,说明A.两类重心距离最小  B.两类样本量差异最小  C.合并后组内方差增量最小  D.合并后轮廓系数最大答案:C解析:Ward准则即最小化合并导致组内平方和增量。6.设X~N(μ,),抽取n=A.11.8  B.12.4  C.13.2  D.14.0答案:B解析:区间长度27.在假设检验中,若显著性水平α从0.05降到0.01,则A.第一类错误概率降低,检验功效升高  B.第一类错误降低,功效降低  C.第一类错误升高,功效升高  D.均不变答案:B解析:α↓→β↑→功效1−β↓。8.对二分类Logistic回归,若某变量系数β^A.1.5  B.2.0  C.2.5  D.3.0答案:B解析:OR9.在控制图应用中,若过程均值未偏移但标准差增大,则A.仅R图报警  B.仅x¯答案:A解析:标准差增大直接体现在极差图。10.对同一总体,若样本量从100增至400,则样本均值的标准误将A.不变  B.减半  C.减至1/4  D.增至2倍答案:B解析:SE∝1二、多项选择题(每题3分,共15分,多选少选均不得分)11.下列哪些统计量可用于检验二元正态性A.Mardia偏度检验  B.Henze–Zirkler检验  C.Shapiro–Wilk检验  D.Kolmogorov–Smirnov检验  E.Royston检验答案:A、B、E解析:Shapiro–Wilk与K-S为单变量或经验分布检验,不直接针对二元正态。12.关于主成分分析,正确的有A.主成分方向对应协方差矩阵特征向量  B.各主成分方差之和等于原始变量总方差  C.第一主成分解释方差最大  D.主成分间相关系数为0  E.必须对变量标准化答案:A、B、C、D解析:标准化非必须,若量纲相同可省略。13.在贝叶斯估计中,若先验为Beta(2,2),似然为二项分布Bin(n=20,k=8),则A.后验为Beta(10,14)  B.后验均值小于MLE  C.后验众数小于MLE  D.后验众数大于MLE  E.后验众数等于MLE答案:A、B、C解析:MLE=8/20=0.4,后验众数14.下列哪些方法可用于处理缺失数据MAR机制A.多重插补  B.完整案例分析  C.逆概率加权  D.期望最大化算法  E.删除含缺失变量答案:A、C、D解析:完整案例与删除均可能引入偏差。15.在随机森林中,降低树的相关性可采取A.增加树的数量  B.随机选取特征子集  C.对样本进行Bootstrap  D.预剪枝  E.后剪枝答案:B、C解析:特征随机与样本Bootstrap是Bagging核心,直接降低相关性。三、判断题(每题1分,共10分,正确打“√”,错误打“×”)16.若两变量秩次完全相同,则Spearman系数等于1。  √17.在ANOVA中,组间均方大说明因子显著。  ×(需与组内均方比较)18.指数平滑系数α越接近1,模型越依赖历史平均。  ×(越依赖最近值)19.若残差呈现漏斗型,则表明存在异方差。  √20.对偏态分布,中位数比均值更稳健。  √21.当样本量足够大时,t分布近似标准正态。  √22.在聚类分析中,K-means对初始中心敏感。  √23.若Durbin-Watson统计量接近4,则存在正自相关。  ×(接近0为正,4为负)24.对计数数据,泊松回归要求均值等于方差。  √(基本假设)25.在A/B测试中,若p值=0.04,则实验效应一定具有实际意义。  ×(需结合效应量)四、填空题(每空2分,共20分)26.设X~N(答案:Φ(1.5)−Φ(−1)=0.9332−0.1587=0.774527.某回归模型调整=0.81,原=0.83,模型含5个解释变量,样本量答案:0.8128.若随机变量X服从自由度为12的t分布,则E(答案:=29.在指数分布中,若均值=4,则其四分位距=________。答案:指数CDFF(x)=1−30.对2×答案:31.若某股票日收益率GARCH(1,1)模型为=0.0001答案:=32.在Bootstrap百分位置信区间中,若B=2000,则95%区间对应的经验分位数为第________个次序统计量。答案:低:0.025×200133.若某因子有4个水平,每水平重复6次,则双尾TukeyHSD临界值公式中的组间自由度=________。答案:434.对泊松过程,若强度λ=3/小时,则第2次事件到达的期望时间=________小时。答案:235.若某判别分析中,两总体协方差矩阵相等,则最优分类函数为________。答案:线性判别函数(LDF)五、计算与综合题(共85分)36.(12分)某连锁便利店随机抽取15家门店,记录日均营业额(万元)与周边人流量(千人),数据如下:门店123456789101112131415营业额Y2.32.93.13.54.04.24.85.05.55.76.06.26.56.87.0人流量X1.21.51.82.02.32.52.83.03.33.53.84.04.24.54.8已知:∑=45.2,∑=75.3,∑=(1)建立一元线性回归方程,并解释斜率含义;(4分)(2)计算判定系数;(3分)(3)检验斜率是否显著(α=0.05);(3分)(4)若某新店人流量预计3.6千人,预测其日均营业额并给出95%置信区间。(2分)答案:(1)ba回归方程:y^(2)SS=(3)==t(4)y预测标准误=95%区间:5.72537.(10分)某制造厂质检部连续30天抽取样本量n=5的轴径数据,测得平均极差R¯=0.025(1)建立x¯(2)若第31天样本均值20.085mm,极差0.035mm,判断过程是否失控。(2分)(3)计算过程能力指数与,规格限20.000±0.100mm;(2分)答案:(1)查表得=0.577,=0x¯ULR图:U(2)第31天x¯(3)σ==38.(13分)某零售集团研究会员等级(普通、银卡、金卡)与季度消费频次关系,随机抽取270名会员,交叉表如下:等级\频次≤23–5≥6行合计普通28422090银卡15453090金卡7335090列合计50120100270(1)检验会员等级与消费频次是否独立(α=0.05);(8分)(2)若拒绝独立,计算Cramér’sV并解释;(3分)(3)给出普通会员消费频次≤2的标准化残差。(2分)答案:(1)期望频数=/N卡方统计量=自由度(3(2)V中等关联。(3)普通≤2标准化残差=39.(10分)某互联网公司对网页加载时长(秒)进行A/B测试,原版本A共500用户,样本均值4.80s,标准差1.20s;新版本B共600用户,均值4.55s,标准差1.15s。假设方差齐性。(1)检验B是否显著快于A(单侧α=0.05);(5分)(2)计算效应量Cohen’sd;(2分)(3)若希望检出d=0.25的两均值差异,α=0.05,功效0.80,每组需多少样本?(3分)答案:(1)合并方差=t单侧临界1.645,3.42>1.645,拒绝,B显著更快。(2)d(3)用GPower近似:(3)用GPower近似:n每组需251人。40.(15分)某市交通局收集过去24个月公交客流(百万人次)数据,建立ARIMA(1,1,1)模型,估计结果:(已知最近三个月客流:218,221,224。(1)写出模型展开式;(3分)(2)计算未来第1、2期点预测;(6分)(3)给出第1期95%预测区间;(3分)(4)简述如何检验模型残差是否为白噪声。(3分)答案:(1)=(2)====(3)预测方差V95%区间:226.34(4)绘制残差ACF/PACF图,Ljung-Box检验Q(m)统计量,若p值>0.05则视为白噪声。41.(10分)某银行信用卡中心建立Logistic模型预测客户违约,变量:年龄、月收入、信用卡额度、历史逾期次数。样本5000客户,违约率8%。逐步回归后保留逾期次数、额度、收入。模型输出:变量系数SEWaldχ²p截距−4.5000.300225.0<0.001逾期次数0.8500.060200.9<0.001额度(千元)0.0120.00316.0<0.001收入(千元)−0.0250.00525.0<0.001(1)解释额度系数符号含义;(2分)(2)计算逾期次数从0增至3的违约概率变化(设额度=50k,收入=10k);(4分)(3)给出AUC计算公式框架(不写数值)。(4分)答案:(1)额度系数正号:在控制收入与逾期次数下,额度越高违约概率越高,可能反映高风险客户获高额度。(2)Δ==概率增加0.175,即17.5个百分点。(3)AUC=∑(TPR_k−TPR_{k−1})×(FPR_k+FPR_{k−1})/2,按预测概率降序排列,计算梯形面积和。42.(15分)某医药公司研发新型降压药,采用交叉设计,20名高血压患者随机分两组,阶段1、2分别服用试验药T与对照药C,洗脱期2周。测量服药4小时后舒张压下降值(mmHg):患者顺序TCTCd=T−C1–10TC……均值\(\bard_1=4.2\),s₁=2.811–20CT……均值\(\bard_2=3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论