版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年学生分析能力测试题及答案
一、单项选择题(每题2分,共20分)1.在多元线性回归中,若出现“解释变量间高度相关”现象,最先应考虑的修正方法是A.增加样本容量B.剔除因变量C.使用岭回归D.降低显著性水平2.某时间序列经ADF检验得到的τ统计量为-2.10,5%临界值为-2.89,则结论为A.序列平稳B.序列一阶单整C.拒绝原假设D.不拒绝存在单位根的原假设3.在结构方程模型中,用于评价“模型与数据整体适配度”且对样本量敏感最小的指标是A.RMSEAB.CFIC.GFID.χ²/df4.若随机变量X服从参数为λ的泊松分布,则其概率母函数在t=1处的值为A.0B.1C.e^λD.λ5.对两独立正态总体均值进行贝叶斯估计,若采用Jeffreys先验,则后验分布的方差与下列哪一项成正比A.合并方差乘以(1/n₁+1/n₂)B.先验方差C.样本极差D.样本峰度6.在机器学习的集成策略中,降低方差效果最显著的是A.BaggingB.BoostingC.StackingD.Blending7.若某因子分析中特征根λ₁=3.8,λ₂=1.1,λ₃=0.9,按Kaiser准则应提取的公因子数为A.1B.2C.3D.48.对高维稀疏数据执行聚类前,通常需先进行A.变量标准化B.变量中心化C.特征选择或降维D.变量正态化9.在双重差分法中,处理组在干预后的预期效应表达式为A.(Y_post,treat-Y_pre,treat)B.(Y_post,treat-Y_post,control)C.[(Y_post,treat-Y_pre,treat)]-[(Y_post,control-Y_pre,control)]D.(Y_pre,treat-Y_pre,control)10.若某投资组合的CVaR(95%)为800万元,其含义是A.有5%概率损失超过800万B.平均损失不低于800万C.在5%最大损失尾部条件下的期望损失为800万D.日波动率上限为800万二、填空题(每题2分,共20分)11.若样本偏度为-0.6,则分布左侧尾部比右侧尾部________。12.在贝叶斯网络中,若节点A与节点C在给定B时条件独立,则称A与C被B________。13.对p维数据做主成分分析,若前k个主成分累计贡献率达到85%,则k一般应满足k________p。14.当逻辑回归出现完全分离时,最大似然估计的系数绝对值会趋于________。15.若某AR(2)过程的特征方程两根为0.6和0.7,则该过程________(平稳/非平稳)。16.在随机森林中,对分类问题常用的投票策略是________投票。17.若两变量的Copula函数为Clayton,则其尾部相依性呈现________尾高于________尾。18.对计数数据使用负二项回归而非泊松回归,主要是为了解决________过度问题。19.在深度神经网络中,BatchNormalization层通常加在________层与________层之间。20.若某实验的Fisher信息矩阵为对角阵,则参数估计的________界可达到Cramér-Rao下界。三、判断题(每题2分,共20分,正确写“T”,错误写“F”)21.对于任意随机变量,峰度系数大于3即表示厚尾。22.Lasso回归的解路径是分段线性的。23.若两变量相互独立,则其互信息一定为0。24.在聚类分析中,单链接法对噪声点具有鲁棒性。25.当样本量趋于无穷时,Bayes估计一定收敛于MLE。26.对非平稳序列直接建立ARMA模型会导致伪回归。27.在强化学习中,策略梯度方法属于值函数逼近的一种。28.若残差呈现漏斗型,则说明存在异方差。29.对于小样本均值检验,t检验比z检验更保守。30.当VIF>10时,可认为多重共线性问题严重。四、简答题(每题5分,共20分)31.简述岭回归与Lasso回归在变量选择机制上的差异。32.说明双重差分法满足“平行趋势假设”的经济含义及检验思路。33.给出结构方程模型中“建构信度”与“平均方差提取量”的计算公式并解释其评价标准。34.概述随机森林中OOB误差估计的步骤及其优点。五、讨论题(每题5分,共20分)35.高维数据下,主成分分析可能面临哪些解释性困境?请提出两种改进策略并比较其优劣。36.当观测数据存在非随机缺失(MNAR)时,传统多重插补为何失效?试结合选择模型与模式混合模型讨论解决思路。37.在A/B测试的多指标场景下,为何需要控制族错误率?比较Bonferroni、BH与FDR回归三种方法的适用情境。38.深度学习模型常被批评为“黑箱”,请从可解释性角度讨论SHAP与LIME的异同,并指出各自在金融风险评估中的潜在局限。答案与解析一、单项选择题1.C2.D3.A4.B5.A6.A7.B8.C9.C10.C二、填空题11.更厚12.d-separated13.≤14.无穷大15.平稳16.多数17.下;上18.离散19.线性;激活20.方差三、判断题21.F22.T23.T24.F25.F26.T27.F28.T29.F30.T四、简答题(每题约200字)31.岭回归通过L2惩罚将系数压缩至接近零但不为零,不具备稀疏性;Lasso采用L1惩罚,使部分系数精确为零,实现变量选择。岭适合共线性高且需保留全部变量的场景,Lasso适合变量多而稀疏的真实模型。32.平行趋势指若无干预,处理组与对照组结果趋势一致。检验可用干预前多期数据画图或回归:将处理组虚拟变量与年份交互项放入模型,若交互项系数联合不显著,则支持假设。33.建构信度ρc=(Σλ)²/[(Σλ)²+Σ(1-λ²)],要求>0.7;平均方差提取量AVE=Σλ²/n,要求>0.5。两者越高表示潜变量对指标解释力越强,AVE更严格反映收敛效度。34.对每棵树,用未参与训练样本预测并计算误差,整合所有树得OOB误差。无需额外验证集,节省数据,且给出无偏估计,可用于变量重要度计算。五、讨论题(每题约200字)35.高维下主成分可能由噪声主导,解释困难。改进:1.稀疏主成分(SPCA)引入L1约束,使载荷稀疏,提高解释性,但求解复杂;2.旋转主成分(Varimax)放大载荷差异,易解释,但或损失方差。SPCA适合变量选择场景,旋转适合探索性分析。36.MNAR下缺失机制与未观测值相关,传统插补忽略此关联导致偏差。选择模型联合建模结果与缺失机制,需指定分布,敏感;模式混合模型分层建模不同缺失模式,较灵活,但需足够样本。二者可结合敏感性分析评估稳健性。37.多指标同时检验会放大TypeIerror。Bonferroni控制族错误率最严,适合少量、高成本实验;BH控制FDR,适合大规模、可接受少量假阳性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 道路客运售票员安全检查测试考核试卷含答案
- 铸管熔炼工岗前技巧考核试卷含答案
- 肥皂制造工操作规程强化考核试卷含答案
- 重轨加工工安全生产规范测试考核试卷含答案
- 耐火窑炉烧成工诚信模拟考核试卷含答案
- 快递员安全实操测试考核试卷含答案
- 草食家畜饲养工岗前技能掌握考核试卷含答案
- 评茶师诚信道德模拟考核试卷含答案
- 中专文秘考试题库及答案
- 中医眼科考试题库及答案
- 高三日语作文评分标准(2026届高三年级11月份联考)
- 2026年医药制造公司产品成本核算规程管理制度
- 验收规范考试试题及答案
- 人工智能课件说课稿
- DB5104-T 82-2023 康养产业项目认定规范
- 2025江苏连云港市教育局教研室选调教研员3人(公共基础知识)综合能力测试题附答案解析
- 小学语文教师数字教学能力提升策略与教学实践教学研究课题报告
- 2025年中国休闲农业与乡村旅游研究报告
- 统一战线教学课件
- 2025广东东莞市谢岗镇招聘编外聘用人员23人参考题库及答案详解(典优)
- 塔吊运输专项施工方案
评论
0/150
提交评论