版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据的统计与分析综合测试题(含答案)1.单选题(每题4分,共40分)1.1某市对10万户家庭进行收入抽样调查,采用分层抽样,按城乡分层。若城镇层共7万户,农村层3万户,样本量定为1000户,则按比例分配时,农村层应抽取A.300户 B.350户 C.400户 D.450户答案:A解析:按比例分配公式=农村层样本量=1.2设随机变量X~N(μ,),若P(A.1.645 B.2.326 C.2.576 D.3.291答案:B解析:由标准正态分位数(0.10)=b最接近选项B2.326(双侧90%区间对应1.645×2=3.290,但题目为10%–90%,故单侧1.2816×2)。1.3对同一总体进行两次独立简单随机抽样,样本量分别为,,样本均值分别为,。若构造合并估计量=则的方差为A. B.+ C. D.答案:A解析:独立样本均值线性组合,方差Var1.4在简单线性回归=++中,若所有均增加常数cA.不变,增加c B.增加c,不变C.不变,减少c D.减少c,增加c答案:C解析:最小二乘估计=平移←+c不改变离差,故=新截距=y¯−(xA.2.00 B.2.22 C.2.67 D.3.20答案:C解析:期望频数==1.6设,…,为来自指数分布A.X¯ B.1/X¯答案:B解析:似然函数L令导数为零得λ1.7对时间序列{}(若ϕ=A.|ϕ|<1,|答案:A解析:AR部分特征根1−ϕz=0要求1.8在贝叶斯估计中,若先验为Beta(2,2)A. B. C. D.答案:B解析:共轭先验,后验Beta(1.9对多元线性回归模型进行变量选择,若使用调整准则,则下列说法正确的是A.增加变量一定使调整增大 B.增加变量一定使调整减小C.增加变量可能使调整增大或减小 D.调整与变量数无关答案:C解析:调整=1−,新增变量若对模型解释力提升足够大,则RSS下降幅度足以抵消自由度惩罚,调整1.10对同一组数据分别建立决策树与随机森林,若随机森林中树数足够大,则A.训练误差:随机森林<单棵树;测试误差:随机森林>单棵树B.训练误差:随机森林=单棵树;测试误差:随机森林>单棵树C.训练误差:随机森林<单棵树;测试误差:随机森林<单棵树D.训练误差:随机森林→0;测试误差:随机森林→0答案:C解析:随机森林通过Bootstrap与特征随机子空间降低方差,通常同时降低训练误差与测试误差,且测试误差优于单棵树。2.多选题(每题5分,共30分,每题至少两个正确答案,多选少选均不得分)2.1下列关于充分统计量的说法正确的有A.若T为充分统计量,则似然函数可分解为LB.充分统计量一定是最小充分统计量C.指数族分布的自然统计量是充分统计量D.充分统计量必为完备统计量答案:AC解析:A为因子分解定理;C指数族性质;B错误,充分不一定最小;D错误,充分不一定完备。2.2在多重共线性诊断中,可用于度量共线性严重程度的指标有A.方差膨胀因子VIF B.条件数κ C.特征根 D.偏相关系数答案:ABC解析:D偏相关用于变量关系,不直接度量共线性。2.3下列方法可用于非参数密度估计的有A.直方图 B.核密度估计 C.k-近邻密度估计 D.极大似然估计答案:ABC解析:D需假定参数模型,属参数方法。2.4关于主成分分析,正确的有A.主成分方向是协方差矩阵特征向量 B.主成分方差等于对应特征值C.主成分之间相关系数为零 D.主成分对原始变量尺度不敏感答案:ABC解析:D错误,PCA对尺度敏感,需标准化。2.5下列属于无监督学习算法的有A.K-means B.DBSCAN C.Apriori D.支持向量机答案:ABC解析:D为监督学习。2.6若随机变量X服从参数为μ,A.lnX~C.Var(X答案:ABCD解析:对数正态性质。3.填空题(每题6分,共30分)3.1设,…,为来自U(0,θ)答案:矩估计2X¯解析:矩法E[3.2对某泊松过程,单位时间事件数均值为λ=3,则第4次事件等待时间的方差为―答案:4解析:Gamma分布Gamma(k3.3在单因素方差分析中,组间平方和SSA=360,组内平方和SSE=480,总样本量n=30,组数k=答案:=3.4若随机向量X~(μ,Σ答案:3.5对某AR(1)过程=0.7+,~N答案:4.计算与证明题(共100分)4.1(15分)设,…f的i.i.d.样本。(1)求θ的极大似然估计θ^(2)证明θ^(3)给出θ^答案:(1)似然函数L令导数为零得θ(2)由大数定律∑ln→E(3)信息量I故(4.2(15分)某电商平台欲评估新版推荐算法对转化率的影响,随机抽取10000名用户,随机分为实验组(5000人)与对照组(5000人)。一周后发现实验组转化350人,对照组转化300人。(1)构建转化率差异的95%置信区间;(2)若希望估计差异的绝对误差不超过0.01,求所需样本量(双侧α=答案:(1)样本差异−合并方差p95%区间0.01(2)令边际误差1.96取p=n每组至少4579人,总9158人。4.3(20分)对多元线性模型y其中X为n×(1)证明β^=((2)推导β^(3)若X存在精确共线性,秩<p答案:(1)Gauss-Markov定理:线性无偏估计中方差最小。(2)Cov(3)采用岭回归=几何意义:在参数空间引入球形约束,将估计投影到收缩椭球,避免奇异矩阵。4.4(20分)设随机效应模型=i=(1)给出方差分量,的ANOVA估计;(2)推导检验:=(3)若a=6,n=答案:(1)=(2)F(3)=F=120/304.5(15分)对数据集{(,)(其中()=K(1)给出的显式解并解释其含义;(2)讨论带宽h对偏差-方差权衡的影响;(3)若K为Epanechnikov核,写出其表达式并说明其效率优势。答案:(1)用矩阵记法=其中X第一列为1,第二列为(−),W=diag()。(2)h增大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能电表远程抄表系统调试技师(中级)考试试卷及答案
- 智能驾驶车辆控制与执行体系建设方案
- 区域设备管理标准统一
- 区域医疗协同下患者体验服务资源优化
- 区块链技术在医疗质量控制数据管理中的应用
- 区块链赋能内镜医疗数据:安全共享与高效利用
- 国情省情活动策划方案(3篇)
- 啤酒品牌活动方案策划(3篇)
- 慈善红酒活动策划方案(3篇)
- 新型肺炎的安全管理制度(3篇)
- 2026年南京交通职业技术学院单招职业倾向性考试题库带答案详解(完整版)
- (2023版)产后出血预防及处理指南解读课件
- 2026新余市12345政务服务便民热线招聘5人备考题库及答案详解(新)
- 2026年1月浙江首考英语真题(解析版)
- 供应链管理就业趋势分析
- 低空航路运行安全能力评估规范
- 辽宁省沈阳市2025-2026学年高一上学期期末语文试题(含答案)
- 糖尿病患者合理饮食指导手册
- 2025版急性成人无骨折脱位型颈脊髓损伤诊疗指南
- 子痫抢救课件
- 2025年高考化学试卷真题完全解读(北京卷)
评论
0/150
提交评论