2026年社会调查与统计实务考试试题及答案_第1页
2026年社会调查与统计实务考试试题及答案_第2页
2026年社会调查与统计实务考试试题及答案_第3页
2026年社会调查与统计实务考试试题及答案_第4页
2026年社会调查与统计实务考试试题及答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年社会调查与统计实务考试试题及答案1.(单选)2026年“零工经济”劳动者中,通过算法直接派单获得收入者占比首次突破:A.38%  B.51%  C.62%  D.73%答案:C解析:2026年《中国灵活就业质量报告》显示,算法派单型零工已占全部零工劳动者的62%,较2024年提高14个百分点,主因是即时配送、无人零售补货、AI标注三大场景扩张。2.(单选)在“隐私计算”辅助的政府微观数据开放项目中,2026年最常用的技术路线是:A.联邦学习  B.安全多方计算  C.可信执行环境  D.差分隐私答案:D解析:差分隐私因部署成本低、兼容传统SQL查询,被国家统计局“云微观”平台选为默认方案;联邦学习虽安全但需改造建模流程,落地率不足20%。3.(单选)某市2026年人口变动调查采用“行政记录+网格扫码”双源采集,发现漏报率为1.7%。该漏报率最可能被哪项误差覆盖:A.抽样误差  B.覆盖误差  C.测量误差  D.无回答误差答案:B解析:行政记录已含户籍、医保、水电90%以上人口,仍漏掉外来短住人群,属于覆盖框不完整造成的覆盖误差。4.(单选)为估计“银发族”短视频沉迷时间,研究者使用“时间使用日记+手机SDK日志”混合测量,发现两者相关系数0.42。为提高效度,应优先:A.扩大样本量  B.采用结构方程模型  C.校准时间基准  D.加入焦点组访谈答案:C解析:相关系数低主因是日记法以15分钟为最小颗粒,而SDK以1秒记录;统一基准到1分钟后,相关系数可升至0.81,效度改善最显著。5.(单选)2026年“碳足迹”问卷中,对“单次网购快递碳排放”量表采用0—10分量表。预调查Cronbachα=0.57,若删除“我认为快递包装环保程度”题项,α升至0.78,则:A.该题为系统误差源  B.该题降低同质性  C.该题存在天花板效应  D.该题诱导社会期望答案:B解析:剩余题项均指向运输里程与能源类型,包装环保认知与碳排放感知维度不同,降低内部一致性。6.(单选)某县域2026年GDP初核1320亿元,次年经济普查修订为1280亿元,修订率–3.0%。该差异主要来源最可能是:A.规上企业虚报  B.个体户漏报  C.跨地区重复计算  D.价格缩减指数错配答案:A解析:2026年“数据入表”新政后,规上企业为符合科创板上市标准,普遍高估营收;普查通过税控发票交叉验证,挤掉水分。7.(单选)在“夜间经济”卫星灯光指数建模中,为消除云层干扰,2026年主流方案是:A.NPP-VIIRS月度合成  B.雷达卫星替代  C.机器学习插补  D.地面灯光传感器校准答案:C解析:中科院“星云”计划发布基于Transformer的时空插补模型,利用无云日影像、POI密度、天气数据,插补精度R²达0.93,成本仅为雷达方案的1/8。8.(单选)某高校2026年“大学生情绪健康”追踪调查,使用随机截距交叉滞后模型(RI-CLPM),发现“社交媒体使用→焦虑”的滞后效应β=0.12(p<0.01),但“焦虑→社交媒体使用”β=0.15(p<0.01)。据此:A.存在单向因果  B.存在双向因果  C.仅相关无因果  D.需工具变量再验证答案:B解析:RI-CLPM已控制个体稳定特质,双向系数均显著,提示螺旋上升效应;无需额外IV即可得出双向因果结论。9.(单选)2026年“数字乡村”监测引入“无人机多光谱+smartphonecrowdsourcing”双源数据,对水稻估产的最佳融合层级是:A.像元级  B.特征级  C.决策级  D.传感器级答案:B解析:特征级先提取NDVI、LAI、株高纹理,再与crowdsourcing样本协同训练XGBoost,既保留高分辨率,又抑制众测噪声,RMSE降低18%。10.(单选)为检验“延迟退休”政策announcement对居民储蓄率的影响,2026年某研究采用事件研究法,事件窗设定为announcement前后各30天。若发现储蓄率在announcement前10天已显著上升,最可能:A.信息泄露  B.预期效应  C.季节性因素  D.模型误设答案:A解析:政策文件在内部征求意见阶段已被媒体捕捉,市场提前反应;通过高频浏览器搜索指数可验证信息泄露时点。11.(多选)2026年“生育意愿”电子问卷中,以下哪些措施可将breakoff率从19%降至5%以下:A.进度条可视化  B.把矩阵题拆成单页  C.启用语音输入  D.后置敏感题  E.随机化选项顺序答案:ABCD解析:A降低不确定性;B减少认知负荷;C方便低学历样本;D利用“foot-in-the-door”效应;E对breakoff无显著影响。12.(多选)在“低碳消费”实验中使用“披露他人碳排”信息,可能产生的混淆效应包括:A.描述性规范  B.命令性规范  C.社会比较  D.锚定效应  E.认知失调答案:ACD解析:B命令性需明确“应该怎么做”;E认知失调更多出现在态度-行为不一致场景,与信息披露无直接关联。13.(多选)2026年某市“老旧小区加装电梯”民意调查,采用“分层PPS+入户面访”两阶段抽样,可能引入的偏差有:A.楼层越高回答率越高  B.低学历户拒答  C.访员年龄效应  D.样本替换随意化  E.住户季节性流动答案:ABCDE解析:高层住户更关心电梯,回答意愿强;低学历户担心被骗;年轻访员易被排斥;替换未按“最近生日法”执行;冬季空挂户增多。14.(多选)下列哪些技术可在不暴露原始个体记录前提下,实现2026年“医保欺诈”识别模型跨机构训练:A.同态加密  B.垂直联邦学习  C.安全多方求交  D.可信执行环境  E.区块链存证答案:BCD解析:A同态加密计算开销大,尚未在TB级医保数据落地;E存证不解决隐私计算问题。15.(多选)2026年“青年失业率”发布口径调整,把“一周工作1小时”划为就业,引发争议。下列哪些校正方法可与国际接轨:A.引入“工时中位数”分组  B.发布“严格失业率”(≥10小时)  C.采用“就业不足率”  D.公布“NEET”比例  E.给出置信区间答案:ABCD解析:E置信区间不能解决口径差异,仅表示抽样误差。16.(填空)2026年“数字游民”专题调查采用“雪球+受访者驱动”(RDS),假设每个受访者招募3名同伴,招募成功率0.6,设计效应DE≈________。答案:2.86解析:RDS设计效应公式DE=[1+CV²(network)]×(1/(1–2×(1–1/m)×(1–p)))],其中m=3,p=0.6,CV(network)按2025年同类研究取0.8,代入得2.86。17.(填空)某县2026年人口普查短表“出生人口”漏报率经“生育登记+疫苗接种”双源捕获-再捕获估算,登记人口S1=2100,疫苗记录S2=2300,双登记C=1800,则漏报率________%。答案:15.6解析:N=(S1×S2)/C=2683,漏报人数=2683–2100=583,漏报率=583/2683=15.6%。18.(填空)2026年“AI客服”满意度IVR调查,采用“双框采样”(固话+手机),固话框回答率12%,手机框回答率28%,固话覆盖人口比0.3。若最终样本n=2000,则有效样本设计权数最大值为________。答案:8.33解析:固话权数=1/(0.3×0.12)=27.78,手机权数=1/(0.7×0.28)=5.10,归一化后最大权数=27.78/(27.78+5.10)×2000≈8.33。19.(填空)2026年“直播带货”消费实验采用“2×2×2”被试间设计,因子为“主播颜值”“价格折扣”“互动抽奖”,每个单元需保证power=0.8检测中等效应f=0.25,则最少需被试________人(α=0.05)。答案:252解析:G*Power3.1.9.7方差分析,组数=8,f=0.25,α=0.05,power=0.8,得总样本252。20.(填空)2026年“城市热岛”研究采用Sentinel-3地表温度1km栅格,欲降至100m,需使用________融合算法。答案:STARFM解析:时空自适应反射率融合模型(STARFM)可同时利用Sentinel-210m可见光与Sentinel-3热红外,实现100m热岛制图,MAE<1.2K。21.(简答)说明2026年“数字乡村”项目为何选择“面积框抽样”而非“名录框抽样”估算水稻产量,并给出两点操作细节。答案:1.行政村级名录框仅覆盖土地确权到户的地块,而2026年土地流转率已达62%,实际种植者与权属人分离,导致地块作物类型更新滞后;面积框以0.5m分辨率遥感影像实时分割田块,避免框误差。2.操作细节:①使用无人机多光谱在分蘖期、抽穗期两次成像,通过随机森林分类将水稻田块与其他作物分离,用户精度>92%;②按“耕地占比”比例分层,每层系统抽样布设5个100m²实测样方,脱粒测产校正遥感反演,产量估算误差<3%。22.(简答)阐述“零工经济”调查中采用“手机SDK被动监测”可能带来的三伦理风险,并提出技术缓解方案。答案:风险:①过度监控,劳动者产生“算法牢笼”心理压迫;②数据二次使用,平台将轨迹数据用于派单歧视;③第三方SDK漏洞导致敏感轨迹泄露。缓解:①采用本地差分隐私上传,隐私预算ε≤1,保证个体轨迹不可重识别;②在用户协议中增加“一次一授权”弹窗,禁止将监测数据与派单算法直接挂钩;③SDK通过安全众测平台持续fuzzing,高危漏洞24h内热修复。23.(简答)2026年“大学生情绪健康”追踪调查使用“生态瞬时评估”(EMA),每日随机推送8次问卷,但回答率仅45%。请给出两项提升策略并说明原理。答案:1.动态奖励:利用多臂老虎机算法实时调整奖励金额,对高流失时段提高0.5元红包,使边际收益等于边际成本,回答率可升至68%。2.情境感知触发:调用手机加速度计识别“静止状态”再推送,避免课堂、运动场景,减少情境不适带来的拒答,无效样本比例下降12%。24.(简答)说明2026年“城市更新”民意调查采用“离散选择实验”(DCE)测量“电梯加装”支付意愿时,如何防止“假设偏差”,并给出检验指标。答案:防止:①采用“廉价谈话”(cheaptalk)脚本,在正式选择前用2分钟向受访者解释“过度报价”后果,并展示历史案例真实缴费凭证;②引入“投入成本”机制,要求受访者预付10元保证金,若其报价低于实际筹资额则没收,提高激励相容。检验:①比较DCE结果与真实签约数据,若平均支付意愿(MWTP)差异>30%,判定存在显著假设偏差;②用“确定性量表”询问受访者选择信心,分数≤7者剔除后MWTP上升<5%,说明偏差可控。25.(简答)2026年“医保欺诈”识别模型使用图神经网络(GNN),请解释为何需引入“时序子图采样”以及具体实现步骤。答案:原因:医保结算网络含2.3亿节点,全图训练显存溢出,且欺诈团伙往往呈“短时爆发”特征,需聚焦可疑时序子图。步骤:①以30天滑动窗口构建动态图;②用可疑案件种子节点做随机游走,返回概率设置0.8,采样k=5000节点子图;③在子图上运行TGAT(时序图注意力网络),训练完成后将节点embedding映射回全图,实现亿级图上的分钟级推断,AUC提升4.7%。26.(计算)2026年“低碳出行”实验随机抽取800名通勤者,干预组观看“碳排地图”视频,对照组观看中性视频。一周后干预组平均公交出行次数增加1.8次,对照组增加0.6次,合并标准差3.4。请计算Cohen’sd及95%置信区间,并判断效应大小。答案:d=(1.8–0.6)/3.4=0.353;SE=√[(1/400+1/400)×3.4²]=0.240;95%CI=0.353±1.96×0.240=[–0.117,0.823];因置信区间含0,且d<0.5,属小到中等效应,需扩大样本至n≈1600方可得到显著差异。27.(计算)某县2026年“农村低保”瞄准采用“多维度贫困指数”(MPI),其中教育、健康、生活水平权重3:3:4。已知某户得分:教育deprivation=1,健康=0,生活水平=1,k=30%临界线。请计算该户是否被瞄准,并给出MPI值。答案:加权得分=1×0.3+0×0.3+1×0.4=0.7;因0.7>0.3,属贫困人口,应被瞄准;MPI=0.7×(剥夺维度比例)=0.7×(2/3)=0.467。28.(计算)2026年“直播带货”价格实验采用“阶梯降价”设计,价格序列199→169→149→129元,记录各价格下购买人数:80,120,180,220。请计算需求价格弹性Ed(中点公式)在169→149元区间,并解释经济含义。答案:ΔQ=(180–120)/[(180+120)/2]=0.48;ΔP=(149–169)/[(149+169)/2]=–0.125;Ed=0.48/–0.125=–3.84;|Ed|>1,需求富有弹性,降价13%带来销量提升50%,总收入增加,继续降价有利。29.(计算)2026年“零工劳动者”小时工资对数线性模型:ln(wage)=0.05edu+0.03exp–0.01age+0.12platform,其中platform为虚拟变量(1=算法派单)。若某劳动者edu=15,exp=5,age=30,platform=1,求小时工资相对于platform=0的百分比差异。答案:差异=exp(0.12)–1=12.75%,即算法派单者小时工资高12.75%,控制其他变量后,平台溢价仍显著。30.(计算)2026年“城市热岛”研究建立多元回归:ΔT=2.1+0.35built–0.21green+0.09water,其中built、green、water分别代表建筑、绿地、水域占比(%)。若某区built=60,green=20,water=5,求ΔT预测值,并解释green系数含义。答案:ΔT=2.1+0.35×60–0.21×20+0.09×5=2.1+21–4.2+0.45=19.35℃;green系数–0.21表示绿地占比每增加1个百分点,地表温度下降0.21℃,提示增加绿地是缓解热岛的有效手段。31.(综合)2026年“生育意愿”调查欲建立“政策组合”离散选择实验,属性含“现金补贴”“托位供给”“配偶育儿假”“房价折扣”。请完成:(1)给出正交主效应设计表头(4属性×3水平);(2)说明如何加入“性别×年龄”交互效应;(3)若样本1000人,每人8个选择任务,估计MWTP所需最小样本是否足够?答案:(1)采用L9正交阵列,表头:任务1:补贴1000元,托位20%,假期3个月,房价–1%;任务2:补贴500元,托位50%,假期6个月,房价–3%;任务3:补贴1500元,托位80%,假期1个月,房价–5%;其余任务按正交排列,保证主效应不相关。(2)在混合logit模型中加入“性别×假期”交互项,设定假期系数为β+γ1×Female+γ2×Age30–39+γ3×Female×Age30–39,检验γ3显著性可知女性育龄群体对假期敏感度是否更高。(3)根据Sawtooth建议,主效应模型需样本≥500,交互模型≥1000;本设计1000×8=8000观测,自由度=4×(3–1)=8,经验规则8000/8=1000>500,且采用贝叶斯高效设计,D误差<0.05,样本足够。32.(综合)2026年“数字鸿沟”评估报告采用“手机拥有率”“宽带速率”“数字技能”“AI使用”四维指标,数据来自“社区电子问卷+运营商日志+技能实测”。请:(1)给出缺失值多重插补步骤;(2)说明如何用“验证性因子分析”检验四维结构;(3)若CFA显示CFI=0.89,RMSEA=0.09,应如何修正?答案:(1)步骤:①对缺失机制进行LittleMCAR检验,p=0.12,可认为随机缺失;②用mice包在R中生成20个插补集,预测均值匹配法,纳入性别、年龄、教育作为辅助变量;③合并估计采用Rubin规则,插补后有效样本恢复至98%。(2)构建四维CFA模型,设定四因子斜交,载荷λ≥0.5,因子间相关<0.85;用DWLS估计适配分类变量,指标:CFI>0.95,TLI>0.95,RMSEA<0.06,SRMR<0.08。(3)CFI=0.89、RMSEA=0.09未达标,查看修正指数MI>10,发现“AI使用”题项“我用过生成式AI”同时受“数字技能”因子影响,存在交叉载荷;删除该题后重新拟合,CFI升至0.96,RMSEA降至0.05,满足要求。33.(综合)2026年“城市更新”项目需评估“加装电梯”对住房价格的因果效应,但面临自选择难题。请:(1)设计“边界断点”思路,给出运行变量;(2)说明如何检验操纵效应;(3)若RDD估计显示房价提升8.2%,但带宽敏感,如何增强稳健性?答案:(1)以“单元内支持人数比例”为运行变量,临界值2/3;政策规则:≥2/3同意即强制启动,无需100%,形成清晰断点。(2)绘制运行变量密度直方图与McCrary检验,若log差分<0.1,p>0.2,说明无操纵;同时考察协变量在断点处平衡,t检验均不显著。(3)采用①三角核与矩形核双重估计;②用IK最优带宽与1/2带宽、2倍带宽三重比较;③加入协变量改善精度,若结果区间[6.1%,10.5%]仍一致,报告加权平均8.2%,并声明稳健。34.(综合)2026年“低碳出行”干预实验持续6个月,采用“阶梯钱包+碳积分”双激励。数据含基线、3月、6月三次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论