2026年网络舆情监测考前押题及答案_第1页
2026年网络舆情监测考前押题及答案_第2页
2026年网络舆情监测考前押题及答案_第3页
2026年网络舆情监测考前押题及答案_第4页
2026年网络舆情监测考前押题及答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年网络舆情监测考前押题及答案一、单项选择题(每题2分,共20分)1.2025年12月,某短视频平台出现“某高校学生集体腹泻”话题,3小时内阅读量破2亿。监测人员第一时间应优先核实的信息维度是A.话题发起账号的粉丝总量B.首发视频是否出现“食堂”“诺如病毒”等敏感词C.平台是否已将话题推至热榜首位D.该高校官方微博24小时内是否更新答案:B解析:突发公共卫生类舆情,核心是先验证信源可信度与关键敏感词,而非热度本身。2.在BERTopic模型中,若将“embedding_model”参数由“all-MiniLM-L6-v2”替换为“paraphrase-multilingual-mpnet-base-v2”,最显著的变化是A.主题一致性(coherence)下降B.支持跨语言主题聚类C.训练耗时减少约30%D.必须同步降低“min_topic_size”答案:B解析:多语言句向量模型可直接对中英混合语料进行主题抽取,无需额外翻译。3.某市政府采用“舆情风险指数(ORI)”每日发布,公式为O其中为负面声量环比,为情绪极值,为媒体elite转发占比。若某日=0.8,=−0.6,=0.4A.45B.55C.65D.75答案:C解析:代入得线性组合0.3×0.8+4.关于“深度伪造”音视频的舆情应对,下列做法最符合《互联网信息服务深度合成管理规定》要求的是A.发现后先下架再保存哈希,48小时内向市级网信备案B.直接封禁上传者账号并公开实名C.仅做限流处理,等待当事人投诉D.用AI对抗模型生成“反向伪造”以正视听答案:A解析:规定要求“先处置、后备案”,并保存证据哈希,避免二次传播。5.在基于Transformer的谣言检测模型中,引入“对抗样本训练”主要解决A.长尾分布B.跨域泛化C.梯度消失D.数据不均衡答案:B解析:对抗扰动模拟不同域的措辞偏移,可提升模型在未知场域的鲁棒性。6.某品牌被质疑“双标”后,官方声明中采用“时间线+第三方检测报告”框架,这种回应策略属于A.道德重塑B.技术正当化C.差异化补偿D.责任转移答案:B解析:用技术数据重构话语权,是典型的技术正当化路径。7.下列指标中,最能反映“沉默螺旋”效应强度的是A.点赞/反对比B.评论的文本长度C.二次转发率D.负面情感占比答案:A解析:当反对声音点赞极少,表明持不同意见者趋于沉默,点赞/反对比陡升。8.对微博数据进行“传播级联”可视化时,若节点大小按“爆发速度”编码,则最适合的度量是A.节点出度B.节点PageRankC.节点到达30%最大转发量所需时间D.节点介数中心性答案:C解析:速度指标直接刻画“爆发”特征,而非静态中心度。9.在舆情报告撰写中,使用“灰犀牛”隐喻主要提示客户A.风险已现,但公众仍漠视B.黑天鹅事件即将发生C.政府应对迟缓D.媒体恶意炒作答案:A解析:灰犀牛指显而易见却被忽视的高概率风险。10.某地市网信办要求平台在“重点舆情”2小时内反馈处置结果,此处“重点”的判定优先依据A.转发层级>5且地域标签本地B.话题含“领导姓名”C.阅读量过百万D.中央网信办点对点通报答案:D解析:通报即属政治类指令,优先级最高。二、多项选择题(每题3分,共15分)11.下列属于“情绪计算”在舆情监测中的典型应用有A.用EmoLex词典实时更新情绪热力图B.通过面部识别测算街头采访路人愤怒值C.采用LDA抽取“愤怒”主题关键词D.利用生理手环数据校准微博文本情绪E.基于VADER对抖音弹幕进行情绪回归答案:A、B、E解析:LDA属于主题模型,非情绪计算;手环数据属生理信号,但国内合规环境极少商用。12.关于“舆情反转”的量化判定,可纳入的指标有A.情感极性由负转正跨越0轴次数B.主流媒体报道标题情感得分差值>0.5C.关键节点账号删除原帖比例>30%D.负向热词在24小时内TF-IDF权重下降50%E.政府介入公告被置顶答案:A、B、D解析:删帖与置顶属操作层面,非反转本质。13.在构建“多模态谣言检测”数据集时,合规做法包括A.对涉及未成年人面部打码B.将图片Exif信息完全抹除C.用机器翻译自动生成英文标注D.对身份证号水印区域裁切E.公开数据集前经伦理委员会审查答案:A、B、D、E解析:机器翻译标注无法保证质量,且可能引入新谣言。14.以下哪些行为可能导致“算法放大效应”A.平台将争议性标题加权进入推荐池B.用户多次点“不感兴趣”仍被推送相似内容C.采用“时间衰减+热度”双因子排序D.对权威媒体标签降权E.引入“随机探索”流量答案:A、B、D解析:C与E是抑制放大的常见手段。15.关于“网络舆情沙盘”推演技术,正确的有A.采用Agent-BasedModel模拟个体转发B.需输入初始情感分布、网络拓扑、干预策略C.可用蒙特卡洛方法估计政策干预效果置信区间D.推演结果可直接替代真实世界决策E.必须接入真实平台API才能运行答案:A、B、C解析:沙盘为辅助决策,不可直接替代真实决策;离线仿真无需API。三、判断题(每题1分,共10分)16.在SnowNLP中,调用sentiments属性返回值为0表示绝对中性。答案:错解析:SnowNLP返回的是[0,1]概率,0仅表示模型认为“积极概率为0”,并非绝对中性。17.“信息疫情(Infodemic)”一词最早由WHO在2020年正式定义。答案:对18.使用TF-IDF进行特征选择时,IDF值越高,说明该词对文本区分度一定越大。答案:错解析:若词在同类文本中高频出现,即使IDF高,也可能对分类无增益。19.在舆情态势图中,若采用“七日滚动平均”,则对突发峰值会有平滑效应。答案:对20.根据《网络暴力信息治理规定(征求意见稿)》,平台对“不友善”评论可先隐藏再审核。答案:对21.采用BERT做序列标注时,加入CRF层一定能提升F1。答案:错解析:若数据量小或标签分布简单,CRF可能过拟合。22.“回声室效应”强度可用模块度(Modularity)指标量化。答案:对23.在Python中,pandas的apply方法比矢量化运算速度更快。答案:错24.对同一话题,抖音与微博的热词提取结果必然高度重合。答案:错解析:平台用户画像、语境差异导致热词差异显著。25.舆情日报中引用“机器人账号”占比,可直接用粉丝<100且发帖>500作为判定标准。答案:错解析:简单阈值误判率高,需结合行为特征与账号注册信息。四、填空题(每空2分,共20分)26.在情感分析中,若采用RoBERTa-wwm-ext模型,其Mask机制为________Mask,相较BERT可更好处理中文________词。答案:全词;实体27.当使用LDA进行主题聚类时,若perplexity值随主题数K增加而持续下降,但主题一致性(________)先升后降,则最佳K应选________处。答案:coherence;峰值28.传播网络中,节点u的k-shell值越高,说明其位于________,在舆情爆发期往往扮演________角色。答案:核心层;放大器29.若需对1亿条微博做去重,可先使用________算法生成64位指纹,再采用________排序后线性扫描,时间复杂度可降至O(n)。答案:SimHash;字典序30.根据《数据安全法》,重要数据出境需通过________评估,若处理个人信息超过________人,还需进行个人信息保护认证。答案:安全;100万五、简答题(每题10分,共20分)31.简述“舆情韧性”概念,并给出两项可量化指标及其计算公式。答案:舆情韧性指社会系统在面对负面舆情冲击时,通过吸收、适应与快速恢复,维持公信力与秩序的能力。指标1:恢复时间指数R其中为情感值回到峰值10%的时间,为回到50%的时间,RTI越小韧性越强。指标2:公信力残差G为事件前一周政府微博情感均值,为事件后一周均值,GR越接近1表明公信力损失越小。32.说明采用“对比学习”提升谣言检测模型泛化能力的原理,并给出损失函数。答案:对比学习通过构造“锚点-正例-负例”三元组,使模型在表示空间将同标签样本拉近、异标签推远,从而缓解跨域漂移。损失采用归一化温度缩放交叉熵(NT-Xent):ℒ其中为锚点表示,为正例,τ为温度系数,sim为余弦相似度。通过最小化损失,模型学到域不变特征,提升在新领域谣言检测的F1。六、案例分析题(15分)33.材料:2026年3月15日10:00,某新能源车企A被自媒体B发布视频,称“其新款轿车行驶中电池包脱落”。视频3小时登顶抖音热榜,微博话题#A车企电池脱落#阅读量1.3亿。10:30,A官方账号否认,称“非脱落,为底部护板”。11:00,央视财经转发并评论“等待权威鉴定”。12:00,国家市场监督管理总局宣布已介入调查。14:00,车主在抖音直播,展示车辆底部锈迹,并称“4S店曾私下提出30万元和解”。16:00,A股价跌停。20:00,A公布第三方机构C的检测报告:电池包完好,脱落物为“玻璃纤维护板”。次日,自媒体B删除原视频,微博话题热度下降50%。请回答:(1)列出本次事件中三个关键节点,并指出各节点对应的“舆情相态”。(6分)(2)若你受A委托进行复盘,请给出“声誉修复”三步策略,并说明每步的量化目标。(9分)答案:(1)节点1:10:00视频发布→爆发相态(情感极值-0.78,传播速度峰值)节点2:12:00总局介入→观望相态(情感极值回升至-0.45,权威信源入场)节点3:20:00报告发布→回落相态(情感极值-0.21,负向热词权重降50%)(2)步骤1:技术透明目标:24小时内发布4K高清拆解视频,B站播放量≥500万,弹幕正面率≥60%。步骤2:用户补偿目标:对3·15当日新增订单无条件赠送8年延保,申请率≥30%,NPS(净推荐值)回升至事件前水平(55)。步骤3:长效沟通目标:建立“电池安全月报”制度,每月15日微博发布,连续6期阅读量均≥100万,评论区负面占比<10%。七、计算题(20分)34.已知某话题在微博平台48小时内的转发级联数据如下:时间(h)累计转发量012742568082001040012600147501685018900209302295024960(1)采用“爆发阈值”法,以转发速度≥200/2h为阈值,判断爆发起始时段。(4分)(2)若使用Bass扩散模型拟合,设外部影响系数p=0.01,内部影响系数q=0.35,总潜在采纳者m=1000,求t=10h时的理论转发量,并计算与真实值的相对误差。(10分)(3)给出一种降低误差的数据预处理思路。(6分)答案:(1)计算2小时滑动速度:4-6h:(80-25)/2=27.56-8h:(200-80)/2=608-10h:(400-200)/2=10010-12h:(600-400)/2=100首次≥200/2h为8-10h,故爆发起始时段8h。(2)Bass模型:F代入t=10:F理论转发量N(≈(3)预处理:对0-2h的“种子期”数据加权平滑,采用对数变换抑制早期噪声,再拟合;或引入时变q(t)函数,使内部影响随话题成熟度递减,可降低中期高估误差。八、论述题(20分)35.结合“算法治理”与“舆论生态”互动视角,论述2026年平台企业如何平衡“流量效率”与“公共责任”,并给出可落地的技术—制度复合方案,要求至少包含一条可验证的量化指标。答案:平台需在推荐算法前端嵌入“公共责任约束模块”,形成“效率—责任”双目标优化。技术层面,采用多目标强化学习框架,奖励函数设计为R其中HH九、操作题(20分)36.给定一份CSV文件“weibo.csv”,字段:mid,text,created_at,reposts,attitudes。请用Python完成以下任务,并写出完整代码:(1)清洗文本,去除URL、@用户名、表情,保留汉字与标点。(5分)(2)使用SnowNLP计算每条text的情感得分,新增列senti。(5分)(3)按小时聚合,绘制情感均值折线图,保存为senti_hour.png。(5分)(4)输出情感最低的前5条原始text,并给出mid。(5分)答案:```pythonimportpandasaspdimportreimportmatplotlib.pyplotaspltfromsnownlpimportSnowNLPimportwarningswarnings.filterwarnings('ignore')读取df=pd.read_csv('weibo.csv')1.清洗defclean(text):text=re.sub(r'http\S+','',text)text=re.sub(r'@[\w]+','',text)text=re.sub(r'.?','',text)text=re.sub(r'.text=re.sub(r'[^\u4e00-\u9fa5。!?,;:“”‘’()\w]','',text)returntext.strip()df['text_clean']=df['text'].astype(str).apply(clean)2.情感df['senti']=df['text_clean'].apply(lambdax:SnowNLP(x).sentiments)3.时间聚合df['created_at']=pd.to_datetime(df['created_at'])df['hour']=df

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论