Python商务数据分析与应用试卷及答案 卷 2_第1页
Python商务数据分析与应用试卷及答案 卷 2_第2页
Python商务数据分析与应用试卷及答案 卷 2_第3页
Python商务数据分析与应用试卷及答案 卷 2_第4页
Python商务数据分析与应用试卷及答案 卷 2_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python商务数据分析与应用试卷二考试形式:闭卷考试时间:90分钟题号一二三四五总分分数一、单项选择用于将分类变量转换为数值哑变量的pandas方法是()

A.get_dummies()B.cut()C.qcut()D.factorize()衡量直播实时成交效率的核心指标是()A.UVB.客单价C.成交转化率D.跳失率下列代码中,能正确把字符串日期转为datetime的是()

A.pd.to_numeric()B.pd.to_datetime()C.pd.to_timedelta()D.pd.to_string()在RF模型中,若R得分高、F得分低,用户属于()

A.新客B.忠诚客C.流失预警D.高价值客下列可视化图形最适合呈现“占比”的是()

A.雷达图B.饼图C.箱线图D.热力图NumPy中实现元素级相乘的运算符是()

A.*B.@C.dot()D.multiply()社交平台上“种草”行为对应用户决策路径的()

A.需求确认B.信息搜索C.方案评估D.购买后分享对异常值最不敏感的集中趋势度量是()

A.均值B.中位数C.众数D.标准差下列关于Python集合的描述正确的是()

A.有序B.元素可重复C.支持差集运算D.可用索引访问在Sklearn中逻辑回归默认的求解器是()

A.liblinearB.sagaC.lbfgsD.newton-cg二、多项选择能够直接统计DataFrame每列缺失值的函数有()

A.isnull()B.isna()C.dropna()D.sum()E.info()下列属于“内容型”短视频商业合作模式的有()

A.达人种草B.信息流广告C.直播带货D.品牌挑战赛E.二次创作分发关于thon函数参数,说法正确的有()

A.支持默认值B.支持可变长参数C.支持关键字参数D.参数顺序必须固定E.可用类型注解电商平台大促期间常用的“价格型”指标有()

A.折扣率B.件单价C.优惠券面额D.毛利率E.ROI下列代码能正确实现DataFrame按列归一化的有()

A.(df-df.min())/(df.max()-df.min())

B.df.apply(lambdax:(x-x.mean())/x.std())

C.df//df.max()

D.sklearn.preprocessing.MinMaxScaler().fit_transform(df)

E.df.scale()三、判断题plt.legend()必须在plt.plot()之前调用才能显示图例。()用户最近一次下单距今天数越少,RFM中R得分越高。()在Python中,列表推导式比for循环速度更慢。()短视频完播率越高,平台推荐权重通常越大。()使用seaborn.heatmap()时,相关系数矩阵必须先调用corr()计算。()四、简答题简述使用pandas完成“缺失值占比统计+可视化”的两步核心代码。说明“订单转化率”与“支付转化率”在统计口径上的差异。写出NumPy中创建3×3单位矩阵的代码,并给出两种不同写法。五、论述题结合教材案例,阐述利用Python对短视频评论进行情感分析的完整流程(数据获取→预处理→模型→可视化→业务应用)。结合教材案例,论述如何利用Python构建完的电商用户画像在精准营销中的应用。Python商务数据分析与应用试卷二答案一、单项选择答案:A答案:C答案:B答案:A答案:B答案:D答案:B答案:B答案:C答案:C二、多项选择答案:ABD答案:ADE答案:ABCE答案:ABCD答案:ABD三、判断题(×)(√)(×)(√)(√)四、简答题简述使用pandas完成“缺失值占比统计+可视化”的两步核心代码。

参考答案

missing=df.isnull().sum()/len(df)

missing.plot(kind='bar')说明“订单转化率”与“支付转化率”在统计口径上的差异。

参考答案

订单转化率=下单访客/总访客;支付转化率=完成付款的订单/总订单。前者衡量购买意愿,后者衡量支付成功。写出NumPy中创建3×3单位矩阵的代码,并给出两种不同写法。

参考答案

np.eye(3)或np.identity(3)五、论述题结合教材案例,阐述利用Python对短视频评论进行情感分析的完整流程(数据获取→预处理→模型→可视化→业务应用)。

评分要点数据获取:利用抖音/快手开放平台API或Scrapy爬取目标短视频下方的全部评论,获取字段包括comment_id、user_id、评论正文、点赞数、时间戳,并保存为CSV或直接进入DataFrame。数据预处理:①去重与缺失值清洗。②正则过滤:去除表情符号、特殊字符、URL,只保留中英文和数字。③分词与停用词。④标注样本(可选):随机抽取2000条评论人工标注正向/中性/负向,用于后续模型训练或验证。情感模型:①快速方案:采用SnowNLP内置情感字典,直接输出0-1概率,按阈值划分三分类。②精度提升方案:用标注样本对BERT-base-chinese进行三分类微调,2-3轮即可达到90%左右准确率;将训练好的模型导出,批量预测全部评论。③结果输出:为每条评论赋予情感标签(正/中/负)及置信度,并计算评论级情感得分。可视化:①情感分布饼图:展示正向、中性、负面评论占比。②情感-点赞散点图:观察高赞评论的情感倾向,定位潜在高影响力负面评价。③时间序列情感曲线:按日计算平均情感得分,监测口碑波动。④词云与高频词柱状图:正向词云用于广告素材,负面高频词用于产品改进清单。业务应用:①负面预警:设定“负向+高赞”阈值,自动推送客服系统,30分钟内回复,降低退货与口碑风险。②内容迭代:将正向高频词写入下期短视频标题与脚本,提高用户共鸣与转化率。③广告创意:截取高得分正向评论截图作为广告素材,CTR提升20%以上。④复盘报告:按5W模式输出“谁在对什么内容通过哪个渠道表达了何种效果”,为下一轮短视频选题、投放预算与产品优化提供数据依据。结合教材案例,论述如何利用Python构建电商用户画

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论