2026统计学客户细分与市场定位试题和答案_第1页
2026统计学客户细分与市场定位试题和答案_第2页
2026统计学客户细分与市场定位试题和答案_第3页
2026统计学客户细分与市场定位试题和答案_第4页
2026统计学客户细分与市场定位试题和答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026统计学客户细分与市场定位试题和答案一、单项选择题(每题2分,共20分)1.某电商平台将最近90天内有购买且客单价高于平台均值1.5倍、近30天浏览天数≥7、未发生退货的用户标记为“高价值活跃会员”。该细分策略同时使用了行为、价值与______维度。A.心理B.人口C.场景D.忠诚答案:D解析:未退货可视为对平台服务满意,体现忠诚维度。2.在K-means聚类前对数值变量做Min-Max缩放的主要目的是______。A.消除量纲差异B.提高计算速度C.降低噪声D.增加可解释性答案:A解析:不同指标单位不同,缩放后可避免“大数吃小数”。3.使用RFM模型时,若某客户R=1、F=5、M=5,则应优先采取的营销动作是______。A.发放节日优惠券B.推新品试用C.唤醒触达D.升级会员等级答案:C解析:R=1表示最近一次购买距今很久,需先唤醒。4.在聚类评估指标中,______对簇形状无假设且能捕捉非球形分布。A.Calinski-Harabasz指数B.Davies-Bouldin指数C.Silhouette系数D.Dunn指数答案:D解析:Dunn指数基于簇间最小距离与簇内最大距离之比,对形状不敏感。5.某SaaS公司用XGBoost预测客户续约概率,SHAP值显示“30天内工单提交次数”对预测正向贡献最大,市场部门据此拟定“高接触服务包”定价策略,这属于______。A.描述性分析B.预测性分析C.指导性分析D.诊断性分析答案:C解析:SHAP给出因果解释,指导定价,属指导性分析。6.在STP流程中,segmentation与targeting最关键的统计学差异是______。A.是否使用假设检验B.是否进行显著性分割C.是否评估segment可盈利性D.是否使用聚类算法答案:C解析:targeting必须评估规模、利润与可达性,segmentation仅识别差异。7.某连锁便利店将门店按“周客流CV系数”分为高稳定、中稳定、低稳定三类,再对每类门店做ASSORTMENT优化,这种细分属于______。A.事前细分B.事后细分C.混合细分D.纵向细分答案:B解析:先用数据聚类,再差异化策略,为事后细分。8.使用GaussianMixtureModel时,若BIC值随成分数增加而持续下降,但AIC在某k值后反弹,可初步判断______。A.模型过拟合B.模型欠拟合C.应选k使BIC最小D.应选k使AIC最小答案:D解析:AIC惩罚力度弱于BIC,反弹点提示最优k。9.在客户生命周期价值(CLV)建模中,若采用BG/NBD+Gamma-Gamma,则“交易频率”与“货币价值”的统计关系假设为______。A.完全独立B.线性相关C.正交D.弱相关可忽略答案:A解析:BG/NBD与Gamma-Gamma独立建模,需验证独立性。10.某品牌使用潜类回归(LatentClassRegression)研究价格敏感度,发现3个潜类,其中潜类1价格弹性-0.2,潜类2-2.5,潜类3-8.1,则针对潜类3应______。A.维持溢价B.降价促销C.提高门槛D.捆绑销售答案:B解析:弹性绝对值高,对价格敏感,降价可拉升销量。二、多项选择题(每题3分,共15分)11.以下哪些指标可直接用于判断聚类结果的业务可解释性?A.簇内平均客单价B.簇间回购率差异C.Silhouette宽度D.簇中心向量余弦相似度E.簇样本量占比答案:A、B、E解析:C、D属统计指标,A、B、E直接关联业务含义。12.在运用层次聚类(Ward法)时,下列做法可能提高簇间差异的是______。A.引入类别变量并用Gower距离B.对高偏态变量做Box-Cox变换C.使用Canberra距离D.在叶子节点使用K-means微调E.将变量先做PCA降维答案:B、C、D解析:A会削弱数值差异;E可能丢失可解释性;B、C、D可增强分离度。13.某视频平台用生存分析预测用户churn,以下哪些变量应作为时间依赖协变量处理?A.连续包月标识B.最近30天观看时长C.注册渠道D.是否开启青少年模式E.每百小时广告曝光次数答案:B、E解析:B、E随时间变化,需用时间依赖格式;A、C、D为基线特征。14.关于t-SNE与UMAP在客户细分可视化中的对比,正确的是______。A.t-SNE计算复杂度高于UMAPB.UMAP保留更多全局结构C.t-SNE对超参数perplexity更敏感D.两者都适用于高维稀疏矩阵E.UMAP可直接用于聚类输入答案:A、B、C解析:D错误,稀疏矩阵需先降维;E错误,UMAP非聚类算法。15.某零售商用LSTM做NextBasketPrediction,为增强可解释性,可采取______。A.引入Attention机制B.使用SHAPDeepExplainerC.对隐藏状态做k-means再映射回商品D.将输出嵌入降维到2D散点E.采用one-hot编码输入答案:A、B、C、D解析:E反而降低可解释性;A、B、C、D均可提供解释路径。三、判断题(每题2分,共10分)16.在RFM模型中,若使用quintile法划分,则必然产生5×5×5=125个细分群体。答案:错误解析:可合并极端组,实际群体数≤125。17.对高维稀疏的电商浏览数据,先用PCA降维再聚类,会提升簇的可解释性。答案:错误解析:PCA主成分难以标注业务含义,可能降低解释性。18.在GaussianMixtureModel中,若某成分协方差矩阵为对角且相等,则模型退化为软聚类版的k-means。答案:正确解析:各向同性且相等时,后验概率与欧氏距离单调一致。19.使用CHAID决策树做客户细分时,若目标变量为连续型,应先分箱为有序类别。答案:正确解析:CHAID要求因变量为类别型。20.在CLV计算中,若折现率上升,则同一客户的净现值必然下降。答案:正确解析:折现率与现值负相关。四、计算与建模题(共30分)21.(10分)某O2O平台抽取1000名用户,统计最近半年订单额(单位:元)与登录天数。经清洗后得到:|变量|均值|标准差|偏度||------|------|--------|------||订单额|520|310|1.8||登录天数|42|18|0.2|现采用K-means聚类,k=3,变量已做Box-Cox变换且标准化。(1)给出两种确定最优k的统计方法并简述步骤。(2)若最终聚类中心为A组(-0.6,-0.5)、B组(0.4,0.9)、C组(2.1,-0.8),请给出业务命名并各写一条运营策略。(3)计算A组与B组的欧氏距离。答案与解析:(1)方法一:轮廓系数法。步骤:①k从2到10循环;②每次运行K-means;③计算平均Silhouette宽度;④选最大宽度对应的k。方法二:GapStatistic。步骤:①对观测数据与均匀参考分布分别计算Wk;②计算Gap(k)=log(Wk_ref)-log(Wk_obs);③选Gap(k)最大且Gap(k+1)在误差范围内的k。(2)业务命名:A组“低频低额”:登录与消费均低,可推签到送券+首单立减。B组“高频高额”:登录与消费双高,可推会员专属客服+生日礼包。C组“高额低频”:消费高但登录少,可推APPPUSH提醒+限时秒杀。(3)距离=√[(0.4-(-0.6))²+(0.9-(-0.5))²]=√(1²+1.4²)=√2.96≈1.72。22.(10分)某SaaS公司用Cox回归研究客户churn,协变量如下:|协变量|系数|exp(coef)||--------|------|-----------||合同时长(月)|-0.08|0.923||是否年付|-0.45|0.638||模块启用数|-0.12|0.887||实施天数|0.02|1.020||交互:年付×模块数|-0.03|0.970|(1)解释“实施天数”系数的经济含义。(2)计算年付客户比月付客户在60个月生存率上的倍数差,假设baselineS₀(t)=0.7。(3)若模块启用数增加1,年付客户的churnhazard变化百分之几?答案与解析:(1)实施天数每增加1天,hazard增加2%,即上线拖越久越易流失。(2)年付客户线性预测η=-0.45-0.03×模块数,假设平均模块数=5,则η=-0.45-0.15=-0.6,hazardratio=exp(-0.6)=0.549,生存率倍数=S年付/S月付=[S₀(t)^exp(η)]/[S₀(t)^1]=0.7^0.549/0.7≈1.27倍,即年付客户60个月生存率高27%。(3)模块数+1,年付客户η变化=-0.12-0.03=-0.15,hazard变化=exp(-0.15)-1≈-14%,即降低14%。23.(10分)某快消品牌对5000名会员进行潜类回归,因变量为品牌转换意愿(0-10分),自变量为价格折扣、包装设计评分、社交曝光量。拟合得3潜类:|潜类|占比|价格系数|包装系数|社交系数||------|------|----------|----------|----------||1|42%|-0.81*|-0.05|0.12||2|35%|-0.22|-0.65|0.48*||3|23%|-0.03|-0.10|0.71***|(1)写出潜类1的回归方程。(2)若对潜类2推出“包装升级+20%价格折扣”组合,预计转换意愿下降多少分?(3)用R代码示范如何基于后验概率为每个用户打标签(伪码即可)。答案与解析:(1)Switching₁=β₀₁-0.81×discount-0.05×package+0.12×social+ε。(2)Δ=-0.22×0.2-0.65×1≈-0.044-0.65=-0.694分,预计下降0.69分。(3)伪码:```rlibrary(poLCA)fit<poLCA(cbind(price,package,social)~1,data=mydata,nclass=3)max.post<apply(fit$posterior,1,which.max)mydata$segment<max.post```五、综合案例分析(25分)背景:2026年“悦动”智能健身镜公司在中国一二线城市已积累28万注册用户,其中付费订阅会员4.2万。公司面临增长放缓、CAC上升、续费率下滑三重压力。CMO决定以数据驱动重做STP,要求:1.基于行为、价值、人口、心理四维构建细分框架;2.输出3-5个可运营群体,给出规模、ARPU、续费率、价格敏感度、核心痛点;3.为每个群体设计一条年度OKR及对应战术;4.提出验证细分有效性的A/B实验方案;5.给出后续模型迭代路线图。数据字典:用户表(id、性别、年龄、城市等级、收入段、家庭结构、住房面积);行为表(每日镜面使用时长、跟练课程数、语音交互次数、好友互动数、打卡天数、周均心率峰值);交易表(首次购镜渠道、镜款型号、订阅类型、月费、是否年付、续费记录、配件购买额);心理表(大五人格简版得分、健身动机量表、科技接受度、价格敏感度likert);客服表(工单类型、解决时长、NPS、投诉内容关键词)。解题步骤与答案:(一)数据准备1.时间窗口:取注册后180天窗口,保证所有用户可比。2.特征工程:a.行为:合成“活跃指数”=0.4×日均时长+0.3×跟练课程+0.3×打卡天数;b.价值:计算180天CLV=镜利润+订阅净现值+配件毛利;c.心理:用PCA将大五人格降至2维,命名“外向-神经质”轴;d.价格敏感度:取likert5题均值,做Box-Cox后标准化。3.缺失:心理问卷仅15%填写,用链式方程多重插补,并生成分布不确定性区间。(二)细分建模1.算法:GaussianMixtureModel,k=2~8,BIC+Silhouette双指标,最终k=4。2.变量筛选:基于Boruta算法保留25维特征。3.标签:用贝叶斯后验概率>0.7硬划分,其余标记“模糊”单独运营。(三)群体画像|群体|规模|占比|ARPU|续费率|价格敏感度|痛点|关键词||------|------|------|------|--------|------------|------|--------||①精英效能型|3.1万|11%|3200元|82%|低|时间碎片、课程进阶|心率、HIIT、效率||②家庭互动型|5.7万|20%|2100元|71%|中|亲子内容少、占地大|孩子、客厅、收纳||③颜值社交型|8.4万|30%|1800元|58%|高|镜面自拍清晰度、社区热度|拍照、打卡、滤镜||④价格敏感型|7.2万|26%|1100元|41%|极高|月费贵、硬件降价快|优惠、二手、拼团||模糊群|3.6万|13%|1500元|49%|中|需求混杂|—|(四)年度OKR与战术①精英效能型O:续费率提升至88%KR1:上线AI定制计划完课率>75%;KR2:推出“教练1v1”付费升级,转化率>15%;战术:与WearOS打通,推送“碎片7分钟”课程;邀请奥运冠军录播大师课。②家庭互动型O:ARPU提升20%KR1:亲子课程覆盖>200节;KR2:家庭会员包年客单价提升15%;战术:开发“亲子体能赛”排行榜;推出可折叠壁挂配件,占地<0.3㎡。③颜值社交型O:月活发帖率提升30%K

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论