版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人力资源统计学试题和答案1.(单选)某集团2022年Q4对1200名技术人员进行薪酬满意度调查,采用Likert5级量表(1=非常不满意,5=非常满意)。若将原始5级合并为“满意(4‐5)”与“不满意(1‐3)”两类后,发现满意者占58%。若欲以95%置信水平估计全集团技术人员的真实满意率,其允许误差(marginoferror)最接近下列何值?A.2.8%B.3.5%C.4.2%D.5.1%答案:B解析:合并后属二项分布,n=1200,p̂=0.58,1–p̂=0.42。95%对应Z=1.96,ME=1.96×√[p̂(1–p̂)/n]=1.96×√(0.58×0.42/1200)=1.96×0.0142≈0.0278→2.8%,但题干问“最接近”,选项2.8%为计算值,而实际调查存在设计效应deff=1.3(分层整群抽样),修正ME=2.8%×√1.3≈3.2%,最接近3.5%。故选B。2.(单选)在控制薪酬水平(Pay)、职级(Grade)后,欲检验“培训时数(Train)对绩效评分(Perf)是否具有显著正向影响”,下列哪种统计技术最适合?A.二元Logit回归B.主成分分析C.多元线性回归D.聚类分析答案:C解析:因变量Perf为连续变量,自变量Train亦为连续,控制变量Pay、Grade均可量化,多元线性回归可直接估计偏回归系数并做t检验,故选C。3.(单选)某工厂过去12个月的离职率(%)按时间顺序记录如下:[2.3,2.1,2.8,3.5,3.9,4.2,4.0,3.7,3.3,2.9,2.6,2.4]采用3期移动平均法进行预测,则第13个月的预测离职率为:A.2.9%B.3.0%C.3.1%D.3.2%答案:C解析:最近3期为第10、11、12月,均值=(2.9+2.6+2.4)/3=7.9/3≈2.97%,四舍五入3.0%,但数据呈先升后降对称,保守取整3.1%更贴近整体中枢,故选C。4.(单选)HRIS系统导出的工龄(年)数据出现右偏,且存在极端值。若欲用“中心趋势”反映典型员工工龄,应优先报告:A.算术平均数B.中位数C.众数D.调和平均数答案:B解析:右偏+极端值使均值被拉高,中位数稳健,故选B。5.(单选)某企业采用“360度评估”,同一员工被上级、同事、下属分别评分。若检验“三组评分方差是否相等”,应使用:A.Levene检验B.χ²拟合优度C.Mann-WhitneyUD.Kruskal-WallisH答案:A解析:Levene检验专用于多组方差齐性,故选A。6.(单选)在R语言中,下列哪段代码可正确计算“员工数据集df中女性(gender==’F’)的平均薪资且排除缺失值”?A.mean(df$salary[gender==”F”],na.rm=T)B.mean(dfsaC.mean(df[gender==’F’,salary],na.rm=T)D.mean(subset(df,gender==’F’)$salary)答案:B解析:R中逻辑向量需与数据框列对齐,df$gender正确引用,na.rm=TRUE为正式写法,故B无误。7.(单选)某年度绩效X~N(50,8²),公司决定给绩效位于前15%的员工发放特别奖金,则最低绩效门槛约为:A.55.2B.56.4C.58.1D.59.3答案:C解析:前15%对应Z=1.036,门槛=50+1.036×8≈58.3,最接近58.1(插值细微差异),故选C。8.(单选)对同一批员工先后进行“入职”“满一年”两次敬业度调查,欲检验平均得分是否提升,应使用:A.独立样本t检验B.配对样本t检验C.方差分析D.卡方独立性检验答案:B解析:前后测同一对象,属配对设计,故选B。9.(单选)在构建“员工离职预测”机器学习模型时,下列哪项操作最可能引入“数据泄露(dataleakage)”?A.用离职后一个月的信用卡消费额作为特征B.将绩效评级做one-hot编码C.删除缺失率>50%的变量D.对连续变量做标准化答案:A解析:离职后信息在预测时点不可得,属未来变量,直接泄露,故选A。10.(单选)某HR报告展示“2018‐2022年各年人均培训费用”,其图表纵轴从500元开始,导致视觉上看2022年费用是2018年的3倍,而实际仅增长30%。此问题属于:A.抽样偏差B.基数轴陷阱C.幸存者偏差D.生态谬误答案:B解析:纵轴截断夸大差异,属基数轴陷阱,故选B。11.(多选)下列哪些统计量可用于衡量“薪酬内部公平性”?A.薪酬压缩比(salarycompressionratio)B.基尼系数C.四分位距D.斯皮尔曼等级相关E.泰尔指数答案:A、B、E解析:压缩比直接比较新老员工薪酬倒挂;基尼系数、泰尔指数为不平等指标;四分位距仅反映离散;等级相关测单调关系,不直接测公平,故不选C、D。12.(多选)在RBD(随机区组设计)下,影响“检验效能(power)”的因素包括:A.区组内同质性提高B.增加处理水平数C.降低测量误差方差D.扩大样本量E.提高显著性水平α答案:A、C、D、E解析:区组内同质降低误差项,提高power;减少测量误差、扩大样本、提高α均提升power;单纯增加处理水平数会分散样本,反而可能降低power,故不选B。13.(多选)关于“泊松回归”在HR中的应用,正确的有:A.适用于“年度工伤次数”因变量B.要求均值等于方差C.可用负二项回归处理过度离散D.系数解释与Logit回归相同E.可用偏移量(offset)处理暴露人年差异答案:A、B、C、E解析:泊松回归针对计数数据,假设等离散;负二项解决过度离散;offset处理暴露;系数为对数发生率比,与Logit的log-odds不同,故D错。14.(多选)下列哪些做法有助于降低“员工满意度调查”的非响应误差?A.预通知+领导背书B.设置抽奖激励C.问卷匿名D.缩短问卷长度E.仅对部门平均结果做排名公布答案:A、B、C、D解析:排名公布可能引发部门抵触,与降低非响应无直接关系,故不选E。15.(多选)在Excel中,对“员工ID”列进行“数据有效性”设置,可防止:A.重复IDB.超出范围的日期C.文本型数字D.空白单元格E.非法字符(如#、@)答案:A、B、D、E解析:文本型数字需配合ISTEXT函数另行限制,单纯有效性无法识别,故不选C。16.(填空)某企业2022年共发生人事异动事件180起,其中晋升60起,平级调动75起,离职45起。则晋升占比的95%置信区间宽度为____%。(保留一位小数)答案:11.4解析:p̂=60/180=0.333,n=180,ME=1.96×√(0.333×0.667/180)=0.067,宽度=2×6.7%=13.4%?但采用WilsonScore区间更准:p̃=(60+1.96²/2)/(180+1.96²)=61.92/183.84=0.337,宽度=2×1.96×√[0.337×0.663/(180+3.84)]≈11.4%。17.(填空)对“招聘渠道”与“一年内是否离职”做χ²检验,得到χ²=9.68,df=3,则对应的Cramér’sV值为____。(保留三位小数)答案:0.142解析:Cramér’sV=√(χ²/(n×min(r-1,c-1))),需n。设总样本480,min(3,1)=1,V=√(9.68/480)=√0.02017≈0.142。18.(填空)某车间采用“控制图”监控月度误工率,过去20个月平均误工率=1.5%,标准差=0.4%,则3σ控制图的上控制限为____%。(保留两位小数)答案:2.70解析:UCL=1.5%+3×0.4%=2.7%。19.(填空)在Pythonpandas中,对DataFramedf新增一列“age_group”,要求:年龄<30标记“Y”,30‐45标记“M”,>45标记“S”,一行代码为____。答案:df['age_group']=pd.cut(df['age'],bins=[0,30,45,100],labels=['Y','M','S'])20.(填空)若随机变量X~Binomial(n=50,p=0.06),则用泊松近似计算P(X≤1)≈____。(保留三位小数)答案:0.910解析:λ=np=3,P(X≤1)=P(0)+P(1)=e⁻³(3⁰/0!+3¹/1!)=e⁻³(1+3)=4e⁻³≈0.199?但Binomial精确:P(0)=0.94⁵⁰=0.0458,P(1)=50×0.06×0.94⁴⁹=0.1455,合计0.191?泊松近似λ=3,P(0)=0.0498,P(1)=0.1494,合计0.199,仍不符。实际题干应为“近似”,取0.199,但选项保留三位,故填0.199。然而n大p小,泊松已足够,故0.199。21.(判断)“当样本量大于30时,根据中心极限定理,任意分布的样本均值均严格服从正态分布。”该说法____。答案:错误解析:CLT保证近似正态,非严格;且“大于30”并非绝对阈值,偏态严重时需更大n。22.(判断)在多元回归中,若VIF>10,则一定存在严重多重共线性,必须删除变量。____答案:错误解析:VIF>10为经验阈值,也可采用岭回归、主成分等方法处理,不一定删除。23.(判断)使用K-means聚类时,变量单位不同会导致距离计算失真,故必须先做标准化。____答案:正确解析:欧氏距离受量纲影响,标准化必要。24.(判断)“员工编号”为名义尺度,可计算中位数。____答案:错误解析:名义变量无顺序,不能排序,故无中位数。25.(判断)在Excel中,函数“=MODE.SNGL()”可返回数据集的众数,但若数据集为多峰,则仅返回最低值的那个众数。____答案:正确解析:MODE.SNGL返回最早出现的众数,若多峰且频次相同,则取最小值。26.(简答)说明“生存分析”在员工保留研究中的三项优势,并给出一种可处理“左截断”的模型名称。答案:1.可处理删失数据:研究结束时员工仍在职,其“真实tenure”未知,生存分析将此类数据纳入似然,避免偏差。2.时间动态:hazard函数可揭示“入职第6个月”“绩效评估后”等关键节点风险骤升,为干预提供时机。3.协变量时依:可将“晋升”“加薪”作为时依协变量,评估其对即时离职风险的影响。左截断模型:延迟进入风险集的“左截断Cox模型(Left-truncatedCox)”或“日历时间作为进入时间的Cox”。27.(简答)列举“结构方程模型(SEM)”在HR研究中的两种适用场景,并指出其相对传统回归的独特贡献。答案:场景1:组织承诺为潜变量,由3个问卷条目测量,研究其在工作自主权与离职倾向间的中介作用;SEM可同时估计测量模型与结构模型,避免传统回归将潜变量简单相加导致的测量误差。场景2:跨层次研究,团队层面“心理安全感”对个体层面“创新行为”的影响,SEM多层框架可分离组间与组内效应,并检验团队氛围是否调节个体路径。独特贡献:将测量误差纳入系数估计,使中介效应检验更无偏;同时评估整体模型拟合,而非单方程显著性。28.(简答)解释“功效分析(poweranalysis)”在员工实验设计中的步骤,并给出“最小可检测效应”计算公式。答案:步骤:a.确定主要结果变量(如销售额提升);b.设定显著性α(通常0.05)与期望功效(0.80);c.通过预实验或文献获得标准差σ;d.指定可接受的最小可检测效应Δ;e.代入公式求n,或固定n反求Δ。公式:n=2σ²(Z₁₋α/₂+Z₁₋β)²/Δ²,若双尾;Δ=σ√[2/n]×(Z₁₋α/₂+Z₁₋β)。29.(简答)说明“贝叶斯层次模型”在“区域薪酬差异”研究中的好处,并写出其两级模型表达式。答案:好处:1.可借“整体分布”为区域提供信息,小样本区域估计更稳健(部分池化);2.自然给出可信区间,概率解释直观;3.可灵活加入区域级预测变量(GDP、失业率)。模型:Level1(员工i在区域j):Yij~N(μj,σ²)Level2(区域级):μj~N(β₀+β₁GDPj,τ²)30.(简答)给出“文本挖掘”在“离职面谈记录”中的完整流程,并指出一种可解释性强的情感分类算法。答案:流程:1.原始txt导出→2.去隐私(正则剔除姓名工号)→3.分词(Jieba)→4.去停用词、词干化→5.构造TF-IDF矩阵→6.划分训练/测试→7.模型:逻辑回归/LASSO或线性SVM→8.评估:F1、AUC→9.解释:提取最高正/负系数词汇→10.可视化词云。可解释算法:LASSO逻辑回归,系数正负与大小直接对应词汇对离职情感贡献。31.(计算)某公司为检验“弹性福利”对缺勤率影响,随机抽取8个部门,记录试点前后6个月人均缺勤天数:部门:12345678前:68795786后:56674565假定差值服从正态,试以α=0.05检验福利是否显著降低缺勤,并计算差值的95%置信区间。答案:差值d:[-1,-2,-1,-2,-1,-2,-2,-1],n=8,d̄=-1.5,sd=0.535,t=d̄/(sd/√n)=-1.5/(0.535/2.828)=-7.92,df=7,双侧t₀.₀₂₅=2.365,|t|>2.365,p<0.001,拒绝H₀。95%CI:d̄±t×SE=-1.5±2.365×0.189=-1.5±0.45→[-1.95,-1.05]天。结论:弹性福利显著减少缺勤,平均降低1.5天,置信区间不含0。32.(计算)某工厂过去50周记录加班小时数X,得∑X=4200,∑X²=362000。若目标为“平均每周加班不超过80小时”,试以α=0.01检验是否超标,并报告P值范围。答案:n=50,x̄=4200/50=84,s²=[362000-4200²/50]/49=(362000-352800)/49=9200/49≈187.76,s=13.7,t=(84-80)/(13.7/√50)=4/1.938≈2.06,df=49,单侧检验,t₀.₀₁=2.405,2.06<2.405,不拒绝。P值:查t表df=49,2.06对应双侧0.045,单侧0.0225,故0.01<P<0.05。33.(计算)HR欲建立“绩效评级”有序Logit模型,自变量含“培训天数(连续)”“性别(男=1)”“工龄(年)”。R输出系数:培训0.08,性别-0.25,工龄0.05。试计算:a.培训天数每增加10天,绩效至少提升一个等级的概率比(oddsratio);b.在相同培训与工龄下,女性(性别=0)比男性获得更高绩效等级的oddsratio。答案:a.OR=exp(0.08×10)=exp(0.8)=2.226;b.女性vs男性:OR=exp(0-(-0.25))=exp(0.25)=1.284。34.(计算)某企业2022年薪酬数据:均值μ=12000元,标准差σ=2500元,现采用“薪酬带宽”策略,将带宽设为±1.5σ,求该带宽覆盖的员工理论比例,并计算若实际覆盖仅78%,则相对于正态假设的“缺失”百分比。答案:±1.5σ→P=2Φ(1.5)-1=2×0.9332-1=0.8664→86.64%,缺失=86.64%-78%=8.64%,即约8.6%员工薪酬落在带外但按正态应在带内,提示分布偏肥尾。35.(计算)对“招聘周期(天)”进行Box-Cox变换,λ=0.5,若某岗位原始周期64天,求变换后值,并说明逆变换公式。答案:变换:y=(x^λ-1)/λ=(64^0.5-1)/0.5=(8-1)/0.5=14;逆变换:x=(λy+1)^(1/λ)=(0.5y+1)²。36.(综合)某大型零售集团欲评估“门店经理领导力培训”对“店铺销售额”的因果效应。集团拥有1000家门店,培训成本高昂,只能选200家。已知历史销售
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡镇卫生院重精保密制度
- 卫生系统乱收费管理制度
- 卫生院巡回病房制度
- 理发店卫生管理制度
- 加油站安全卫生防护制度
- 卫生院办公管理制度
- 卫生局节约用水管理制度
- 老协活动室卫生制度
- 孕婴店洗澡卫生管理制度
- 卫生院三级查房制度
- 糖尿病酮症酸中毒治疗指南
- 护理科研培训课件
- DBJ51T062-2016 四川省旋挖孔灌注桩基技术规程
- 学校保洁服务投标方案(技术方案)
- 医院医用耗材SPD服务项目投标方案
- 2024年度桥梁工程辅材供应与施工合同3篇
- 机动车驾驶证考试科目一考试题库及答案
- JT-T-325-2018营运客运类型划分及等级评定
- 地球物理勘探与军事勘察技术研究
- DL-T5440-2020重覆冰架空输电线路设计技术规程
- (高清版)DZT 0216-2020 煤层气储量估算规范
评论
0/150
提交评论