2026年数据分析师概率论与数理统计复习资料含答案_第1页
2026年数据分析师概率论与数理统计复习资料含答案_第2页
2026年数据分析师概率论与数理统计复习资料含答案_第3页
2026年数据分析师概率论与数理统计复习资料含答案_第4页
2026年数据分析师概率论与数理统计复习资料含答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年数据分析师概率论与数理统计复习资料含答案一、选择题(每题2分,共10题)1.在一个城市交通流量调查中,记录某十字路口每分钟通过的汽车数量。该数据最符合哪种分布?A.正态分布B.泊松分布C.二项分布D.均匀分布2.设随机变量X的期望为E(X)=3,方差为Var(X)=1,则随机变量Y=2X-5的期望和方差分别为:A.E(Y)=1,Var(Y)=2B.E(Y)=1,Var(Y)=1C.E(Y)=11,Var(Y)=1D.E(Y)=11,Var(Y)=23.从一副52张的标准扑克牌中随机抽取3张,至少有一张是红桃的概率为:A.1/4B.3/4C.1/2D.7/134.设总体X服从正态分布N(μ,σ²),样本容量为n,样本均值为x̄,样本方差为s²,则以下说法正确的是:A.x̄一定服从N(μ,σ²/n)B.s²一定服从χ²分布C.x̄一定服从N(μ,σ²)D.s²一定服从F分布5.在假设检验中,第一类错误是指:A.真实情况为H₁成立,但拒绝H₀B.真实情况为H₀成立,但拒绝H₀C.真实情况为H₀成立,但接受H₀D.真实情况为H₁成立,但接受H₀二、填空题(每空2分,共10空)6.若随机变量X和Y相互独立,且X~N(1,4),Y~N(2,9),则Z=2X-3Y的期望E(Z)为________,方差Var(Z)为________。7.设总体X的密度函数为f(x)=λe^{-λx}(x≥0),则X的期望E(X)为________,方差Var(X)为________。8.在大样本情况下,样本均值x̄的抽样分布近似服从________分布,其均值为________,方差为________。9.设总体X的分布未知,但样本容量n足够大(n≥30),根据中心极限定理,样本均值x̄的抽样分布近似服从________分布,其均值为________,方差为________。10.在假设检验中,若显著性水平α=0.05,则拒绝域的面积为________。三、计算题(每题10分,共3题)11.某电商平台的订单金额服从对数正态分布,已知对数订单金额的均值为1,标准差为0.5。求订单金额超过1000元的概率。12.从某城市随机抽取100名居民,调查其年收入情况。样本均值为5万元,样本标准差为1万元。假设年收入服从正态分布,检验该城市居民的平均年收入是否显著高于4万元(α=0.05)。13.某工厂生产两种型号的电子元件,分别为A型和B型。随机抽取100件A型元件,发现其中有10件不合格;随机抽取100件B型元件,发现其中有15件不合格。检验两种型号元件的不合格率是否存在显著差异(α=0.05)。四、简答题(每题15分,共2题)14.解释中心极限定理的适用条件和意义,并说明其在数据分析中的实际应用。15.比较假设检验中双侧检验和单侧检验的区别,并举例说明在商业数据分析中如何选择合适的检验类型。答案与解析一、选择题1.B解析:十字路口每分钟通过的汽车数量属于计数数据,且发生次数稀疏,符合泊松分布特征。2.C解析:E(Y)=2E(X)-5=2×3-5=1,Var(Y)=4Var(X)=4×1=4。3.D解析:至少有一张红桃的对立事件是三张都不是红桃,概率为(39/52)×(38/51)×(37/50)=0.588,则所求概率为1-0.588=0.412(约7/13)。4.A解析:样本均值x̄是总体均值μ的无偏估计,且x̄~N(μ,σ²/n)。5.B解析:第一类错误是指原假设H₀为真时,错误地拒绝H₀。二、填空题6.E(Z)=2×1-3×2=-4,Var(Z)=4×4+9×9-2×2×6×3=49。7.E(X)=1/λ,Var(X)=1/λ²。8.正态分布,μ,σ²/n。9.正态分布,μ,σ²/n。10.0.05。三、计算题11.解:设对数订单金额为X,X~N(1,0.5²),则订单金额Y=e^X~对数正态分布。P(Y>1000)=P(X>ln1000)=P(X>6.9065)=1-P(X≤6.9065)=1-Φ(6.9065/0.5)=1-Φ(13.813)=0(近似为0)。12.解:H₀:μ≤4,H₁:μ>4。检验统计量:z=(x̄-4)/(σ/√n)=(5-4)/(1/√100)=10。拒绝域:z>1.645(α=0.05)。10>1.645,拒绝H₀,结论:平均年收入显著高于4万元。13.解:设p₁为A型不合格率,p₂为B型不合格率。检验统计量:z=(p₁-p₂)/√(p(1-p)(1/n₁+1/n₂)),p=(10+15)/(100+100)=0.125,z=(0.1-0.15)/√(0.125×0.875×(1/100+1/100))=-1.26。拒绝域:z<-1.96或z>1.96。-1.26不在拒绝域,结论:无显著差异。四、简答题14.解:中心极限定理适用条件:样本量足够大(n≥30)或总体分布近似对称。意义:样本均值x̄的抽样分布近似为正态分布,无论总体分布如何。应用:在商业数据分析中,可使用x̄推断总体均值,如用户平均消费等。15.解:双侧检验用于检验参数是否与假设值有显著差异(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论