




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《应用统计学》练习题及答案一、数据描述与统计量计算某高职院校市场营销专业2023级30名学生的《消费者行为学》期末成绩(满分100分)如下(已排序):58,62,65,68,70,72,73,75,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,961.计算该组数据的均值、中位数、众数。2.计算四分位数(Q1、Q3)和四分位距(IQR)。3.计算方差和标准差(样本标准差,分母为n-1)。4.绘制茎叶图,并简要描述数据分布特征。答案:1.均值、中位数、众数计算-均值($\bar{x}$):$\bar{x}=\frac{\sumx_i}{n}=\frac{58+62+\cdots+96}{30}=\frac{2490}{30}=83$(分)。-中位数($M_e$):n=30为偶数,中位数是第15和16个数的平均值,即$\frac{81+82}{2}=81.5$(分)。-众数($M_0$):数据中75出现2次,其余数值均出现1次,因此众数为75(分)。2.四分位数与四分位距-Q1(第25百分位数):位置为$(n+1)\times0.25=31\times0.25=7.75$,即第7个数(73)与第8个数(75)的0.75分位数,$Q1=73+0.75\times(75-73)=74.5$(分)。-Q3(第75百分位数):位置为$(n+1)\times0.75=31\times0.75=23.25$,即第23个数(89)与第24个数(90)的0.25分位数,$Q3=89+0.25\times(90-89)=89.25$(分)。-四分位距(IQR):$Q3-Q1=89.25-74.5=14.75$(分)。3.方差与标准差-样本方差($s^2$):首先计算离均差平方和$\sum(x_i-\bar{x})^2$:$(58-83)^2+(62-83)^2+\cdots+(96-83)^2=625+441+\cdots+169=3420$(计算过程略)。$s^2=\frac{\sum(x_i-\bar{x})^2}{n-1}=\frac{3420}{29}\approx117.93$(分²)。-样本标准差($s$):$s=\sqrt{117.93}\approx10.86$(分)。4.茎叶图绘制与分布特征茎叶图以十位为茎,个位为叶:5|86|2587|0235567898|01234567899|0123456分布特征:数据主要集中在70-95分之间,低分段(<70分)仅有3个数据,高分段(≥90分)有7个数据,整体呈轻微左偏(均值83略高于中位数81.5),数据分布较分散(标准差约10.86分)。二、概率分布应用某电商平台销售的智能手表,历史退货率为5%。现随机抽取10台该手表,假设退货事件独立。1.计算恰好2台退货的概率。2.计算至少1台退货的概率。3.若该平台日销量为500台,近似计算日退货量不超过30台的概率(使用正态近似)。答案:设X为退货数量,X~B(n,p),其中n=10,p=0.05。1.恰好2台退货的概率二项分布概率公式:$P(X=k)=C(n,k)p^k(1-p)^{n-k}$$P(X=2)=C(10,2)\times0.05^2\times0.95^8=45\times0.0025\times0.6634\approx0.0746$(约7.46%)。2.至少1台退货的概率$P(X\geq1)=1-P(X=0)=1-C(10,0)\times0.05^0\times0.95^{10}=1-1\times1\times0.5987\approx0.4013$(约40.13%)。3.日退货量不超过30台的概率(正态近似)当n=500,p=0.05时,X~B(500,0.05),可近似为正态分布$N(np,np(1-p))$,其中:$np=500\times0.05=25$,$np(1-p)=25\times0.95=23.75$,标准差$\sigma=\sqrt{23.75}\approx4.87$。需计算$P(X\leq30)$,使用连续性修正,转化为$P(X\leq30.5)$。标准化:$Z=\frac{30.5-25}{4.87}\approx1.13$。查标准正态分布表,$P(Z\leq1.13)\approx0.8708$,因此日退货量不超过30台的概率约为87.08%。三、参数估计与假设检验某食品厂生产的饼干,包装标注净含量为200g。质检部门随机抽取25袋,测得平均净含量为198g,样本标准差为5g(假设净含量服从正态分布)。1.计算总体均值的95%置信区间。2.检验该批次饼干净含量是否符合标注(α=0.05)。答案:1.95%置信区间计算总体方差未知,使用t分布。样本量n=25,自由度df=24,α=0.05,双侧检验的t临界值$t_{0.025,24}=2.064$。置信区间公式:$\bar{x}\pmt_{\alpha/2}\times\frac{s}{\sqrt{n}}$代入数据:$198\pm2.064\times\frac{5}{\sqrt{25}}=198\pm2.064\times1=(195.936,200.064)$(g)。2.假设检验(双侧检验)-原假设$H_0:\mu=200$(符合标注);备择假设$H_1:\mu\neq200$(不符合标注)。-检验统计量:$t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}=\frac{198-200}{5/\sqrt{25}}=\frac{-2}{1}=-2$。-临界值:$t_{0.025,24}=2.064$(双侧检验,拒绝域为$|t|>2.064$)。-结论:计算得$|t|=2<2.064$,未落入拒绝域,因此不拒绝原假设,认为该批次饼干净含量符合标注(α=0.05)。四、方差分析某超市为测试三种促销策略(A、B、C)对饮料销量的影响,在6家门店分别采用不同策略,连续一周的日销量(箱)数据如下:|策略A|策略B|策略C||-------|-------|-------||12|15|18||14|17|20||13|16|19||11|14|17|(注:每家策略对应4个样本)1.建立单因素方差分析表(计算组间平方和、组内平方和、总平方和、F统计量)。2.检验三种促销策略对销量是否有显著影响(α=0.05)。答案:设因素为促销策略,k=3组,每组n=4,总样本数N=12。1.方差分析表计算-各组均值:$\bar{x}_A=\frac{12+14+13+11}{4}=12.5$,$\bar{x}_B=15.5$,$\bar{x}_C=18$。-总均值:$\bar{x}=\frac{12.5\times4+15.5\times4+18\times4}{12}=\frac{50+62+72}{12}=\frac{184}{12}\approx15.33$。-总平方和(SST):$\sum_{i=1}^N(x_i-\bar{x})^2$计算各数据与总均值的离差平方和:(12-15.33)²+(14-15.33)²+…+(17-15.33)²=11.09+1.77+…+2.79≈68.67。-组间平方和(SSB):$\sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2$=4×(12.5-15.33)²+4×(15.5-15.33)²+4×(18-15.33)²=4×8.01+4×0.03+4×7.13≈32.04+0.12+28.52=60.68。-组内平方和(SSE):SST-SSB=68.67-60.68=7.99。-自由度:组间df1=k-1=2,组内df2=N-k=9,总df=N-1=11。-均方(MS):MSB=SSB/df1=60.68/2=30.34,MSE=SSE/df2=7.99/9≈0.89。-F统计量:F=MSB/MSE=30.34/0.89≈34.1。方差分析表:|来源|平方和(SS)|自由度(df)|均方(MS)|F统计量||------------|--------------|--------------|------------|---------||组间差异|60.68|2|30.34|34.1||组内差异|7.99|9|0.89|—||总差异|68.67|11|—|—|2.显著性检验α=0.05,查F分布表,临界值$F_{0.05}(2,9)=4.26$。计算得F=34.1>4.26,落入拒绝域,因此拒绝原假设,认为三种促销策略对销量有显著影响(α=0.05)。五、简单线性回归分析某企业2020-2023年的广告投入(x,万元)与销售额(y,百万元)数据如下:|年份|广告投入x|销售额y||------|-----------|---------||2020|10|50||2021|15|65||2022|20|80||2023|25|95|1.建立销售额y关于广告投入x的线性回归方程$\hat{y}=a+bx$。2.计算判定系数$R^2$,并解释其意义。3.预测当广告投入为30万元时的销售额。答案:1.回归方程建立计算相关统计量:$\sumx=10+15+20+25=70$,$\sumy=50+65+80+95=290$,$\sumxy=10×50+15×65+20×80+25×95=500+975+1600+2375=5450$,$\sumx^2=100+225+400+625=1350$,n=4。斜率b:$b=\frac{n\sumxy-\sumx\sumy}{n\sumx^2-(\sumx)^2}=\frac{4×5450-70×290}{4×1350-70^2}=\frac{21800-20300}{5400-4900}=\frac{1500}{500}=3$。截距a:$a=\bar{y}-b\bar{x}=\frac{290}{4}-3×\frac{70}{4}=72.5-52.5=20$。回归方程:$\hat{y}=20+3x$。2.判定系数$R^2$总平方和SST:$\sum(y_i-\bar{y})^2=(50-72.5)^2+(65-72.5)^2+(80-72.5)^2+(95-72.5)^2=506.25+56.25+56.25+506.25=1125$。回归平方和SSR:$\sum(\hat{y}_i-\bar{y})^2$,计算各$\hat{y}_i$:$\hat{y}_1=20+3×10=50$,$\hat{y}_2=20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论