2012春社会统计学期末复习训练答案new_第1页
2012春社会统计学期末复习训练答案new_第2页
2012春社会统计学期末复习训练答案new_第3页
2012春社会统计学期末复习训练答案new_第4页
2012春社会统计学期末复习训练答案new_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2012春社会统计学期末复习训练一、单项选择题 (20=210)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A )A样本 B. 总体 C. 统计量 D. 变量2在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C ) A频率 B. 累积频数 C. 累积频率 D. 比率3离散系数的主要目的是( D )A反映一组数据的平均水平 B比较多组数据的平均水平C反映一组数据的离散程度 D比较多组数据的离散程度4经验法则表明,当一组数

2、据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B )A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据5在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A )A. 39.19 B. 28.90 C19.54 D27.956用样本统计量的值直接作为总体参数的估计值,这种方法称为( A )A点估计 B区间估计 C有效估计 D无偏估计7某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例()偏高。

3、如果要检验该说法是否正确,则假设形式应该为(A )A:0.1;:0.1C:=0.1;:0.1 D:0.1;:0.18下面哪一项不是方差分析中的假定( D )A每个总体都服从正态分布 B观察值是相互独立的C各总体的方差相等 D各总体的方差等于09判断下列哪一个不可能是相关系数( D )A-0.9 B0 C0.5 D1.210用于说明回归方程中拟合优度的统计量主要是( D )A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是( A )A332.1万户家

4、庭 B. 3000户家庭 C. 332.1户家庭的年均收入 D. 3000户家庭的年均收入12下列变量属于数值型变量的是( A ) A工资收入 B. 产品等级 C. 学生对考试改革的态度 D. 企业的类型13如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形( A )A环形图 B饼图 C直方图 D条形图14在频数分布表中,频率是指 ( C )A. 各组频数与上一组频数之比 B. 各组频数与下一组频数之比C. 各组频数与总频数之比 D. 各组频数与最大一组频数之比15两个定类变量之间的相关分析可以使用( A )A. 系数 B. 系数 C. 系数 D. Gamma系数 16

5、根据一个样本均值求出的90%的置信区间表明( C )A总体均值一定落入该区间内 B总体均值有90%的概率不会落入该区间内C总体均值有90%的概率会落入该区间内 D总体均值有10%的概率会落入该区间内17已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元3500元之间的职工人数大约占总体的( B )A95% B68% C89% D90%18方差分析的目的是( D )A比较不同总体的方差是否相等 B判断总体是否存在方差 C分析各样本数据之间是否存在显著差异 D研究各分类自变量对数值型因变量的影响是否显著19对于线性回归,在因变量的总离差

6、平方和中,如果回归平方和所占比例越大,那么两个变量之间( A )A相关程度越大 B相关程度越小 C完全相关 D完全不相关20正态分布中,值越小,则( A )A. 离散趋势越小 B. 离散趋势越大 C. 曲线越低平 D. 变量值越分散21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为( A )A简单随机抽样 B. 系统抽样 C. 整群抽样 D. 分层抽样22某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( D ) A

7、茎叶图 B. 环形图 C. 饼图 D. 线图23如果一组数据中某一个数值的标准分值为-1.5,这表明该数值( D )A是平均数的-1.5倍 B比平均数少1.5C等于-1.5倍标准差 D比平均数低1.5个标准差24某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 ( A )A. 89 B. 72 C. 88 D. 9525某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的(A )A. 68% B. 89% C90% D95

8、%26已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为( A )A700 B0.2 C3500 D17500027在假设检验中,不拒绝虚无假设意味着( D )A虚无假设是肯定正确的 B虚无假设肯定是错误的C没有证据证明虚无假设是正确的 D没有证据证明虚无假设是错误的28在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间( A )A相关程度越高 B相关程度越低 C完全相关 D没有任何关系29从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为( C )A234,121 B117,121 C234,48

9、.4 D117,8130在回归方程中,若回归系数等于0,这表明( B )A. 因变量y对自变量x的影响是不显著的B. 自变量x对因变量y的影响是不显著的C. 因变量y对自变量x的影响是显著的D. 自变量x对因变量y的影响是显著的31某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于( C ) A简单随机抽样 B. 整群抽样 C. 分层抽样 D. 系统抽样32.某企业职工的月收入水平分为以下五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则30

10、00元及以上这一组的组中值近似为( D )A3000元B. 3500元C. 2500元D. 3250元33对于右偏分布,平均数、中位数和众数之间的关系是( A )A平均数中位数众数B中位数平均数众数C众数中位数平均数D众数平均数中位数34两组数据的平均数不相等,但是标准差相等。那么 ( C )A. 平均数小的,离散程度小B. 平均数大的,离散程度大C. 平均数大的,离散程度小D. 两组数据离散程度相同35在假设检验中,如果所计算出的P值越小,那么检验的结果( A )A. 越显著B. 越不显著C越真实D越不真实36如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二

11、者之间存在着(A )A高度相关B中度相关C低度相关D极弱相关37回归平方和(SSR)反映了y的总变差中( A )A由于x与y之间的线性关系引起的y的变化部分B除了x对y的现有影响之外的其他因素对y变差的影响C由于x与y之间的非线性关系引起的y的变化部分D由于x与y之间的函数关系引起的y的变化部分38根据一个具体的样本求出的总体均值90%的置信区间( A )A以90%的概率包含总体均值B绝对包含总体均值C10%的可能性包含总体均值D绝对不包含总体均值39在假设检验中,虚无假设和备择假设( C )A都有可能成立B都不可能成立C有且只有一个成立D备择假设一定成立,虚无假设不一定成立40在方差分析中,

12、某一水平下样本数据之间的误差称为( A )A. 组内误差B. 组间误差C. 组内平方D. 组间平方41.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是( A )A22000名学生B. 2200名学生C. 22000名学生的每月生活费用 D. 2200名学生的每月生活费用42从变量分类看,下列变量属于定序变量的是( C ) A专业B. 性别C. 产品等级 D. 收入43在频数分布表中,比率是指 ( D )A. 各组频数与上一组频数之比B. 各组频数与下一组频数之比C. 各组频数与总频数之比D. 不同小组的频数

13、之比44某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( D ) A茎叶图B. 环形图C. 饼图D. 线图45根据一个样本均值求出的90%的置信区间表明( C )A总体均值一定落入该区间内 B总体均值有90%的概率不会落入该区间内C总体均值有90%的概率会落入该区间内 D总体均值有10%的概率会落入该区间内46判断下列哪一个不可能是相关系数( C )A-0.89B0.34C1.32 D047期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太分布,可以

14、判断成绩在72分-88分之间的学生大约占总体的( A )A95% B68% C89% D90%48. 正态分布中,值越小,则( A )A. 离散趋势越小B. 离散趋势越大C. 曲线越低平D. 变量值越分散49下面哪一项不是方差分析中的假定( D )A每个总体都服从正态分布B观察值是相互独立的C各总体的方差相等D各总体的方差等于050对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明( A )A. 收入每增加1元,消费增加0.8元B. 消费每增加1元,收入增加0.8元C. 收入与消费的相关系数为0.8D. 收入对消费影响的显著性为0.8 51.先将总体

15、按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为( D )A简单随机抽样B. 系统抽样C. 整群抽样D. 分层抽样52在频数分布表中,某一小组中数据个数占总数据个数的比例称为( A ) A频率B. 频数C. 频次D. 频谱53某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是 ( D)A. 86B. 77C. 90D. 8854经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有 ( C )A. 50%的数据B. 6

16、8%的数据C. 95%的数据D. 99%的数据55残差平方和(SSE)反映了y的总变差中( B )A由于x与y之间的线性关系引起的y的变化部分B除了x对y的现有影响之外的其他因素对y变差的影响C由于x与y之间的非线性关系引起的y的变化部分D由于x与y之间的函数关系引起的y的变化部分56. 某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适( A )A. 回归分析 B. 方差分析C. 卡方检验D. 列联表分析57用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为( B )A点估计B区间估计C有效估计D无偏估计58在假设检验中,虚无假设和备择假设( C )A都有

17、可能成立B都不可能成立C有且只有一个成立D备择假设一定成立,虚无假设不一定成立59方差分析的目的是( D )A比较不同总体的方差是否相等 B判断总体是否存在方差 C分析各样本数据之间是否存在显著差异 D研究各分类自变量对数值型因变量的影响是否显著60用于说明回归方程中拟合优度的统计量主要是( D )A. 相关系数B. 离散系数C. 回归系数D. 判定系数61.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是( C )A变量B. 总体C. 样本D. 统计量62当我们用图形描述

18、甲乙两地区的人口年龄结构时,适合选用哪种图形( A )A环形图 B饼图 C直方图 D条形图63如果一组数据中某一个数值的标准分值为1.8,这表明该数值( D )A是平均数的1.8倍B比平均数多1.8C等于标准差的1.8倍D比平均数高出1.8个标准差64离散系数的主要目的是( D )A反映一组数据的平均水平B比较多组数据的平均水平C反映一组数据的离散程度D比较多组数据的离散程度65某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的( A )A. 68%B. 89%C90%D95%66已知某单位平均月

19、收入标准差为700元,离散系数为0.2,那么他们月收入的均值为( C)A700B0.2C3500D14067根据一个具体的样本求出的总体均值95%的置信区间( A )A以95%的概率包含总体均值B5%的可能性包含总体均值C绝对包含总体均值D绝对不包含总体均值68在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间( B )A相关程度越高B相关程度越低C完全相关D没有任何关系69从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为( A )A432,71B216,71C432,426D216,42670对于线性回归,在因变

20、量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间( B )A相关程度越大 B相关程度越小 C完全相关 D完全不相关71某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于(D ) A简单随机抽样B. 整群抽样C. 分层抽样D. 系统抽样72.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为

21、( C )A5小时B. 6小时C. 5.5小时D. 6.5小时73对于左偏分布,平均数、中位数和众数之间的关系是( C )A平均数中位数众数B中位数平均数众数C众数中位数平均数D众数平均数中位数74一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。那么 ( B )A. 一班学生体重的离散程度大B. 二班学生体重的离散程度大C. 两个班学生体重的离散程度相同D. 无法判断75在假设检验中,如果所计算出的P值越大,那么检验的结果( A )A. 越不显著B. 越显著C越不真实D越真实76如果收入与支出之间的线性相关系数为0.92,而且二者之间具有统计显

22、著性,那么二者之间存在着( A )A高度相关B中度相关C低度相关D极弱相关77为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为( B )A. 39B. 45.2C23.5D6578在假设检验中,不拒绝虚无假设意味着( D )A虚无假设是肯定正确的B虚无假设肯定是错误的C没有证据证明虚无假设是正确的D没有证据证明虚无假设是错误的79某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该为( A )A:0.13;:0.13C:=0.13;

23、:0.13D:0.13;:0.1380下列哪种情况不适合用方差分析( C )A. 性别对收入的影响B. 专业对收入的影响C. 年龄对收入的影响D. 行业对收入的影响二、名词解释 1抽样单位与抽样框P11答:一次直接的抽样所使用的基本单位;指一次直接抽样时样本中所有抽样单位的名单。2普查与抽样调查 P12答:普查:是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查。抽样调查:是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本的调查结果推断总体特征。3参数与统计量 P127-128答:参数:是研究者想要了解的总体的某种特征值 统计量:是根据样本数据计算

24、出来的一个量。4方差与标准差 P95答:方差:是各数值与均值离平方的平均数。 标准差:是方差的平方根5独立样本与配对样本P203;P207答:配对样本:是指一个样本中的数据与另一个样本中的数据相对应的两个样本 独立样本:是指我们得到的样本总体之间是相互独立的6总体与样本 P11总体:是构成它的所有个体的集合;样本:就是从总体中按照一定方式抽取的一部分个体的集合7抽样分布 P129答:是指样本统计量的概率分布,它是在重复选取容量为N的样本时,由每个样本计算出来统计量数值的相对频数分布8二维表P152答:就是交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数

25、据,也称为列联表。9相关系数 P170答:就是对变量之间相关关系程度和方向的度量。10. 组内均方P218答:组成平方和除以自由度就是组内均方11普查 P12答:它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查12误差减少比例 P158答:我们将在预测变量Y的值时,知道变量的X值时所减小的误差(E1-E2)与总误差E1的比值13散点图 P165答:是在坐标系中,用横轴表示自变量X,用纵轴表示因变量Y,而变量组(X,Y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,由坐标系及坐标系中的散点形成的二维图就是散点图14正态分布 P103答:连续性随机变量中重要的分布是钟形概

26、率分布,就是正态分布。15最小二乘法 P180答:对于变量X和Y的观察值,我们可以用很多直线去描述,但我们需要选用距离各观察值最近的一条直线,用它来描述X和Y之间的关系与实际的误差最小,根据这一思想来确定回归方程中参数的方法。16概率抽样 P13答:就是按照随即原则进行的抽样,总体中每个个体都有一定的,非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的17中位数 P73答:是对中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值,用Me表示。18相关系数 P170(同9)19区间估计 P134答:在估计总体参数时给出的不是一个数值,而是一个区间,是根据统计量的抽样分布的特点来

27、进行估计,同时给出总体参数落入这一区间的可能性大小20. 中心极限定理 P130答:无论总体分布是否服从正态分布,从均值为U,方差为a的平方的总体中抽取变量为n的随机样本,当n充分大时(n=30),样本均值的抽样分布近似服从均值u,方差为a的平方/n21. 假设检验 P140答:首先先对总体参数建立一个假设,然后根据样本信息去检验这一假设是否正确。22均值 P78答:是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数。23. 虚无假设与替换假设P140答:我们将需要通过样本信息来推断其正确与否的命题称为虚无假设。 如果虚无假设不成立,我们就拒绝虚无假设,需要在另一个假设中进行选

28、择,这就是替换假设24置信水平 P135答:就是将构造置信区间的步骤重复多次,置信区间包含总体参数真值的次数所占的比例。25离散系数 P100答:是一组数据的标准差与该组数据均值之比,称为变量系数。26离散变量与连续变量 P10答:如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。如果一个变量的变量值是连续不断的,可以取无线多个数值的,这种变量称为连续变量。27众数 P68答:是一组数据中出现频数最多的数值,用Mo表示三、简答题 1判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间

29、(4)上网的主要目的(5)上周收到的电子邮件数量(6)每月用于网上购物的金额(7)上月网上购物的次数(8)使用的电脑的品牌(9)上网是否玩游戏(10)电脑是否带有光盘刻录机2调查方法主要包括哪几种?简要说明各种方法的优缺点。3. 什么是简单一元线性回归分析?其作用是什么?4举例简要说明社会研究过程。5按测度水平,变量可分为哪几类?并举例说明。6简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。7等距分组和不等距分组有什么区别?请举例说明。8举例说明什么是自变量和因变量,二者之间是什么关系?9. 简要说明卡方的拟合优度检验和独立性检验的含义。10条形图和直方图有什么区别?(1)条形图

30、:用宽度相同的条形的高度或者长短来表示数据多少的图形。条形图既可以横置也可以纵置,纵置时也可以称为柱形图。 (2)直方图:就是用矩形的宽度和高度来表示频数分布的图形。11. 简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。13简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。14举例说明什么是离散变量和连续变量。(1)离散变量如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。例如,某人兄弟姐妹数、结婚次数、工厂生产产品的数量等,其变量值的取值是0,1,2,3。离散变量的取值是有限个值,而且其取值都是以整数位断开的,是有最小计量单位的。例如,某人的兄

31、弟姐妹数,只能是1个、2个、3个等,而不能是1.3个、2.5个等。(2)连续变量 如果一个变量的变量值是连续不断的,即可以取无数多个数值,这种变量称为连续变量。例如,年龄、温度、灯泡的寿命等,它们的取值是连续不断的。连续变量可以取无数多个值,其取值是连续不断,不可以一一列举的,而且,它们没有最小计量单位。例如,年龄可以是1岁整,也可以是1.2岁、1.45岁、2.544岁等。 15SPSS主要有哪些功能?SPSS软件可以导入txt、excel等格式的数据,可以绘制条形图、直方图、圆形图、散点图等统计图,可以进行描述分析,如频数表分析、交叉表分析、计算均值、方差、中位数、Z值等统计指标,还可以进行

32、复杂的统计分析,如方差分析、相关分析、回归分析、时间序列分析、聚类分析、因子分析等。16在SPSS中如何定义变量属性?SPSS中变量有三种基本类型:数值型、字符型、日期型。 (1)数值型变量 数值型变量是SPSS中最常用的变量类型。数值型变量包括标准数值型、逗号数值型、圆点数值型、科学计数法型、美元数值型、自定义型。 (2)字符型变量 字符型变量也是SPSS中比较常用的数据类型,默认长度为8。例如姓名、地点等都可以定义为字符型变量,字符型变量不能参与运算。 (3)日期型变量 日期型变量可以用来表示日期,也可以表示时间,例如调查时间、出生日期等都可以定义为日期型变量。17统计表主要由哪几部分构成

33、?18简述相关系数的取值与意义。19概率抽样方法主要包括哪几种?包括:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样。 20. 简要说明卡方的拟合优度检验和独立性检验的含义。21数据分析中的归纳法和演绎法分别是什么?归纳法与演绎法是社会研究的两种基本推理方式。归纳法是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;演绎法则与归纳法正好相反,是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。 22. 什么是简单回归分析?其作用是什么?23. 一元线性回归模型中有哪些基本假定?24判断以下随机变量是定性变量还是定量变

34、量,如果是定量变量,确定是离散变量还是连续变量。(1)考研辅导班参加者的姓名(2)家庭月消费(3)温度(4)上个月外出吃饭的次数(5)产品等级25. 简述定类变量、定序变量和数值型变量集中趋势测量的方法。26如何对配对样本进行t检验。四、计算题 (每题15分,共30分) 1.某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105

35、695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩

36、由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+96+97)42 =349042 =83.095 (2) 按成绩 分组 频数 频率(%)向上累积 向下累积 频数 频率(%)频数 频率(%)60-6937.143 37.14342100.000 70-791126.190 1433.333 3992.857 80-8915

37、35.714 2969.048 2866.667 90-991330.952 42100.000 1330.952 2为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回归ABCD0.000残差205158.07EF总计1642866.6711要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少?答案: (1) 方差分析表: A=1642866.67-205158.07=1437708.60 (SS总计-S

38、S残差)B=1,E=11-1=10(总计-B)C=A/B=1437708.60/1=1437708.60F=205158.07/10=20515.807D=C/F=1437708.60/20515.807=70.078变差来源 SSdfMSFSig.回归 1437708.60 11437708.6070.0780.000残差 205158.071020515.807 总计 1642866.6711 (2) 即商品销售量的变差中有87.51%是由价格引起的。 (3) 销售量与价格之间的相关系数是0.9355 3.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,A项测试中平均分数为90分,

39、标准差是12分;B考试中平均分数为200分,标准差为25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?答案: 该测试者在A项测试中比平均分高出1个标准差,而在B项测试中比平均分高出0.6个标准差。因而,可以说该测试者A项测试比较理想。4某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。要求:(1)写出广告费用y与销售量程x之间的线性回归方程。(2)假如广告

40、费用投入50000元,根据回归方程估计商品销售量。(3)计算判定系数,并解释它的意义。答案: (1)y=364+1.42x (2)当x=50000时,y=364+1.4250000=71364 (3) = 1602708.6(1602708.6+40158.07) = 1602708.61642866.67 =0.97556 表明在商品销售量的总变差中,有97.6%可以由回归方程解释,说明回归方程的拟合程度很高。 5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每

41、天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:答案: (1)已知: 网络用户每天平均上网时间的95%的置信区间为: 即(6.17,6.83) (2)样本比例: 年龄在20岁以下的网络用户比例的95%的置信区间为: 即(33.6%,46.4%)6.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用其中的一种方法。通过对每个工人生产的产品数进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig.组间2100.00

42、0组内3836总计29答案: 变差来源SSdfMSFSig.组间210*2=4203-1=2210210/142.07=1.4780.000组内383630-3=273836/27=142.07总计420+3836=4256297.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。乙单位月收入分布表按收入分组(元)人数(个)3000分以下1203000400042040005000540500060004206000以上300合计1800要求:(1)计算乙单位员工月收入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?(提示:使用离散系数)答案:(

43、1)乙单位员工月收入均值:=(2500120+3500420+4500540+5500420+6500300)/1800=4700方差:=1360000标准差为:(2)根据离散系数公式:,得到:甲单位员工月收入的离散系数: 乙单位员工月收入的离散系数:,所以甲单位员工月收入的离散程度更大8某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差平方和SSE=450。要求:(1)写出销售量y与广告费用x之间的线性回归方程。(2)假如明年计划投入广告费用为25万元,根据回归方程估计明年

44、汽车销售量。(3)计算判定系数,并解释它的意义。答案:(1) 线性回归方程:y=363+1.42x(2) 当x=25时,y=363+1.4225=398.5(3)= 1600(1600+450) =0.78表明在商品销售量的总变差中,有78%可以由回归方程解释,说明回归方程的拟合程度较好。9.某行业管理局所属40个企业2011年产品销售额数据如下所示。40个企业2011年产品销售额企业编号销售额企业编号销售额企业编号销售额企业编号销售额11521110521103311362105121232210332146311713116231373312749714115241383413551241

45、5110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。答案:(1) 销售额由低到高排序:87,88,91,95,97,

46、100,103,103,104,105,105,107,108,108,110,112,113,115,115,115116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152众数位:115中位数:(115+116)/2=115.5平均数:=(87+88+91+95+146+152)/40=4647/40=116.175(2) 频数分布表如下:按销售额分组频数 频率(%)向上累积 向下累积 频数 频率(%)频数 频率(%)105万元以下922.5%922.5%40100%105-115万元820

47、%1742.5%3177.5%115-125万元1230%2972.5%2357.5%125万元以上1127.5%40100%1127.5%10某单位为研究其商品的广告费用(x)对其销售量(y)的影响,收集了过去12年的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回归1602708.6BDF0.000残差40158.08CE总计A11要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由广告费用的差异引起的?(3)销售量与广告费用之间的相关系数是多少?答案:(1) A=1602708.6+40158.08=1642866.6

48、8 (SS回归+SS残差)B=1,C=11-1=10(总计-B)D=1602708.6/B=1602708.6E=40158.08/C=4015.808F=D/E=1602708.6/4015.808=399.10变差来源SSdfMSFSig.回归1602708.611602708.6399.100.000残差40158.08104015.808总计1642866.6811(2)商品销售量的变差中有97.56%是由广告费用的差异引起的(3)销售量与广告费用之间的相关系数是0.987711.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准

49、差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?答案:(1)根据离散系数公式:,得到:男生体重离散系数为: 女生体重离散系数为: 所以:,即女生体重差异大注:(2)和(3)解答参考P110 “68-95-99.7规则” (2)男生中有68.26%比重的人体重在55千克-65千克之间? (3)女生中有95.44%比重的人体重在40千克-60千克之间?12某公司欲了解广告费用x对销售量y的影响,收集了16个地区的数据,并对x、y进行线性回归分析,得到:方程的截距为280,回归系数为1.6,回归平方和SSR=1503000,残差平方和SSE=38

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论