




免费预览已结束,剩余17页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电大社会统计学期末复习训练资料考点归纳总结一、单项选择题 1.为了解it行业从业者收入水平,某研究机构从全市it行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( )a样本b. 总体c. 统计量d. 变量2在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( ) a频率b. 累积频数c. 累积频率d. 比率3离散系数的主要目的是( )a反映一组数据的平均水平b比较多组数据的平均水平c反映一组数据的离散程度d比较多组数据的离散程度4经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( )a. 50%的数据b. 68%的数据c. 95%的数据d. 99%的数据5在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( )a. 39.19b. 28.90c19.54d27.956用样本统计量的值直接作为总体参数的估计值,这种方法称为( )a点估计b区间估计c有效估计d无偏估计7某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该为( )a:0.1;:0.1c:=0.1;:0.1d:0.1;:0.18下面哪一项不是方差分析中的假定( )a每个总体都服从正态分布b观察值是相互独立的c各总体的方差相等d各总体的方差等于09判断下列哪一个不可能是相关系数( )a-0.9b0c0.5 d1.210用于说明回归方程中拟合优度的统计量主要是( )a. 相关系数b. 离散系数c. 回归系数d. 判定系数11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是( )a332.1万户家庭b. 3000户家庭c. 332.1户家庭的年均收入 d. 3000户家庭的年均收入12下列变量属于数值型变量的是( ) a工资收入b. 产品等级c. 学生对考试改革的态度 d. 企业的类型13如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形( )a环形图 b饼图 c直方图 d条形图14在频数分布表中,频率是指 ( )a. 各组频数与上一组频数之比b. 各组频数与下一组频数之比c. 各组频数与总频数之比d. 各组频数与最大一组频数之比15两个定类变量之间的相关分析可以使用( )a. 系数 b. 系数 c. 系数d. gamma系数 16根据一个样本均值求出的90%的置信区间表明( )a总体均值一定落入该区间内 b总体均值有90%的概率不会落入该区间内c总体均值有90%的概率会落入该区间内 d总体均值有10%的概率会落入该区间内17已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元3500元之间的职工人数大约占总体的( )a95% b68% c89% d90%18方差分析的目的是( )a比较不同总体的方差是否相等 b判断总体是否存在方差 c分析各样本数据之间是否存在显著差异 d研究各分类自变量对数值型因变量的影响是否显著19对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间( )a相关程度越大 b相关程度越小 c完全相关 d完全不相关20正态分布中,值越小,则( )a. 离散趋势越小b. 离散趋势越大c. 曲线越低平d. 变量值越分散21.从含有n个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为( )a简单随机抽样b. 系统抽样c. 整群抽样d. 分层抽样22某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( ) a茎叶图b. 环形图c. 饼图d. 线图23如果一组数据中某一个数值的标准分值为-1.5,这表明该数值( )a是平均数的-1.5倍b比平均数少1.5c等于-1.5倍标准差d比平均数低1.5个标准差24某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 ( )a. 89b. 72c. 88d. 9525某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的( )a. 68%b. 89%c90%d95%26已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为( )a700b0.2c3500d17500027在假设检验中,不拒绝虚无假设意味着( )a虚无假设是肯定正确的b虚无假设肯定是错误的c没有证据证明虚无假设是正确的d没有证据证明虚无假设是错误的28在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间( )a相关程度越高b相关程度越低c完全相关d没有任何关系29从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为( )a234,121b117,121c234,48.4d117,8130在回归方程中,若回归系数等于0,这表明( )a. 因变量y对自变量x的影响是不显著的b. 自变量x对因变量y的影响是不显著的c. 因变量y对自变量x的影响是显著的d. 自变量x对因变量y的影响是显著的 31某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于( ) a简单随机抽样b. 整群抽样c. 分层抽样d. 系统抽样32.某企业职工的月收入水平分为以下五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为( )a3000元b. 3500元c. 2500元d. 3250元33对于右偏分布,平均数、中位数和众数之间的关系是( )a平均数中位数众数b中位数平均数众数c众数中位数平均数d众数平均数中位数34两组数据的平均数不相等,但是标准差相等。那么 ( )a. 平均数小的,离散程度小b. 平均数大的,离散程度大c. 平均数大的,离散程度小d. 两组数据离散程度相同35在假设检验中,如果所计算出的p值越小,那么检验的结果( )a. 越显著b. 越不显著c越真实d越不真实36如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着( )a高度相关b中度相关c低度相关d极弱相关37回归平方和(ssr)反映了y的总变差中( )a由于x与y之间的线性关系引起的y的变化部分b除了x对y的现有影响之外的其他因素对y变差的影响c由于x与y之间的非线性关系引起的y的变化部分d由于x与y之间的函数关系引起的y的变化部分38根据一个具体的样本求出的总体均值90%的置信区间( )a以90%的概率包含总体均值b绝对包含总体均值c10%的可能性包含总体均值d绝对不包含总体均值39在假设检验中,虚无假设和备择假设( )a都有可能成立b都不可能成立c有且只有一个成立d备择假设一定成立,虚无假设不一定成立40在方差分析中,某一水平下样本数据之间的误差称为( )a. 组内误差b. 组间误差c. 组内平方d. 组间平方41.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是( )a22000名学生b. 2200名学生c. 22000名学生的每月生活费用 d. 2200名学生的每月生活费用42从变量分类看,下列变量属于定序变量的是( ) a专业b. 性别c. 产品等级 d. 收入43在频数分布表中,比率是指 ( )a. 各组频数与上一组频数之比b. 各组频数与下一组频数之比c. 各组频数与总频数之比d. 不同小组的频数之比44某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( ) a茎叶图b. 环形图c. 饼图d. 线图45根据一个样本均值求出的90%的置信区间表明( )a总体均值一定落入该区间内 b总体均值有90%的概率不会落入该区间内c总体均值有90%的概率会落入该区间内 d总体均值有10%的概率会落入该区间内46判断下列哪一个不可能是相关系数( )a-0.89b0.34c1.32 d0 47期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的( )a95% b68% c89% d90%48. 正态分布中,值越小,则( )a. 离散趋势越小b. 离散趋势越大c. 曲线越低平d. 变量值越分散49下面哪一项不是方差分析中的假定( )a每个总体都服从正态分布b观察值是相互独立的c各总体的方差相等d各总体的方差等于050对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明( )a. 收入每增加1元,消费增加0.8元b. 消费每增加1元,收入增加0.8元c. 收入与消费的相关系数为0.8d. 收入对消费影响的显著性为0.8 51.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为( )a简单随机抽样b. 系统抽样c. 整群抽样d. 分层抽样52在频数分布表中,某一小组中数据个数占总数据个数的比例称为( ) a频率b. 频数c. 频次d. 频谱53某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是 ( )a. 86b. 77c. 90d. 8854经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有 ( )a. 50%的数据b. 68%的数据c. 95%的数据d. 99%的数据55残差平方和(sse)反映了y的总变差中( )a由于x与y之间的线性关系引起的y的变化部分b除了x对y的现有影响之外的其他因素对y变差的影响c由于x与y之间的非线性关系引起的y的变化部分d由于x与y之间的函数关系引起的y的变化部分56. 某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适( )a. 回归分析 b. 方差分析c. 卡方检验d. 列联表分析57用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为( )a点估计b区间估计c有效估计d无偏估计58在假设检验中,虚无假设和备择假设( )a都有可能成立b都不可能成立c有且只有一个成立d备择假设一定成立,虚无假设不一定成立59方差分析的目的是( )a比较不同总体的方差是否相等 b判断总体是否存在方差 c分析各样本数据之间是否存在显著差异 d研究各分类自变量对数值型因变量的影响是否显著 60用于说明回归方程中拟合优度的统计量主要是( )a. 相关系数b. 离散系数c. 回归系数d. 判定系数61.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是( )a变量b. 总体c. 样本d. 统计量62当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形( )a环形图 b饼图 c直方图 d条形图63如果一组数据中某一个数值的标准分值为1.8,这表明该数值( )a是平均数的1.8倍b比平均数多1.8c等于标准差的1.8倍d比平均数高出1.8个标准差64离散系数的主要目的是( )a反映一组数据的平均水平b比较多组数据的平均水平c反映一组数据的离散程度d比较多组数据的离散程度65某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的( )a. 68%b. 89%c90%d95%66已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为( )a700b0.2c3500d14067根据一个具体的样本求出的总体均值95%的置信区间( )a以95%的概率包含总体均值b5%的可能性包含总体均值c绝对包含总体均值d绝对不包含总体均值68在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间( )a相关程度越高b相关程度越低c完全相关d没有任何关系69从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为( )a432,71b216,71c432,426d216,42670对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间( )a相关程度越大 b相关程度越小 c完全相关 d完全不相关71某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于( ) a简单随机抽样b. 整群抽样c. 分层抽样d. 系统抽样72.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( )a5小时b. 6小时c. 5.5小时d. 6.5小时73对于左偏分布,平均数、中位数和众数之间的关系是( )a平均数中位数众数b中位数平均数众数c众数中位数平均数d众数平均数中位数74一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。那么 ( )a. 一班学生体重的离散程度大b. 二班学生体重的离散程度大c. 两个班学生体重的离散程度相同d. 无法判断75在假设检验中,如果所计算出的p值越大,那么检验的结果( )a. 越不显著b. 越显著c越不真实d越真实76如果收入与支出之间的线性相关系数为0.92,而且二者之间具有统计显著性,那么二者之间存在着( )a高度相关b中度相关c低度相关d极弱相关77为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为( )a. 39b. 45.2c23.5d6578在假设检验中,不拒绝虚无假设意味着( )a虚无假设是肯定正确的b虚无假设肯定是错误的c没有证据证明虚无假设是正确的d没有证据证明虚无假设是错误的79某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该为( )a:0.13;:0.13c:=0.13;:0.13d:0.13;:0.1380下列哪种情况不适合用方差分析( )a. 性别对收入的影响b. 专业对收入的影响c. 年龄对收入的影响d. 行业对收入的影响二、名词解释 1抽样单位与抽样框2普查与抽样调查3参数与统计量4方差与标准差5独立样本与配对样本6总体与样本7抽样分布8二维表9相关系数10. 组内均方11普查12误差减少比例13散点图14正态分布15最小二乘法16概率抽样17中位数18相关系数19区间估计20. 中心极限定理21. 假设检验22均值23. 虚无假设与替换假设24置信水平25离散系数26离散变量与连续变量27众数三、简答题 1判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的主要目的(5)上周收到的电子邮件数量(6)每月用于网上购物的金额(7)上月网上购物的次数(8)使用的电脑的品牌(9)上网是否玩游戏(10)电脑是否带有光盘刻录机2调查方法主要包括哪几种?简要说明各种方法的优缺点。3. 什么是简单一元线性回归分析?其作用是什么?4举例简要说明社会研究过程。5按测度水平,变量可分为哪几类?并举例说明。6简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。7等距分组和不等距分组有什么区别?请举例说明。8举例说明什么是自变量和因变量,二者之间是什么关系?9. 简要说明卡方的拟合优度检验和独立性检验的含义。10条形图和直方图有什么区别?11. 简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。13简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。 14举例说明什么是离散变量和连续变量。15spss主要有哪些功能?16在spss中如何定义变量属性?17统计表主要由哪几部分构成?18简述相关系数的取值与意义。19概率抽样方法主要包括哪几种?20. 简要说明卡方的拟合优度检验和独立性检验的含义。21数据分析中的归纳法和演绎法分别是什么?22. 什么是简单回归分析?其作用是什么?23. 一元线性回归模型中有哪些基本假定?24判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)考研辅导班参加者的姓名(2)家庭月消费(3)温度(4)上个月外出吃饭的次数(5)产品等级25. 简述定类变量、定序变量和数值型变量集中趋势测量的方法。26如何对配对样本进行t检验。四、计算题 (每题15分,共30分) 1.某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。2为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:方差分析表变差来源ssdfmsfsig.回归abcd0.000残差205158.07ef总计1642866.6711要求:(1)计算上面方差分析表中a、b、c、d、e、f处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少? 3.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,a项测试中平均分数为90分,标准差是12分;b考试中平均分数为200分,标准差为25分。一位应试者在a项测试中得了102分,在b项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?4某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和ssr=1602708.6,残差平方和sse=40158.07。要求:(1)写出广告费用y与销售量程x之间的线性回归方程。(2)假如广告费用投入50000元,根据回归方程估计商品销售量。(3)计算判定系数,并解释它的意义。 5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:6.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用其中的一种方法。通过对每个工人生产的产品数进行分析得到下面的方差分析表。请完成方差分析表。变差来源ssdfmsfsig.组间2100.000组内3836总计29 7.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。乙单位月收入分布表按收入分组(元)人数(个)3000分以下1203000400042040005000540500060004206000以上300合计1800要求:(1)计算乙单位员工月收入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?(提示:使用离散系数)8某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和ssr=1600,残差平方和sse=450。要求:(1)写出销售量y与广告费用x之间的线性回归方程。(2)假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销售量。(3)计算判定系数,并解释它的意义。9.某行业管理局所属40个企业2011年产品销售额数据如下所示。40个企业2011年产品销售额企业编号销售额企业编号销售额企业编号销售额企业编号销售额115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业安全生产大培训总结课件
- 养护作业安全培训心得课件
- 农业农村质量安全培训课件
- 化工企业安全培训室课件
- 冒号双引号的用法
- 化工企业仓储安全培训课件
- 国有土地使用权收购服务合同5篇
- 内部安全教育培训记录课件
- 初入职场安全培训内容课件
- 平安主打营销方案(3篇)
- 2025年国防教育知识竞赛试题(附答案)
- 丙酮酸脱氢酶缺乏的护理
- DL-T 1115-2019 火力发电厂机组大修化学检查导则
- GB/T 6113.201-2008无线电骚扰和抗扰度测量设备和测量方法规范第2-1部分:无线电骚扰和抗扰度测量方法传导骚扰测量
- GB/T 23101.3-2010外科植入物羟基磷灰石第3部分:结晶度和相纯度的化学分析和表征
- 会诊-联络精神病学-课件
- 玻璃幕墙施工方案完整版
- 部编人教版三年级道德与法治上册全册课件
- 城市道路工程质量事故
- 七律长征教学实录王崧舟3篇
- 铁路路基大维修规则
评论
0/150
提交评论