张家口电大2015年秋《社会统计学》形成性考核作业及答案DOC_第1页
张家口电大2015年秋《社会统计学》形成性考核作业及答案DOC_第2页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、张家口电大2015年秋社会统计学形成性考核作业形成性考核作业一表1是某大学二年级135个同学的社会统计学课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。请注意分组时按照下列标准:等级AA-B+BB-C+CC-D+DF分90-1086-883-880-876-773-770-766-663-660-60-5数09529529529表1某专业二年级同学社会统计学期末考试成绩(百分制)学生成绩学生成绩学生成绩学生成绩学生成绩1862834558882701097126029655693838811

2、080365303057858488111874283178588385681126658532865993868711384687338460958788114837703487617188911158586435856290897611678951369363869087117811058379664899181118811190388265899261119711250397866839372120861387408067849486121911482417468449529122661565427269689637123581668437370899782124681786448671

3、84988212580188045857286998212677198146907379100851275520704769747810178128542180488675871028012962224949867688103901305423805084778210482131652470518178831057213274255952907992106861337026805334808610780134722752548481861088213573答案如下:1、按成绩低至高排序如下表:学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩42886442724080788363866

4、589952936593721028011483728670893030156510572107803384808611902834296513472110805084818646905334131654373125805484948652909637112661357319816784106866290684412266417451817184120861039022491668132749181113846878891125069688976117815851387121919518568126771188135853487799227521246831781482458575873693

5、12854476939783882578586875693130547074787782100859087599312755207010178978211585111876095105824701167898828655883796123588270737999821786768825591337018801048232868388921296061626171218010882448684881091197171232680805866838348498686876488892、成绩分组表如下:等级AA-B+BB-C+CC-D+DF分数90-1086-883-880-876-773-770-

6、766-663-660-60-5人数132816228412753173、制作频数分布表如下:等级AA-B+BB-C+CC-D+DF分90-1086-883-880-876-773-770-766-663-660-60-5数人数13281622841275317百分比9.63%20.74%11.85%16.3%5.93%2.96%8.89%5.19%3.7%2.2%12.59%4、频数分析统计图如下:形成性考核作业二表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。(2)计算学生上网时间的标

7、准分(Z值)及其均值和标准差。(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。(30分)表1某专业一年级同学一周上网时间(小时)学生上网时间学生上网时间学生上网时间学生上网时间学生上网时间1132118411461881102922224276219821038232243963248320412241044864138421582513451065218516626261046186621861071327124726671087108528224814681388219329194986920891910183010501070219010113

8、312251137112913212103230522872159271320338531273269328141934205410742094191515351755975179515168361456107619961017837857127799720181538125824782198819203915592679179914202240136020801610018答案如下:集中趋势各扌銅:均数15.2.中位数为14.0.讷为10o离散趋势:四分位数分别为P兀为10、P気为14.P75为20、方差为39.515.标准差为6.2S6.极差为2%步骤:AnalyzeDescriptive

9、StatisticsFrequencies上网时间(勾选集中趋势指标:tnean,median,mode,minimutn,tnaximun罔菁攵趋势寸旨标:quartiles,Variance,Std.deviation,Range)(2)标准分Z值详见作业王远)。步骤AnalyE亡DescriptieStatisticsDescriptiveSavestandardizedalue5;asvarianles即可。均数位巧2标准差&2E6步骤AnalyzeDescripti_eStati&ticEiDesciiptiAeptions勾选(meatbSid.deiaiioti)一周上网时间超过

10、20小时的学生所占比例21%o步骤1:AnalyzeSelectCaseyif上网时间:=2011步骤2:AnalyzeDesciiptneStatisticsDescriptive上网时间超过2Oh得岀上网时间超过20h人数为21人占总人数的21%。形成性考核作业三一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。每小题2分,共20分)1. 学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是(C)A. 22000名学生B. 2200名学生C. 22000名学生的每月

11、生活费用D. 2200名学生的每月生活费用2. 从变量分类看,下列变量属于定序变量的是(C)A. 专业B. 性别C. 产品等级D. 收入3在频数分布表中,比率是指(D)A. 各组频数与上一组频数之比B. 各组频数与下一组频数之比C. 各组频数与总频数之比D. 不同小组的频数之比4. 某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A. 茎叶图B. 环形图C. 饼图D. 线图5. 根据一个样本均值求出的90%的置信区间表明(C)A. 总体均值一定落入该区间内B. 总体均值有90

12、%的概率不会落入该区间内C. 总体均值有90%的概率会落入该区间内D. 总体均值有10%的概率会落入该区间内6. 判断下列哪一个不可能是相关系数(C)A. -0.89B. 0.34C. 1.32D. 07. 期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的(A)A. 95%B. 68%C. 89%D. 90%8. 正态分布中,o值越小,贝U(A)A. 离散趋势越小B. 离散趋势越大C. 曲线越低平D. 变量值越分散9. 下面哪一项不是方差分析中的假定(D)A. 每个总体都服从正态分布B. 观察值是相互独立的

13、C. 各总体的方差相等D. 各总体的方差等于010. 对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明(A)A. 收入每增加1元,消费增加0.8元B. 消费每增加1元,收入增加0.8元C. 收入与消费的相关系数为0.8D. 收入对消费影响的显著性为0.8二、名词解释(每题4分,共20分)1抽样单位与抽样框答:抽样单位就是一次直接的抽样所使用的基本单位。抽样单位有时与构成总体的个体是相同的,有时是不同的。例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育

14、龄妇女)就不相同了。抽样框是指一次直接抽样时样本中所有抽样单位的名单。例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框。但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框。2均值答:均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总6个数,也称为算数平均数。均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。因而,我们说均值是集中趋势最主要的测量值。3 散点图答:散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y

15、)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断。4 抽样分布答:抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。例如样本均值的分布、样本比例分布等。5 虚无假设与替换假设答:将需要通过样本信息来推断其正确与否的命题称为虚无假设,也成为原假设或者零假设,通常用H0表示。如果虚无假设

16、不成立,我们就拒绝虚无假设,需要在另个一假设中进行选择,这就是替换假设,替换假设通常用H1表示。上面例子中,虚无假设为:H0:卩=1800替换假设为:H1:yH1800a。三、简答题(每题10分,共30分)1等距分组和不等距分组有什么区别?请举例说明。答:在分组时,如果分组组距相等,就是等距分组,如:学生平均每天上网时间:组距设3,分成3-6,6-9,9-12,12-15共4个小组。如果分组组距不相等,就是不等距分组。如:人口分析,分婴幼儿组0-6),少儿组(7-17),中青年组(18-59),老人组(60-130),组距不相等。2简述定类变量、定序变量和数值型变量集中趋势测量的方法。定序变量

17、是层次最低的变量,用众数作为其中心趋势的测量定序变量主要使用中位数、四分位数作为集中趋势的测量,同时也可以使用众数作为测量值,但是中位数和四分数位利用序次关系,因而更多使用这两者口数值型数据(定距和定比数据)的集中趋势测量指标是平均数,同样,数值型数据可以使用众数和中位数四分位数作为中心趋势的测量:但是更2要的是使月均值対为均值使月所有数据信息.运用以下表格说明定类变量、定序变量和数值型变量集中趋势测量的方法数据类型疋类数据定序数据数值型数据适用的测量值众数中位数均值分位数中位数众数分位数众数3. 如何对配对样本进行t检验。答:可运用以下2种方法对配对样本进行t检验(1)配对样本T检验方法:配

18、对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本T检验(Paired一SampleTtest)用于检验两个相关的样本(配对样本)是否来自具有相同均值的总体,因此针对配对样本我们可以首先计算出两个样本每个对应变量间的差值,然后再检验其差值的均值是否为零,若均值接近于零(即在给定的置信区间内),说明两个样本均值在给定的置信水平上没有差异;若均值在给定置信区间以外,说明两个样本均值在给定的置信水平上有差异。(2)利用SPSS进行配对样本T检验;在SPSS主菜单选中Analyze一CompareMeans一Paired一SampleTTest,出现图11一4所示窗口。“PairedVari

19、ables”框中的变量作为分析变量,总是成对出现,指定要检验的两个变量到“PairedVariables”输入栏里的“Variablel”和“Variable2”中,在CurrentSelections”栏中就会显示被选中的成对变量,在“Options”选项中可以进行置信水平和缺失值的设置,同单样本T检验。四、计算题(每题15分,共30分)1. 某大学针对某项政策的态度调查,随机抽取300名被调查者,了解对政策的观点,调查结果见表1所示。(15分)表1对某项政策态度的调查结果学生教师学校领导合计赞同685716141反对34411085中立25361374合计12713439300要求:(1)

20、利用原始数据绘制包含百分比的二维表,并对绘制的列联表加以简要说明;(2)并计算Y系数,并进行说明答:对某项政策态度的调查结果男女合计初中及以下243256高中354075专科342155本科及以上542276合计1471152622. 某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差平方和SSE=450。要求:(1)写出销售量y与广告费用x之间的线性回归方程。y=363+l.42x(2)假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销售量。当x=25y=363

21、+L42*25=398.5(辆)(3)计算判定系数,并解释它的意义。R:=SSRSSR+SSE=1600v(1600+450)=0.78表明在商品销售量的总变差屮,有刚可以勺同归方程解释:说明诃归方程的拟合程度较好.形成性考核作业四一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。每小题2分,共20分)1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为(D)A. 简单随机抽样B. 系统抽样C. 整群抽样D. 分层抽样2在频数分布表中,某一小组中数据

22、个数占总数据个数的比例称为(A)A. 频率B. 频数C. 频次D频谱3. 某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是(D)A. 86B. 77C. 90D.884. 经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有(C)A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据5. 残差平方和(SSE)反映了y的总变差中(B)A. 由于x与y之间的线性关系引起的y的变化部分B除了x对y的现有影响之外的其他因素对y变差的影响C. 由于x与y之间的非线性关系引起的y的变化部分D. 由于x

23、与y之间的函数关系引起的y的变化部分6某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适(A)A回归分析B方差分析C. 卡方检验D. 列联表分析7. 用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为(B)A. 点估计B. 区间估计C有效估计D.无偏估计8. 在假设检验中,虚无假设和备择假设(C)A. 都有可能成立B. 都不可能成立C. 有且只有一个成立D. 备择假设一定成立,虚无假设不一定成立9. 方差分析的目的是(D)A. 比较不同总体的方差是否相等B. 判断总体是否存在方差C. 分析各样本数据之间是否存在显著差异D. 研究各分类自变量对数值型因变量的影

24、响是否显著10. 用于说明回归方程中拟合优度的统计量主要是(D)A.相关系数B离散系数C. 回归系数D. 判定系数二、名词解释(每题4分,共20分)1概率抽样答:概率抽样就是按照随机原则进行的抽样,总体中每个个体都有一定的、非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的。包括:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样。2普查答:普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查。例如,我们历年进行的人口普查、工业普查、农业普查、第三产业普查、经济普查、统计基本单位普查等。3置信水平答:置信水平就是将构造置信区间的步骤重复很多次,置信区

25、间包含总体参数真值的次数所占的比例。4离散系数是一组数据的标准差与改组数据均值之比,称为变量系数。5.独立样本与配对样本配对样本:是指一个样本中的数据与另一个样本中的数据相对应的两个样本独立样本:是指我们得到的样本总体之间是相互独立的。三、简答题(每题10分,共30分)1.按测度水平,变量可分为哪几类?举例说明。按照测度水平,变量可以分为定类变量,定序变量.定距变量和定比变量四类.(1)定类变量:当变量值的含义仅表示个体的不同类别、而不能说明个体的大小、程度等其他特征时,这种变量称为定类变量分类变量是最低层次的变量。例如性别可以分为男、女两类。(2) 定序变量:当变量值得含义不仅表衣个体的不同

26、类别还可以区分个体之间大小、程度等序次差异时,这种变董新为定序变量。受教育程度是定序变量,可以分为文盲、小学初白、高中、大专及以上等.(3) 定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量口定距变量具有测量单位这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。智商温度等都是定距变量。(4) 定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时这样的标量称为定比变量*定比变量是最高层次的变量在社会调查中,很多情况下我们使用的都是定比变量,例如身高.年龄.收入、一个地区的人口数、某

27、产品的生产量等2举例简要说明社会研究过程。一项系统.完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程;提出问题;形成假设;收集数据;分析数据;检验假设【1)提出间题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的是什么.(2) 研究问题往往是无法宜接检验的,而是把研究问题形成假设才可进行检验。假设是对两个变量间关系的陈述,是对它们关系的尝试性回签“假设中的变量是相对具体的,是可以通过检验可测的.(3) 收集数据是社会研究的关键步骤。这一阶段要确定收集的变量、收集的方法.收集的总量等这一阶段所需投入的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织和管理。(

28、4)分析数据主要是对收集的原始数据进行系统的审核.整理、归类、统计和分析.我们既要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研究总体的状况&(5) 完成对数据的统计分析后,我们要根据对数据的分析来检验我们之前的假设和理论口当结果支持我们的假设时,我们对研究问题得到了解释;当结果不支持我们的假设时,要冋过头来修改我门的问题和假设,开始新的一轮检验*3元线性回归模型中有哪些基本假定?-般地,在作元线性回归分析过程中回:丿三分析是建立系列假设基础上的,这些假设为:(1) 、回归模型因变量y与自变量之间具有线性关系*(2) 、在重复抽样亡自变量x值是商定的.期假定x

29、是非随机的.(3) 、误差项的均值为零a4(4) .误差项的方差为常数。(5) .误差项是独立随机变量且月及从正态分布,即多种检验都是基于以上假设从而确保回归模型的可靠四、计算题(每题15分,共30分)1.某行业管理局所属40个企业2011年产品销售额数据如下所示。40个企业2011年产品销售额企业编号销售额企业编号销售额企业编号销售额企业编号销售额115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论