




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计分析实验报告统计分析综合实验报告学院:专业:姓名:学号:统计分析综合实验考题样本数据特征分析:要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,具体要求如下:1.报告必须包含所收集的公开数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标;2.报告中必须有针对某些指标的条形图,饼图,直方图,茎叶图以及累计频率条形图;(注:不同图形针对不同的指标)3.采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。4.报告文字通顺,通过数据说明问题,重点突出。二.线性回归模型分析:自选某个实际问题通过建立线性回归模型进行研究,要求:自行搜集问题所需的相关数据并且建立线性回归模型;通过SPSS软件进行回归系数的计算和模型检验;如果回归模型通过检验,对回归系数以及模型的意义进行解释并且作出散点图一、样本数据特征分析2010年全国人口普查与2000年全国人口普查相关数据分析报告2000年与2011年全国人口普查各项指标原始数据单位(人)年份2000年2011年总人口数12658250481370536875家庭户人口数11782712191244608395流动人口数42418562261386075城乡构成农村居民人口数783841243674149546城镇居民人口数458770983665575306性别构成男性人口数640275969686852572女性人口数602336257652872280年龄构成0-14周岁人口数28452759422245973715-59周岁人口数82810676293961641060周岁及以上人口数129977870177648705民族构成汉族人口数11373861121225932641少数民族人口数105226114113792211教育程度大学(大专及以上)文化程度人口数44020145119636790高中(含中专)文化程度人口数138283459187985979初中文化程度人口数422386607519656445小学文化程度人口数441613351358764003文盲(15岁及以上不识字)人口数8506966754656573(一)总人口2011年第六次全国人口普查数据显示,总人口数为1370536875,比2000年的第五次人口普查的1265825048人次,总人口数增加73899804人,增长5.84%,平均年增长率为0.57%。2000年和2011年两次人口普查各省份人口数据如下:地区2000年人口普查2011年人口普查北京市1356919419612368天津市984873112938224河北省6668441971854202山西省3247124235712111内蒙古自治区2332334724706321辽宁省4182441243746323吉林省2680219127462297黑龙江省3623757638312224上海市1640773423019148江苏省7304357778659903浙江省4593065154426891安徽省5899994859500510福建省3409794736894216江西省4039759844567475山东省8997178995793065河南省9123685494023567湖北省5950887057237740湖南省6327417365683722广东省85225007104303132广西壮族自治区4385453846026629海南省75590358671518重庆市3051276328846170四川省8234829680418200贵州省3524769534746468云南省4236008945966239西藏自治区26163293002166陕西省3536507237327378甘肃省2512428225575254青海省48229635626722宁夏回族自治区54863936301350新疆维吾尔自治区1845951121813334全国合计12426122261339724852做茎叶图分析:表1-1:案例处理摘要年份案例有效缺失合计N百分比N百分比N百分比人口数量2000年31100.0%00.0%31100.0%2011年31100.0%00.0%31100.0%表1-2描述年份统计量标准误人口数量2000年均值40084265.354698126.750均值的95%置信区间下限30489410.50上限49679120.215%修整均值39305445.50中值35365072.00方差684244243725744.400标准差26158062.691极小值2616329极大值91236854范围88620525四分位距41049359偏度.503.421峰度-.652.8212011年均值42992737.654963014.104均值的95%置信区间下限32856910.64上限53128564.655%修整均值41924325.67中值37327378.00方差763576778787588.500标准差27632893.059极小值3002166极大值104303132范围101300966四分位距36481362偏度.625.421峰度-.332.821茎叶图箱形图:(二)流动人口2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为261386075人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加116995327人,增长81.03%。(三)城乡构成2011年人口普查显示居住在城镇的人口为665575306人,占49.68%;居住在乡村的人口为674149546人,占50.32%。2000年农村居民人口数为783841243人,占63.08%;城镇居民则有458770983人,占36.92%。同2000年第五次全国人口普查相比,城镇人口增加207137093人,乡村人口减少133237289人,城镇人口比重上升13.46个百分点。通过下面的条形图可以清楚的看到2000年—2011年十年间,农村居民减少而城镇居民增加。(四)性别构成2000年第五次人口普查男性人口为640275969人占51.53%;女性人口为602336257人,占48.47%。2011年第六次人口普查显示男性人口为686852572人,占51.27%;女性人口为652872280人,占48.73%。通过下面的饼图可以放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。(五)年龄构成2000年人口普查:0-14岁人口为284527594人,占22.90%;15-59岁人口为828106762人,占66.64%;60岁及以上人口为129977870人,占10.46%。2011年人口普查:0-14岁人口为222459737人,占16.60%;15-59岁人口为939616410人,占70.14%;60岁及以上人口为177648705人,占13.26%。同2000年第五次全国人口普查相比,0-14岁人口的比重下降6.29个百分点,15-59岁人口的比重上升3.36个百分点,60岁及以上人口的比重上升2.93个百分点,65岁及以上人口的比重上升1.91个百分点。为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。原始数据整理如下:两次人口普查年龄数据单位(人)年龄段2000年2011年少儿(0~14岁)284527594221322621青年(15~44岁)632911142668233610中年(45~59岁)195195620265660198年轻老年人(60~74岁)102058457132752961老年人(75~89岁)2694818642857259长寿老人(90岁及以上)9712271984220利用SPSS软件将六个年龄段分别赋值,1=“少年”,2=“青年”,3=“中年”,4=“年轻老年人”,5=“老年人”,6=“长寿老人”。然后将描述统计量以1300万为一单位分为个体数据,通过直方图显示其分布频数。通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。青年人口数量占有绝对较高的比例。具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为0.242,2011年增长到0.496,其增长比例是最为显著的,说明随着社会经济的发展高龄老年人数量逐渐增多。(六)民族构成2000年普查,汉族人口为1137386112人,占91.53%;少数民族人口为105226114人,占8.47%。2011年普查,汉族人口为1225932641人,占91.51%;各少数民族人口为113792211人,占8.49%。同2000年第五次全国人口普查相比,汉族人口增加66537177人,增长5.74%;各少数民族人口增加7362627人,增长6.92%。(七)教育程度2000年人口普查时,具有大学(大专及以上)文化程度的人口为44020145人;具有高中(含中专)文化程度的人口为138283459人;具有初中文化程度的人口为422386607人;具有小学文化程度的人口为441613351人,文盲人口(15岁及以上不识字的人)为85069667人。2011年,具有大学(大专及以上)文化程度的人口为119636790人;具有高中(含中专)文化程度的人口为187985979人;具有初中文化程度的人口为519656445人;具有小学文化程度的人口为358764003人,文盲人口(15岁及以上不识字的人)为54656573人。同2000年第五次全国人口普查相比,每10万人中具有大学文化程度的由3611人上升为8930人;具有高中文化程度的由11146人上升为14032人;具有初中文化程度的由33961人上升为38788人;具有小学文化程度的由35701人下降为26779人。
用累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以1000万为单位对各个文化段的人口数进行调整,得出具体的个体值,再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。从上图可以看到大学(大专及以上)文化程度的人口占比特别低。累计高中以上文化程度为20%不到,累计初中以上文化程度为50%多,累计小学以上文化程度为90%左右。通过简单的相减可以得出结论,占比最大的文化段应该在小学文化程度。另外注意到小学文化程度过后的文盲,占比约有10%。根据2011年人口普查的数据,首先,大学(大专文化及以上)程度人口有显著增长,接近翻倍。其他文化程度(除文盲)也都有所增长,其中累计高中以上文化程度频率约为25%,累计初中以上文化程度频率约65%,累计小学以上文化程度频率约95%。同样可以直观的了解到,占比最大的文化段由小学文化程度移至初中文化程度。最后看到文盲所占比重,相比较十年前,削减了近二分之一。总的来说,对比两次普查,可以很肯定的说十年间我国教育事业取得了较为显著的成绩,国民受教育水平有较大提升。(八)家庭户人口2000年人口普查家庭户人口数共有1178271219人,有家庭户340491197,平均每个家庭3.44人。2011年增长到1244608395人,平均每个家庭户的人口为3.10人,比2000年减少0.34人。(九)对两次普查人口年龄比例这一指标是否有显著不同的检验。采用配对样本T检验,表1-3和表1-4给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。根据表1-5配对样本T检验的最后结果(p=0.588>0.05)显示:第六次人口普查和第五次人口普查在人口年龄比例这一指标上没有显著差异。表1-3:两次人口普查三个年龄段(0—14岁,15—59岁,60岁及以上)的描述统计量成对样本统计量均值N标准差均值的标准误对1第五次人口普查414204075.333366685123.532211705754.779第六次人口普查446574950.673427573873.867246859891.175表1-4:两次人口普查三个年龄段(0—14岁,15—59岁,60岁及以上)数据的相关系数成对样本相关系数N相关系数Sig.对1第五次人口普查&第六次人口普查3.987.102表1-5:配对样本T检验结果成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分95%置信区间下限上限对1第五次人口普查–第六次人口普查-32370875.3387794385.5550688112.13-250464219.4185722468.7-.6392.588(十)对两次普查人口教育程度这一指标是否有显著不同的检验。采用配对样本T检验,表1-6和表1-7给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。根据表1-8配对样本T检验的最后结果(p=0.555>0.05)显示:第六次人口普查和第五次人口普查在教育程度这一指标上没有显著差异。两次人口普查教育程度的描述统计量表1-6:成对样本统计量均值N标准差均值的标准误对1第五次人口普查226274645.805190872115888第六次人口普查248139958.005189424303.93984713124.040表1-7:成对样本相关系数N相关系数Sig.对1第五次人口普查&第六次人口普查5.920.027表1-8:配对样本T检验结果成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分95%置信区间下限上限对1第五次人口普查–第六次人口普查-21865312.2075908086.2733947128.19-116117650.172387025.69-.6444.555二、一元线性回归分析北京市1995-2015年城镇居民消费性支出与可支配收入的关系1.问题背景:随着中国经济的高速持续增长,人们生活水平日益提高,作为我国经济文化中心,且经济发展水平位居前列的首都北京,其城镇居民消费水平在这中国经济崛起的二十多年里亦是有着翻天覆地的变化。希望研究北京市城镇居民消费性支出与可支配收入的变化趋势及相关关系,发现其之间的数量关系规律,对居民收入增加,提高居民生活水平的具有重要意义。根据1995~2015年北京市城镇居民消费性支出与可支配收入的统计数据,建立一元线性回归模型,对其进行回归分析。2.原始数据:北京市1995~2015年城镇居民人均可支配收入与消费性支出单位:元年份可支配收入消费支出199558685020199668865730199778136532199884726971199991837499200010350849420011157889232002124641028620031388311124200415638122002005176531324420061997814825200721989153302008247251646020092673817893201029073199342011329032198420123646924046201340321262752014439102800920155285936642数据分析建立模型:yi=α+βxi(yi是消费支出,xi是可支配收入)(1)消费支出可支配收入相关系数表2-1相关性可支配收入消费支出可支配收入Pearson相关性1.997**显著性(双侧).000N2121消费支出Pearson相关性.997**1显著性(双侧).000N2121**.在.01水平(双侧)上显著相关。从表中可得到两变量之间的皮尔逊相关系数为0.997,双尾检验概率p值尾0.000<0.05,故变量之间显著相关。(2)回归模型检验消费支出与可支配收入的散点图从图上可以直观地看出这两个变量之间存在线性相关关系。消费支出可支配收入相关系数表表2-2模型汇总模型RR方调整R方标准估计的误差1.997a.994.993686.971a.预测变量:(常量),消费支出。结果表明相关系数r=0.997,判定系数R方为0.994,调整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淀粉在化妆品的滑石粉替代应用考核试卷
- 稀有金属在量子计算领域的应用考核试卷
- 欧阳修的春秋笔法宋代士大夫如何改写唐史
- 2025年租房经营民宿的合同范本
- 2025年度品牌推广服务合同
- 2025授权代建合同示范文本
- 2025房产交易居间合同范本
- 《2025年终止服务合同范本》
- 隧道工程-桥梁及结构工程施工图设计说明
- 苏教版九年级下册数学(全册知识点考点梳理、重点题型分类巩固练习)(提高版)(家教、补习、复习用)
- 中药饮片出库单
- 国开2023春《语言学概论》形考任务1-3+大作业参考答案
- 宿舍楼施工方案方案
- 甲醇-水精馏塔
- 中国话剧史专题知识
- GB/T 15544.1-2023三相交流系统短路电流计算第1部分:电流计算
- GB/T 90.3-2010紧固件质量保证体系
- GB/T 18799-2020家用和类似用途电熨斗性能测试方法
- 科技公司涉密计算机软件安装审批表
- GA/T 1369-2016人员密集场所消防安全评估导则
- GA 1517-2018金银珠宝营业场所安全防范要求
评论
0/150
提交评论