统计分析作业 spss 软件完成.doc_第1页
统计分析作业 spss 软件完成.doc_第2页
统计分析作业 spss 软件完成.doc_第3页
统计分析作业 spss 软件完成.doc_第4页
统计分析作业 spss 软件完成.doc_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析2012级硕士研究生统计分析试卷专业 学号 姓名 成绩 一、阐述统计分析方法应用的各个步骤,给出步骤流程图。(8分)答:统计分析方法应用步骤: 1. 提炼具体问题,确定欲达目标;2. 确定定性理论,设置指标变量;3. 收集、整理统计数据;4. 根据目标和数据,选择统计方法,构造理论模型;5. 进行统计计算,估计模型参数;6. 模型的检验与修改;7. 统计模型的应用。步骤流程图:分类研究结构简化研究相关分析研究预测决策研究Y提炼具体问题,确定欲达目标修改现实经济问题收集整理统计数据根据目标和数据,选择统计方法,构造理论模型进行统计计算,估计模型参数确定定性理论,设置指标变量统计检验应用N二、说明产生异方差的原因?异方差带来的后果有哪些?(8分)答:1、模型中遗漏了某些解释变量如果模型中只包含所要研究的几个主要因素,其他被省略的因素对被解释变量的影响都归入了随机误差项,则可能使随机误差项产生异方差性。2、模型函数形式的设定误差在一般情况下,解释变量与被解释变量之间的关系是比较复杂的非线性关系。在构造模型时,为了简化模型,用线性模型代替了非线性关系,或者用简单的非线性模型代替了复杂的非线性关系,造成了模型关系不准确的误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势。3、样本数据的测量误差一方面,样本数据的测量误差常随时间的推移而逐步积累,从而会引起随机误差项的方差增加。另一方面,随着时间的推移,抽样技术和其他收集资料方法的改进,也使得样本的测量误差逐步减少,从而引起随机误差的方差减小。因此,在时间序列资料中,由于在不同时期测量误差的大小不同,从而随机项就不具有同方差性。4、随机因素的影响经济变量本身受很多随机因素影响(比如政策变动、自然灾害或金融危机等),不具有确定性和重复性,同时,社会经济问题涉及人的思维和行为,也涉及各阶层的物质利益,人的行为具有很多不确定因素。在古典回归模型的假定下,普通最小二乘估计量是线性、无偏、有效估计量,即在所有无偏估量中,最小二乘估计量具有最小方差性它是有效估计量。如果在其他假定不变的条件下,允许随机扰动项ui存在异方差性,即ui的方差随观测值的变化而变化,这就违背了最小二乘法估计的高斯马尔柯夫假设,这时如果继续使用最小二乘法对参数进行估计,就会产生以下后果:1、参数估计量仍然是线性无偏的,但不是有效的2、异方差模型中的方差不再具有最小方差性3、t检验失去作用4、模型的预测作用遭到破坏三、在进行一项市场调查时,得到了关于375个家庭的户主受教育水平和年收入的资料,下表是这些数据按两种标准进行交叉分类的结果。试以0.05的显著性水平检验关于收入与受教育水平彼此独立的零假设。(10分)年收入(美元)受教育水平合计少于8年8-12年高中毕业大学肄业大学毕业少于3000107341253000-49991410742375000-749992513183687500-9999793844610410000-149993814186210515000或更多238101336合计4562839887375解:H0:收入与受教育水平彼此独立 H1:收入与受教育水平相关将上表数据按要求录入,利用spss16.0进行分析,输出结果为:年收入*受教育水平crosstabulation受教育水平Total少于8年8-12年高中毕业大学肄业大学毕业年收入少于3000Count10734125Expected Count3.04.15.56.55.825.03000-4999Count141074237Expected Count4.46.18.29.78.637.05000-7499Count9251318368Expected Count8.211.215.117.815.868.07500-9999Count7938446104Expected Count12.517.223.027.224.1104.010000-149999Count38141862105Expected Count12.617.423.227.424.4105.015000或更多Count238101336Expected Count4.36.08.09.48.436.0TotalCount4562839887375Expected Count45.062.083.098.087.0375.0Count:代表观察频数 Expected Count:期望频数Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Pearson Chi-Square206.450(a)20.000Likelihood Ratio190.76220.000Linear-by-Linear Association97.5151.000N of Valid Cases375 a 4 cells (13.3%) have expected count less than 5. The minimum expected count is 3.00.从上表可以得出p=0.007.815,所以要拒绝,即这些数据并不遵从正态分布的价值总体。五、某企业想了解顾客对其产品是否满意,同时还想了解不同收入人群对其产品的满意程度是否相同。在随机发放的1000份问卷中收回有效问卷792份,根据收入高低和满意回答的交叉分组数据如下表,试分析主效应和交叉效应。(10分)满意不满意合计高533891中434108542低11148159合计598194792解:将数据输入SPSS软件中,按照操作步骤得到如下表格:Data Information NCasesValid6Out of Range(a)0Missing0Weighted Valid792Categories收入情况3满意情况2a Cases rejected because of out of range factor values. 首先显示系统对792例资料进行分析,这792例资料可分为6类。模型中共有两个分类变量:其中“收入情况”变量为3水平,“满意情况”变量为2水平;分析的效应除了两个分类变量,还有两者的交互作用。系统经过一次迭代后,即达到相邻二次估计之差不大于规定的0.001.Cell Counts and Residuals收入情况满意情况ObservedExpectedResidualsStd. ResidualsCount(a)%Count%1153.5006.8%53.5006.8%.000.000238.5004.9%38.5004.9%.000.00021434.50054.9%434.50054.9%.000.0002108.50013.7%108.50013.7%.000.00031111.50014.1%111.50014.1%.000.000248.5006.1%48.5006.1%.000.000a For saturated models, .500 has been added to all observed cells. 由于本例对模型采用系统默认的饱和模型,因而实际例数与期望例数相同,进而残差(Residual)和标准化残差(Std.Residual)均为0.K-Way and Higher-Order Effects KdfLikelihood RatioPearsonNumber of IterationsChi-SquareSig.Chi-SquareSig.K-way and Higher Order Effects(a)15662.843.000866.318.00002222.087.00023.567.0002K-way Effects(b)13640.756.000842.751.00002222.087.00023.567.0000a Tests that k-way and higher order effects are zero.b Tests that k-way effects are zero.这是对模型是否有高阶效应进行检验,原假设是高阶效应为0,即没有高阶效应,检验结果认为接受原假设,不存在高阶效应。Parameter EstimatesEffectParameterEstimateStd. ErrorZSig.95% Confidence Interval Lower BoundUpper Bound收入情况*满意情况1-.260.078-3.332.001-.413-.107 2.269.0584.651.000.156.382收入情况1-.683.078-8.737.000-.836-.530 2.883.05815.267.000.769.996满意情况1.425.0498.703.000.329.520为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据上表结果可推得各参数为:A高收入=-0.683,A中收入=0.883,A低收入=-0.19,B满意=0.425,B不满意=-0.425Y高收入,满意=-0.260,Y中收入,满意=-0.269,Y低收入,满意=-0.009,Y高收入,不满意=0.260Y中收入,不满意=0.269,Y低收入,不满意=0.009(1)B满意为正值,说明接收调查的多数顾客对其产品还是满意的。(2)A高A低A中,说明各收入阶层的顾客对其产品的满意程度是不同的,其中,高收入的各科满意程度最低,而中等收入的顾客满意程度最高。(3)通过对企业顾客的收入情况和满意情况交互效应的研究,Y高,满意为负值表示高收入与对陈平的满意程度是负效应的,Y中,满意为正表示中等收入者与对产品的满意程度是正效应,同理,低收入人群对产品的满意程度也是负效应的。该企业的产品主要的消费阶层是中等收入者,同时中等收入者对其产品的满意程度也最好。六、假设通过抽样调查得到来自城乡的30个家庭的数据(见下表)。因变量OWN=1表示该家庭拥有彩电、OWN=0表示该家庭没有彩电。自变量INCOM表示该家庭的年收入(千元),虚拟自变量URBAN=1 表示该家庭在城市、URBAN=0表示该家庭在农村。试建立Logistic回归模型并进行分析。(10分) 样本序号OWNINCOMEURBAN10110211303114040120511816120170908113190120101160111130120111131131140101150901611311711101811501911512001102111712207023090241121251131261171270140281131290150301111解:将数据录入spss14.0,依次点击Analyze-Regression-binary regression,选用entry方法,得到部分输出结果:可见income和urban两个自变量都是显著的,因而最终的回归方程为以上方程式表明,收入高的人拥有彩电的比例高于收入低的人,家住城市的人拥有的彩电的比例高于家住农村的人。七、已知福建省各县(市)的5个指标的数值(见下表),试根据这5个指标把福建省各县(市)分成合理的4类. (14分)地区人均地区生产总值二、三产业产值占地区生产总值的比重每亩耕地总产出率农民人均纯收入 人均规模以上工业总产值福州市辖区29188.00 98.16 6517.00 6769.0045402.79福清市 21727.00 84.95 3609.00 6369.0041938.52长乐市 24212.00 86.02 3905.00 6251.0046624.75闽侯县 14794.00 83.75 4081.00 4652.0021326.67连江县 14162.00 57.77 3039.00 4912.00 6058.34罗源县 16215.00 73.84 2184.00 4438.0010735.22闽清县 16405.00 81.03 3619.00 4560.0012178.77永泰县 8426.00 55.25 4467.00 3844.00 2460.72平潭县 10479.00 63.04 2612.00 4119.00 826.86厦门市 44737.00 97.92 3634.00 6230.00133196.6莆田市辖区15160.00 86.87 4307.00 4682.0016380.43仙游县 7797.00 80.80 3151.00 3829.00 4266.40三明市辖区24070.00 92.90 3023.00 4940.0060493.10永安市 21696.00 85.06 2456.00 4625.0025001.12明溪县 12497.00 64.00 2312.00 4218.00 5072.04清流县 10293.00 59.94 2545.00 4171.00 5371.71宁化县 7178.00 56.03 1594.00 3673.00 1747.40大田县 8740.00 62.39 3900.00 4006.00 6390.23尤溪县 12041.00 57.51 4541.00 4291.00 5053.27沙县 17507.00 75.32 2705.00 4597.0018092.15将乐县 14088.00 69.42 2594.00 4068.00 7036.35泰宁县 17618.00 71.69 2132.00 4150.00 6106.35建宁县 12039.00 57.24 2277.00 3750.00 4533.08泉州市辖区26645.00 96.47 3842.00 6061.0057425.58石狮市 32406.00 94.53 2538.00 8523.0063033.49晋江市 27308.00 97.30 1656.00 7625.0069233.92南安市 14925.00 93.34 2093.00 5904.0015925.45惠安县 20562.00 89.78 1802.00 6148.0020357.88安溪县 13042.00 89.29 1657.00 5156.00 9943.92永春县 17161.00 87.68 2595.00 5202.00 9325.15德化县 17019.00 88.17 1908.00 4777.0016168.89漳州市辖区26805.00 95.69 4151.00 5087.0032540.10龙海市 18667.00 84.28 5116.00 4693.0033960.10云霄县 7498.00 58.59 2658.00 4573.00 2471.26漳浦县 8742.00 62.48 2861.00 4649.00 3277.05诏安县 7625.00 58.65 1969.00 4426.00 3343.08长泰县 13685.00 72.32 3806.00 4578.0013021.06东山县 15499.00 61.65 1797.00 5114.0011619.19南靖县 14269.00 63.31 5187.00 4567.0017847.56平和县 7823.00 53.28 3226.00 4453.00 1471.64华安县 11063.00 57.89 3314.00 4566.00 3855.08延平区 18279.00 84.43 2054.00 4447.0024129.84邵武市 16516.00 76.79 2034.00 4502.0012741.42武夷山市13571.00 76.23 1537.00 4516.00 2973.95建瓯市 8922.00 65.10 1931.00 4752.00 4023.29建阳市 10295.00 66.09 1690.00 4015.00 6222.96顺昌县 11163.00 74.61 1609.00 4151.00 8532.28浦城县 7328.00 64.66 1760.00 4046.00 3170.17光泽县 10172.00 62.59 1248.00 3545.00 5639.74松溪县 7262.00 60.52 2665.00 3067.00 1738.78政和县 5373.00 61.43 1561.00 3300.00 1399.10新罗区 27709.00 91.51 2145.00 5662.0040672.18漳平市 14519.00 77.05 3726.00 4189.00 7583.27长汀县 7323.00 60.20 2406.00 3369.00 2354.63永定县 13225.00 77.84 2523.00 4476.00 5708.11上杭县 10348.00 68.47 2303.00 3789.00 5437.32武平县 8663.00 61.84 2449.00 3905.00 2363.83连城县 9917.00 65.82 2432.00 3759.00 3378.84蕉城区 13358.00 79.86 1589.00 3829.00 4152.91福安市 12435.00 81.93 2396.00 3995.0011940.16福鼎市 10568.00 75.77 1865.00 3937.00 6718.96霞浦县 9860.00 67.91 1953.00 4078.00 2207.32古田县 9514.00 69.88 3390.00 4215.00 3868.09屏南县 8990.00 71.67 2432.00 3523.00 3702.09寿宁县 6943.00 68.63 2992.00 3532.00 3573.64周宁县 6911.00 79.51 1490.00 3564.00 3557.72柘荣县 11696.00 77.13 3708.00 3551.00 8246.36解:由于变量间存在着量纲的不同,利用spss 16.0依次Analyze-Descriptive statistics-descriptives将5个变量选入右边的框中,选中左下角的“save standardized values as variables”进行Z标准化,得出标准化数据如下:进行z标准化后的数据地区人均地区生产总值(X1)二、三产业产值占地区生产总值的比重(X2)每亩耕地总产出率(X3)农民人均纯收入(X4)人均规模以上工业总产值(X5)福州市辖区2.011441.854453.570742.174901.34406福清市 .98848.83096.803081.777201.18689长乐市 1.32919.913861.084801.659881.39950闽侯县 .03791.737991.25230.07010.25173连江县 -.04874-1.27490.26059.32860-.44100罗源县 .23274-.02982-.55315-.14267-.22881闽清县 .25879.52725.81260-.02137-.16331永泰县 -.83519-1.470141.61968-.73324-.60422平潭县 -.55371-.86659-.14580-.45983-.67835厦门市 4.143331.83585.826881.639015.32727莆田市辖区.08809.979721.46740.09993.02732仙游县 -.92143.50943.36719-.74816-.52230三明市辖区1.309721.44691.24536.356442.02871永安市 .98423.83948-.29427.04326.41844明溪县 -.27703-.79221-.43132-.36140-.48575清流县 -.57921-1.10677-.20957-.40813-.47215宁化县 -1.00630-1.40971-1.11467-.90326-.63659大田县 -.79214-.916951.08004-.57218-.42594尤溪县 -.33955-1.295041.69010-.28882-.48660沙县 .40988.08484-.05729.01542.10498将乐县 -.05889-.37228-.16293-.51053-.39663泰宁县 .42510-.19640-.60264-.42901-.43882建宁县 -.33982-1.31596-.46463-.82670-.51020泉州市辖区1.662771.723511.024841.470981.88954石狮市 2.452651.57320-.216233.918792.14397晋江市 1.753681.78782-1.055663.025962.42528南安市 .055871.48100-.639751.31488.00667惠安县 .828751.20518-.916711.55748.20777安溪县 -.202301.16722-1.05471.57120-.26471永春县 .362441.04248-.16198.61693-.29278德化县 .342971.08044-.81583.19438.01772漳州市辖区1.684711.663081.31893.50259.76048龙海市 .56893.779052.23736.11086.82491云霄县 -.96243-1.21137-.10202-.00844-.60374漳浦县 -.79187-.90998.09118.06712-.56719诏安县 -.94502-1.20672-.75777-.15460-.56419长泰县 -.11414-.14759.99058-.00347-.12510东山县 .13457-.97428-.92147.52944-.18870南靖县 -.03407-.845672.30493-.01441.09388平和县 -.91787-1.62278.43857-.12775-.64910华安县 -.47364-1.26560.52232-.01540-.54096延平区 .51573.79067-.67687-.13372.37891邵武市 .27401.19874-.69591-.07903-.13779武夷山市-.12977.15535-1.16892-.06512-.58094建瓯市 -.76719-.70698-.79394.16952-.53333建阳市 -.57894-.63028-1.02330-.56323-.43353顺昌县 -.45993.02983-1.10040-.42801-.32876浦城县 -.98574-.74107-.95668-.53241-.57203光泽县 -.59580-.90145-1.44397-1.03052-.45999松溪县 -.99479-1.06183-.09536-1.50576-.63698政和县 -1.25378-.99133-1.14608-1.27411-.65239新罗区 1.808661.33922-.590261.074281.12943漳平市 .00020.21888.91444-.39023-.37181长汀县 -.98642-1.08663-.34186-1.20550-.60904永定县 -.17721.28009-.23051-.10488-.45689上杭县 -.57167-.44588-.43989-.78792-.46917武平县 -.80270-.95956-.30093-.67259-.60862连城县 -.63077-.65120-.31711-.81775-.56257蕉城区 -.15898.43660-1.11943-.74816-.52745福安市 -.28553.59698-.35138-.58311-.17414福鼎市 -.54151.11971-.85675-.64078-.41103霞浦县 -.63858-.48927-.77300-.50059-.61572古田县 -.68602-.33664.59465-.36438-.54037屏南县 -.75786-.19795-.31711-1.05239-.54790寿宁县 -1.03852-.43349.21586-1.04344-.55373周宁县 -1.04291.40948-1.21365-1.01163-.55445柘荣县 -.38685.22508.89731-1.02455-.34173将标准化后的数据录入spss16.0,利用K-means cluster,在number cluster里输入4,在Method框中选择快速聚类分析的方法时采用系统默认的iterate and classify,即先定初始类中心点,然后按K-mean算法作迭代分类。Iterate次数输入20,options项statistics除默认值设置之外,再增选ANOVA table和Cluster information for each case两个选项,按continue,回到K-Mean cluster analysis对话框,单击OK,得到部分输出结果如下:Initial Cluster CentersCluster1234Z score(X1)2.01144-.994794.143331.75368Z score(X2)1.85445-1.061831.835851.78782Z score(X3)3.57074-.09536.82688-1.05566Z score(X4)2.17490-1.505761.639013.02596Z score(X5)1.34406-.636985.327272.42528上表显示了4个类的初始类中心情况。Iteration History(a)IterationChange in Cluster Centers123412.0451.492.0001.9102.415.042.000.0003.289.039.000.0004.552.052.000.1515.229.032.000.0006.000.000.000.000a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is .000. The current iteration is 6. The minimum distance between initial centers is 4.427. 上表显示了4个类中心每次迭代的偏移情况,可知迭代次数只需达到6次已经达到指定的判定标准(0),因此一开始的20次的迭代次数远远足够,第一次迭代4个类的中心店分别偏移了2.045,1.492,0.000,1.910。Final Cluster Centers Cluster1234Z score(X1).65940-.418984.143331.35442Z score(X2).81369-.396671.835851.36685Z score(X3)1.85204-.27061.82688-.02895Z score(X4).41752-.414351.639011.79510Z score(X5).44844-.417685.327271.37975 上表显示了4个类的最终类中心情况。根据spss运行结果,整理出分类情况,见下表运用K-Mean聚类法的各地区分类情况类别县(市、区)名称地区数第一类福州市辖区、闽侯县、闽清县、莆田市辖区、南靖县、龙海市、漳州市辖区7第二类连江县、罗源县、永泰县、平潭县、仙游县、明溪县、永安市、清流县、宁化县、建宁县、尤溪县、沙县、将乐县、泰宁县、大田县、安溪县、永春县、德化县、云霄县、漳浦县、诏安县、长泰县、东山县、平和县、华安县、延平区、邵武市、武夷山市、建瓯市、建阳市、顺昌县、浦城县、光泽县、松溪县、政和县、长汀县、漳平市、永定县、上杭县、武平县、连城县、蕉城区、福安市、福鼎市、霞浦县、古田县、柘荣县、寿宁县、周宁县、屏南县50第三类厦门市1第四类新罗区、惠安县、南安市、晋江市、石狮市、泉州市辖区、三明市辖区、长乐市、福清市9八、就第七题提供的数据,若用某种方法已将福建省若干县(市)分成了4类(见下表),请用判别分析法,把待判别的县市分到这4类中。(10分)类别县(市、区)名称1厦门市、石狮市、福州市辖区、新罗区、晋江市、漳州市辖区、泉州市辖区2南安市、惠安县、安溪县、德化县、永春县、永安市、蕉城区、周宁县、永定县、邵武市、武夷山市、福鼎市、沙县、顺昌县、罗源县、泰宁县3龙海市、闽清县、莆田市辖区、闽侯县、漳平市、南靖县、连江县、长泰县、尤溪县、柘荣县、华安县4东山县、将乐县、明溪县、建宁县、平潭县、光泽县、连城县、霞浦县、屏南县、建瓯市、武平县、诏安县、浦城县、长汀县

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论