数学建模方法1基本统计分析_第1页
数学建模方法1基本统计分析_第2页
数学建模方法1基本统计分析_第3页
数学建模方法1基本统计分析_第4页
数学建模方法1基本统计分析_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS基本统计分析频数分析描述统计交叉分组下的频数分析多选项分析1频数分析目的粗略把握变量的总体分布状况。采用的方法计算频分布表 绘制统计图形 上述方法适用于、定类、定距类型数据2计算频数分布表(frequency)频数分布表的基本内容频数 累计频数百分比累计百分比3频数分析应用举例储户的职业分析特点:定类数据使用频数、百分比、总数(不可缺少的)不使用累计频数和累计百分比储户收入水平分析特点:数据除使用频数、百分比、总数外,还可以充分累计频数和累计百分比4频数分析应用举例取款目的分析特点:数据中存在缺式值使用有效百分比(分母为有效样本数)取款目的排名特点:频数分布表输出按频数降序输出freq

2、uency->format5频数分析应用举例取款金额的分析利用分位数(不显示频数分析表) 不同职业的取款金额比较 分位数(Percentile values):适用于、定距数据。数据按升序排序后,找到若干个分位点上的变量值 分位数的应用:从一个侧面比较两组样本数据的集中趋势例:( QL=50,QU=80) 和 (QL=70,QU=75) 的比较 在避免值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度。例:( QL=50,QU=80) 和 (QL=70,QU=75) 的比较6频数分析应用举例不同户口(城镇、农村)的人群取款目分析特点:按不同类型分别分析首先做数据拆分,再进行频数

3、分析7绘制统计图形统计图形的种类条形图、饼图(适用于组后的定距数据)、定类数据和分直方图 (适用于定距数据)8条形图的制作通用框界面入门绘制简单条图(单式条图)绘制复式条图绘制堆积条图(分段条图)定义统计图中数据的表达类型:同一变量若干条的分组汇总条图反映了不同变量的汇总条图反映了观察值9第一种类型下的三种图形:用于某分类变量各分类情况的比较10CountCountCount储户户口11取款金额直方图12描述统计目的精确把握变量的总体分布状况了解数据的集中趋势、离散趋势、对称程度、陡峭程度。采用的方法计算基本描述统计量绘制统计图形13计算描述统计量描述集中趋势的统计量(1)均值(mean):表

4、示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点:利用了全部数据,易受值的影响。(2)众数(mode) (在frequency菜单中计算)一组数据中出现频数最多的变量值。(例:服装尺码) 适用于各类数据,主要用于定类数据。特点:众数可能不唯一,不受值的影响。14计算描述统计量描述离散程度的统计量(1)标准差(standard deviation-Std Dev) (2)方差(variance)(3)极差 (range):最大值(minimum)-最小值(minimum) 极差很小表明所有数据几乎集中在一起应用于相同样本容量的两组数据离散程度比较15计算描述统计量描述对称程度的

5、统计量偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量.偏度为0表示对称;大于0表示正偏差大(右偏),频数最大的值比均值小, 极值大于均值;小于0表示负偏差大(左偏)。16计算描述统计量描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。为0表示与正态分布相同。大于0表示比正态分布陡,尖峰。小于0表示比正态分布缓;平峰。其他:标准误差17计算描述统计量应用举例分析比较城镇和农村居民取款情况比较集中趋势比较离散趋势比较偏斜程度比较陡峭程度实现方式:数据拆分18计算描述统计量应用举例你能以较简便的方法快速找到取款数目出众的储户吗

6、?金额标准化处理,成为标准正态分布标准化后变量的均值为0,标准差为1; 小于0表示在平均水平下,大于0反之.正态分布的数据标准化后呈标准正态分布(68%,95%,99%)根据3准则19绘制统计图形统计图形的种类直方图箱线图P-P图或图第二种类型下的条形图20城乡储户的取款金额分布比较(Boxplot)21存 取 款金额( )城乡储户的平均取款金额估计(Error bar)2295% C( )储户的取款金额分布是否正态23Expected Cum Prob第二种类型下的三种图形:用于若干变量的统计量的比较MeanMeanMean第三种类型下的三种图形(前10个个案):用于比较各个案某变量的取值2

7、5alue( )ValueValue交叉分组下的频数分析目的了解不同变量在不同水平下的数据分布情况例:不同户口的储户收入水平分布一致吗?(两变量)爱逛商店?(三变量)不同职业的女性比采用的方法产生交叉列联表分析列联表中变量间的关系26产生交叉列联表列联表变量列变量职业行变量频数27收入 高(人)中(人)低(人)高工 工程师 助工 技术员 合计 产生交叉列联表应用举例城镇和农村的储户收入水平一致吗?行变量:户口;列变量:月收入定距数据可做适当分组后再产生列联表仅利用频数,信息利用是不充分的cells选项:选择在频数分析表中的输出百分比.行百分比:分别在各户口人数中的比例列百分比:分别在各收入人数

8、中的比例总百分比:在总人数中的比例28产生交叉列联表应用举例不同职业不同法一致吗?段的人对物价水平的看行变量:职业;列变量:物价水平; 段变量:29分析列联表中变量间的关系目的通过列联表分析,检验行列变量之间是否,实现对总体的推断。方法最常用:卡方检验30分析列联表中变量间的关系卡方检验(这里两变量均为定类数据或数据)出发点与工资收入交叉列联表低40000中05000高00600青中老低00400中06000高50000青中老31分析列联表中变量间的关系H0:行列变量之间无关联或相互构造卡方统计量 统计量服从(r-1)*(c-1)个自由度的卡方分布 count:观察(实际)频数 expecte

9、d count:期望频数(期望频数反映的是H0成立情的数据分布特征)Residual:剩余(观察频数-期望频数) Std residual:标准化剩余及格总数5323女812412518488.332100分析列联表中变量间的关系卡方检验一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡 拒绝结论,可以合并单元格。,容易得出样本数对卡方有影响,可用修正的卡方检验phi系数和V系数:(01)之间,越大表示行列变量的相关性越大33多选项分析什么是多选项问题?在回答某些问题时,在两个以上。例如:高考时希望报考的学校:(可多选项)(1)(2)(3)大学 (4)北京理工大学(5)北京师范大

10、学 (6)北京外国语大学多选项问题不能直接处理34多选项分析多选项问题的处理方法思路:将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的。分别做频数分析或交叉分组下的频数分析方法:多选项二分法(multiple dichotomies method)和多选项分类法(multiple category method)普通频数分析和交叉分组下的频数分析35多选项分析多选项二分法将每个(0或1)。作为一个变量,每个变量只有两个取值例如:36变 量 名变 量编码方 案X 101X 201X 3大 学01理大 学01京范 大 学016北外 国01多选项分析多选项分类法:数.为每个预先估

11、计多选项问题可能被选择的最多建立一个变量,取值为多选项问题的可选.例如:37变量名变量名标签编 码 方 案第一选 项(1(2 )(3 )大 学(4 )范 大 学(6 第(2 )(3 )大 学(4 )师 范京 外第 选 项(2 )(3 )大 学(4 )(5 ) 北(6京 外多选项分析分析举例:统计报考分别对三个变量做普通频数 分析大学的情况变量A变量B变量C变量值频23060.0师540.050变量值标数据频数频率师范大学51020.0大学34080.013080.0变量值标签14590.0大学3510.0500.0多选项分析分析举例:统计报考分别作普通交叉分组下的频数分析大学的情况变量A变量B

12、变量CCount名 气大1其他0Row Total师范大学 5821020.0大学 32020400Column To03590100.0Con t名气大1其 他 0Ro w To 华 大 学220 60 . 0范 大 学515 20 40 . 0u m n ta l015 30 .050 10 0 .0Coun tw Total130 15 45 0大学332510. Colu m n Total33 66.017 34.050 100.0多选项分析多选项分析基本思路定义多选项变量集多选项频数分析多选项交叉分组下的频数分析40多选项分析A变量B变量变量集C变量量数据频数5合计50频数频率14530.023020.0大学34530.0师范大学20.001004.10变量值标签数据频数频率23060.0师范大学52040.0100.0变量值标签数据频数频率14590.0大学3510.0合计50100.0多选项分析A变量B变量C变量变量集气大其 他0R o w To t a l13 0 1 5 4 5 22 0 1 0 3 0 2 0 . 0大 学32 3 2 2 4 5 3 0 . 0师 范 大 学73 0 2 0 . 0C o l u m To t6 4 . 05 4 3 6 .1 5 4021 0 0 . 0Coun名 气大Tot

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论