




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基础统计描述,电子工业出版社,提 纲,1.数理统计量概述 2.数据描述 3.频数分析 4.探索分析 5.交叉列联表分析,提 纲,6.比率分析 7. P-P图、Q-Q图 8. 本章小结,数理统计量概述,SPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在统计学上的定义及其计算公式有所了解。,数理统计量概述,均值(Mean)和均值标准误差(S.E. mean) 均值(平均数、平均值)表示的是某个变量所有取值的 均值标准误差(Standard Error of Mean,S.E. mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。集中趋势或平均水平。,数理统计量概述,中位数(Median) 中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响;因此,可以用它表示总体的一般水平。同时,中位数比算术平均数具有更好的稳定性。,数理统计量概述,众数(Mode) 众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者的所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明此众数的代表性就越高,数列的集中趋势也就越显著。,数理统计量概述,全距(Range) 全距,又称范围,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;反之,全距越小,说明数据越集中。,数理统计量概述,方差(Variance)和标准差(Standard Deviation) 方差是总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。 标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。,数理统计量概述,峰度(Kurtosis)和偏度(Skewness) 峰度是描述总体数据所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大,表示其分布形态的陡缓程度与正态分布的差异度越大。 偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。,数理统计量概述,四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles) 四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数,即中位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。,数理统计量概述,四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles) 与四分位数类似,十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与这9个点位置上相对应的数值称为十分位数,分别记为D1,D2,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%的数据落在D9下。,数理统计量概述,四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles) 同理,百分位数是将一组数据由小到大(或由大到小)排序后分割为10 等份,与99个分割点位置上相对应的数值称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%的数据落在P99下。,数据描述,描述性统计分析是对数据进行基础性的描述。通过得出的数据的平均值(Mean)、和(Sum)、标准差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、全距(range)、平均值标准误(S.E. Mean)、峰度(Kurtosis)、偏度(Skewness)等统计量,来估计原始数据的集中程度、离散状况、分布情况。,频数分析,对于一组数据,考察不同的数值出现的频数,或者是数据落入指定区域内的频数,可以了解数据的分布状况。SPSS 17.0提供了“频数分析”这一功能。通过频数分析,用户在得到描述性统计结果的同时,还能使用户了解变量取值的分布情况,从而使总体数据的分布通过频数分析出的数字得到更为清晰、准确的输出。,探索分析,探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入、详细的描述性观察分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致和全面,有助于用户思考对数据进行进一步分析的方案。,交叉列联表分析,在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。,比率分析,比率分析主要用于对两变量间变量值的比率变化进行描述分析,适用于定距型变量(scale)。比如,可以对受处分的学生和没受处分的学生的上网时间与用计算机的时间进行比率分析。,P-P图、Q-Q图,P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似成一条直线。如果P-P图中各点不成直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。,P-P图、Q-Q图,Q-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生态园林修复技术-第1篇-洞察及研究
- 2025年乡镇畜牧站畜牧档案员招聘面试模拟题集
- 2025年广播媒体融合与传播效果优化策略研究报告
- 2025年中医基础理论考试试题及答案
- 2025年上半年浙江杭州高新区(滨江)劳动保障监察专职人员招聘6人模拟试卷及答案详解1套
- 2025年福建省晋江市建设投资控股集团有限公司及其权属子公司招聘31人模拟试卷及答案详解(考点梳理)
- 2025年菏泽牡丹区区直事业单位公开引进高层次急需紧缺人才(25人)考前自测高频考点模拟试题及答案详解(夺冠系列)
- 家庭教育指导服务行业供需关系重构:2025年市场发展研究报告
- 2025年5G通信基站固态电池技术创新与应用分析报告
- 人教版八年级下册道德与法治4.1 公民基本义务说课稿
- 2024年江苏南通中考满分作文《前进我有我的姿态》13
- 行前说明会流程
- 人教版七年级历史下册各单元测试题(全套,含答案)
- 《另眼观察》(课件)-2024-2025学年沪书画版五四学制(2024)美术六年级上册
- 2023部编新人教版五年级(上册)道德与法治全册教案
- 竞选竞选大学心理委员参考课件
- 体育运动概论1
- DZ∕T 0248-2014 岩石地球化学测量技术规程(正式版)
- FBS-GC-001-分布式光伏施工日志
- 月考试卷讲评课课件
- 游戏:看表情符号猜成语PPT
评论
0/150
提交评论