版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章描述性统计分析,1,PPT学习交流,第一节描述性统计理论,1,描述性统计,概念:描述性统计是收集到的数据组的特征。 应该注意的是,描述了该数据集本身的分布特性,不能深刻理解统计数据的内部规则。 SPSS的许多模块可以完成描述性的统计分析,但是为了此目的而设计的一些模块集中在描述性的统计菜单上,他们计算各种统计量和描绘统计图来实现描述功能。 2、PPT学习交流,且所述描述性统计分析是分析一系列数据的不同特征以描述以测量样本的不同特征为代表的总体特征。 描述性统计分析的项目很多,经常使用平均值、标准偏差、中值、度数分布、正态或偏置的程度等。 这些分析是复杂的统计分析的基础。 平均、标准误差、
2、中值、最频、全距离、标准偏差、方差、四分位、十分位、百分位、度数分布、峰度、偏度、标准得分及其线性变换、搜索分析、交叉列表分析、2、描述性统计分析:3、PPT学习交流、2、描述性统计分析指标集中倾向的测度:共性离散度的测度(measures of variability ) :异质性分布形态的测度、4、PPT学习交流、1、集中倾向的测度、集中倾向(平均值)是集体整体数值的最好代表。 有平均值(mean )、中值(median )、最频值(mode )三种形式。 其中最常用的是平均值。 5、PPT学习交流、算术平均、算术平均等于所有样本数据的和除以数据数。 算术平均值是描述样本数据中心趋势的最常
3、见统计量。 在分组条件下,公式、6、PPT学习交流、2、离散度、离散度(异质性)反映了数值之间的差异。 同样的平均值也有差异。 例如,7、6、3、3、1、3、4、4、5、4、4、4、4、4、4、4有五个离散测量指标。 例如,“全距离”、“标准偏差”、“方差”和“标准误差”。 其中最常用的是标准偏差。 7、PPT学习交流、标准偏差(方差)、标准偏差()和方差(2 )是反映数据离散倾向的最常用统计量。 在分组条件下,标准偏差的公式是:标准偏差是方差的算术平方根。 8、PPT学习沟通,严格地说,在方差和标准差计算中,分母应是n-1。 这是因为数据变异的自由度是n-1。 但是,对于大样本,使用n和n-
4、1没有什么差异。 自由度df是指当根据样本的统计量估计整体参数时可以独立地或自由变化的样本数据的数目,其被称为统计量的自由度。 统计学上的自由度有两个内容,首先,当估计整体的平均时,样本中的n个个数是相互独立的,因为从其中提取任何个数都不影响其他数据。 9、PPT学习交流,然后在估计整体方差时使用方差平方和。 因为如果n-1个方差平方和已确定,方差也已确定平均值已确定,如果知道其中的n-1个值,第n个值也已确定。 在此,平均值相当于制约条件,通过加上该制约条件,估计总体方差的自由度为n-1。 例如,n=1个观测值可以计算平均值,但不能计算标准偏差,n超过1时可以计算标准偏差,因此关于标准偏差实
5、际上只有(n-1 )个信息。 10、PPT学习交流、标准误差,即样本平均数的标准偏差是测定平均数样本分布的偏差程度和平均数样本误差大小的尺度,反映了样本平均数之间的变化。 标准误差不是标准偏差,而是多个样本的平均标准偏差。 标准误差用于采样误差的测定。标准误差越小,样本统计量和整体参数值越接近,表示样本对整体有代表性,用样本统计量估计整体参数的可靠性越大。 因此,基准错误是统计估计可靠性的指标。 另外,还需要特别指出,标准误差不仅指样本的标准偏差、方差等统计量的标准偏差,还指样本的平均数的标准偏差。11、PPT学习交流、3、分布形态的尺度、度数(Frequency ) :一个变量的各观测值出现
6、的次数。 例如,一班语文考试的成绩可以累计各数值的人数。 峰度(Kurtosis) :是记述某变量取的所有值的分布形态陡峭程度的统计量,峰度陡峭程度的尺度是与正态分布比较的结果。 当峰度等于0时,数据分布的急剧缓和度与正态分布相同,峰度大于0,数据分布比正态分布陡峭,峰度小于0,数据分布比正态分布平坦。 12、PPT学习交流、时滞是描述数据分布对称性的统计量,是与正态分布的对称性相比较而得到的。 分布的偏差等于0时,数据分布的对称性与正态分布相同,偏差大于0时,分布在正或右偏差,即峰值的右侧有大的偏差值,在右侧出现长尾巴,偏差度小于0时,负偏差或左偏差,即峰值的左侧有大的偏差13、PPT学习交
7、流,三、正态分布理论,1、概念正态分布又称为高斯(Gauss )分布,是最常见的最重要的连续型分布,表现为中间高,两端低,左右完全对称的图形。 14、PPT学习交流,2、图形的正态分布密度函数中的参数是平均值,记述由标准偏差确定的正态分布。15,PPT学习交流,正态分布概率密度曲线图,16,PPT学习交流,不同的平均正态分布图,17,PPT学习交流,不同标准偏差的正态分布图,18,PPT学习交流,正态曲线下面积的分布规则:通过对密度函数进行积分,知道正态曲线下被横轴夹的面积为1 理论上,范围内曲线上的面积是总面积的68.27%; 范围内的曲线上的面积占总面积的90%,范围内的曲线上的面积占总面
8、积的95%,范围内的曲线上的面积占总面积的99%。19,PPT学习交流,3,标准正态分布及其应用,标准正态分布:平均值为0,标准偏差为1的正态分布是变量的话,可以从下式转换为的标准正态分布。 此转换也称为标准化转换或转换。、20、PPT学习交流、四、图表显示数据、1、常用图表直方图多边形图表、21、PPT学习交流、柱状图、22、PPT学习交流、多边形图表、23、PPT学习交流、线性图表、24、PPT学习交流、2、图表显示的度数平均标准偏差的偏度(skewness )的尖度(kurtosis ),25,PPT学习交流,平均:、低收入a组的平均收入b组的平均收入高收入,、 低收入平均高收入、群a的
9、收入分布、群b的收入分布、群c的收入分布、27、PPT学习交流、偏度、频度、低收入高收入、群a的收入分布向前倾斜,群b的收入分布不向前倾斜,群c的收入分布向负组c的收入分布向负方向倾斜,组c的收入分布向负方向倾斜,PPT学习交流,组a的收入分布,组b的收入分布,29,PPT学习交流,第二节单变量描述性分析,一,度数分析过程二,数据描述分析过程三,数据30,PPT学习交流,一,度数分析过程,度数分布表是记述性统计中最常用的方法之一,SPSS度数分析过程是为了制作度数表而设计的,不仅是制作单变量详细的度数表,还表示文件中指定的变量的特定值发生的度数,而且还表示特定的记述统计量和要求分析示例:点击统
10、计学成绩. sav,31,PPT学习交流,32,PPT学习交流,统计量按钮,在弹出对话框中检查平均值和标准偏差,33,PPT学习交流,点击图标按钮,在弹出对话框中选择直方图显示PPT学习交流,35,PPT学习交流,其他采用默认设定,点击ok,36 PPT学习交流,二,数据描述分析过程,描述分析过程是连续资料统计描述应用最多的过程,他对变量进行描述性统计分析,计算并列举一系列对应的统计指标这和其他过程不一样。 但是,此过程具有特殊的功能,可以将原始数据转换为标准正规得分值,并作为变量存储在数据库中,然后进行分析。37、PPT学习交流,依次点击说明分析-将说明、统计学考试成绩变量加入对话框,从选项
11、中选择分析指标,用于38、PPT学习交流、分析结果、39、PPT学习交流、三、数据搜索过程,主要用于资料数据的性质、分布情况等完全不明时的分析根据常用的描述性统计指标,增加有关数据详细分布特征的文字和图形描述,如茎叶图、箱形图等,看起来更为详细全面。 也可以为用于分布式一致性的变量转换提供线索,以帮助用户制定继续分析的计划。 点击40,PPT学习交流,搜索按钮,默认置信区间为95%,采用茎叶图,默认设定即可,41,PPT学习交流,42,PPT学习交流,茎叶图,整数位为茎,小数位为叶。 这样,数据的分布范围和形态,43,PPT学习交流,第3节列表和多选问题度数分析,列表分析多选问题度数分析,44
12、,PPT学习交流,1,列表分析,列表也称为交替分类表,所谓交替分类,是指根据两个变量的值对所研究的情况进行分类。 相互分类的目的是对两个变量进行分组,比较各组的分布情况,寻找变量间的关系。 如果是用两个标记将一组观测值交叉分组的度数分布表,则表中有横行和横行的特定标记名相关联的观测值的数量,表的右栏是各行的度数的合计,表下是各列的度数的合计,两者交叉的地方,即表的右下角是度数的合计,这些表是列表45、PPT学习交流,如果整体中的个体能按两个属性a和b进行分类,则a有r个类A1、A2、Ar、b有c个类B1、B2、Bc,从整体中提取大小为n的样本,其中nij个个体的属性属于类Ai和Bj,nij 如
13、果考虑两个或多个属性,也可以用同样的方法创建一个称为多维合并表的合并表。 最常见的列表是两个变量的列表。 一个是行变量,其分类数是r个,一个是列变量,其分类数是c个。 r行c列的列连接表称为rc列连接表。46、PPT学习交流、链接列表的结构、47、PPT学习交流、联合度数和边缘度数表的fij是联合度数FXj是列边缘的度数FYi是行边缘的度数n是全观测数。 联合频率和边缘频率fij/n是联合频率FXj/n是列边缘频率FYi/n是行边缘频率。 条件频率fij/FXj是x条件y的频率P(Y=i|X=j); fij/FYi是y条件x频率P(X=j|Y=i)。 48、PPT学习交流,如色觉和性别度数、频
14、度、边缘度数、边缘频度、条件频度、条件频度的数列如下: 49、PPT学习交流、列表分析的基本问题是,明确所考察的各属性间是否有关联,即是否独立。 如前例所述,问题是一个人的色盲是否与性别有关,一般采用k .皮尔逊的适应度检定(简称凯方检定) SPSS分析例,观察吸烟和健康状况. sav,50,PPT学习交流,首先对人数进行加权处理,按顺序点击分析统计弹出窗口中按行和列选择吸烟和健康状况: 51、PPT学习交流、按统计量选择卡方检验和依存系数、52 PPT学习交流、按小区选择观察值、53、PPT学习交流、其他不变、默认设定,点确定、计算结果出来、54、PPT学习交流、 卡方检定结果:皮尔逊卡方同行概率P=0.006,小于0.01,显着差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 探寻尿膀胱肿瘤抗原:在膀胱癌表达的意义与检测影响因素的深度剖析
- 2026年内蒙古科技职业学院单招职业倾向性考试题库及一套答案详解
- 2026年北海康养职业学院单招综合素质考试题库带答案详解(培优)
- 2026年南京旅游职业学院单招综合素质考试题库及答案详解(历年真题)
- 2026年保定幼儿师范高等专科学校单招职业倾向性考试题库带答案详解(黄金题型)
- 2026年内蒙古民族幼儿师范高等专科学校单招职业倾向性测试题库(含答案详解)
- 公司绩效考核制度办法
- 原物料供应商考核制度
- 酒业公司销售考核制度
- 德育工作自评考核制度
- 房地产市场报告-印度尼西亚经济及地产市场简介 202411
- 《七律二首 送瘟神》教案- 2023-2024学年高教版(2023)中职语文职业模块
- NB∕T 32015-2013 分布式电源接入配电网技术规定
- 环境微生物学教学课件-绪论-环境工程微生物学
- 郑州大学结构力学
- DB15T 557-2013人工灌木林主要树种平茬复壮技术规程
- 人教小学数学四年级下册第二单元第3课时《单元综合复习》示范公开课PPT教学课件
- 暗挖电力隧道工程安全专项监理实施细则
- 2015年9月26日雅思阅读考情回顾
- JJG 814-2015自动电位滴定仪
- 诊断学完整教案
评论
0/150
提交评论