版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 描述统计,单变量的统计分析,描述统计 推论统计,常用单变量描述统计,频数/频率分布 集中趋势分析 离散趋势分析,频数分布,频数分布(frequency distribution),指一组数据中取不同值的个案的次数分布情况 频率分布(percentages distribution),一组数据中不同取值的频数对于总数的比率分布情况,利用变量的频数分布分析可以方便的对数据按组进行归类整理,形成各观测量的不同水平(分组)的频数分布情况表和图形,以便对数值的数量特征和内部结构状况有一个概括的认识。,SPSS次数分布表的实现 简单次数分布表: Analyze-Descriptive Statis
2、ticsFrequencies 选入所需变量 选中display frequency tables复选项,次数/频次,相对次数,累积次数,集中趋势分析,集中趋势(central tendency analysis) 指用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。 常用统计量: 算术平均数(均值) 中数 众数,平均数(mean)使用最多 总体各单位数值之和除以总体单位数目所得之商 Xn,某大学100名学生勤工助学收入的分布,算术平均数的特点 在一组中每个变量与平均数之差的总和等于0 在一组数据中,每一个数都加上一常数c,则所得平均数为原来的平均数加常数
3、C 在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C,平均数的优缺点 优点: 反应灵敏 计算严密 计算简单 简明易解 适合于于进一步用代数方法演算 较少抽样变动的影响 缺点: 易受极端数据影响 若出现模糊不清的数据时,无法计算平均数,众数(mode):一组数据中出现次数最多(即频数最高)的那个数值,某大学100名学生勤工助学收入的分布,中位数(median):把一组数据按值的大小顺序排列起来,处于中央位置的数值,某大学100名学生勤工助学收入的分布,比较,平均值对数据总体的描述和反应,一般比中位数更加全面和准确 平均数易受极端值变化的影响 稳定性:同样方式多次抽样,
4、平均值之间的差别,往往小于中位数的差别,注意,只有连续变量(定距或定比变量)才可以计算中位数和均值,离散趋势分析,离散趋势分析(dispersion tendency analysis):用一个特别的数值来反映一组数据相互之间的离散程度 对集中量数(平均数、众数、中位数)的代表性作出补充说明 从不同侧面描述和揭示一组数据的分布情况,反映资料的全面特征,举例:,某校三个系各选五名同学参加智力竞赛,成绩如下 A系:78,79,80,81,82 B系:65,72,80,88,95 C系:35,78,89,98,100,常用离散趋势分析统计量,全距(range) 方差 标准差 四分位差 异众比率,全距
5、(range),又称极差,是一组数据中最大值与最小值之差 全距越大,离散程度较大,则集中量数的代表性越低 仅仅依靠两个极端值,偶然性大,方差(variance)S2,2 变异数、均方,标准差(Standard deviation),方差的平方根,s或SD,,意义 方差和标准差是最常用的差异量数 表示离散程度的最好指标 反应灵敏、计算公式严密确定、容易计算、适合代数运算、受抽样变动影响小,异众比率(variation ratio),一组数据中非众数的次数相对于总体全部单位的比率,某年级学生的年龄,四分位差(interquartile range), 先将一组数据按大小排列成序,然后将其四等分,去
6、掉序列中最高的1/4和最低的1/4后,中间的一半数值之间的全距 年龄:17,18,18,19,19,20,20,21,21,22,22,离散系数(coefficient of variation),也称变差系数,标准差与平均数的比值 是一种相对的离散量数统计量 可对同一总体的不同变量的离散程度进行比较(人均收入,住房情况) 或对不同总体同一统计量进行比较(不同城市收入比较),SPSS集中量数的实现,Analyze-Descriptive StatisticsFrequencies 选入所需变量 Statistics 勾选,SPSS差异量数的实现,Analyze-Descriptive Stat
7、isticsFrequencies 选入所需变量 Statistics 勾选,练习 用数据文件 分析不同性别的职业频次(employment category) 计算不同性别的平均收入水平(current salary) 分别计算不同性别收入的平均数、中数、标准差、全距 (演示),单变量推论统计,区间估计 假设检验,区间估计:在一定的可信度(置信水平下),用样本统计值的某个范围(置信区间)来“框”住总体的参数值 假设检验:先对总体的某一参数作出假设,然后用样本的统计量去进行验证,以决定假设是否为总体所接受,双变量分析,相关关系 因果关系,相关分析,相关关系(correlation)指的是当其中
8、一个变量发生变化时(或取值不同时),另一个变量也随之发生变化(取值也不同) E.g. 收入水平-消费观念 相关关系的方向:对于定序以上层次的变量来说,变量与变量之间的关系分为正关系与负关系 E.g. 文化程度-收入水平;经济水平-家庭平均子女数目 相关关系的类型:直线相关,曲线相关 散点图(仅适用于定距以上层次的变量),相关分析,相关关系的强度:变量之间相关程度的强弱或大小 可用相关系数进行测量 相关关系的推论 要根据样本的资料推论两个变量在总体中是否相关,须进行相应检验 注意这里关心的已不是样本的结果,而是总体的情形;并且,关心的也不是相关程度的大小,而只是是否相关,注意,选择何种相关测量方法和何种检验方法,需要看两变量的测量层次,实例:双变量相关分析,因果关系,因果关系:两变量,当其中一个变量变化时(取不同的值时),会引起或导致另一个变量也随之发生变化(取值也不同);但反过来,当后一变量变化时,却不会引起前一变量的变化。 相关关系-因果关系 的关系 两变量相关,未必因果 两变量因果,必定相关,因果关系的条件,变量x与y之间存在不对称的相关关系 变量x与y在发生顺序上有先后之别 变量x与y的关系不是同源于第三个变量的影响,回归分析,回归分析(regression analysis
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈阳体育学院《中国民间音乐概述》2025-2026学年期末试卷
- 朔州陶瓷职业技术学院《口腔材料学》2025-2026学年期末试卷
- 上海应用技术大学《商法》2025-2026学年期末试卷
- 上海健康医学院《高分子化学》2025-2026学年期末试卷
- 苏州大学《幼儿社会教育与活动指导》2025-2026学年期末试卷
- 上海外国语大学贤达经济人文学院《人体运动基础》2025-2026学年期末试卷
- 沈阳建筑大学《中国近代文学史》2025-2026学年期末试卷
- 上海东海职业技术学院《临床麻醉学》2025-2026学年期末试卷
- 电力法律顾问合同审核考试题目及答案
- 贸易数据申报师岗前安全知识竞赛考核试卷含答案
- 八年级下册道德与法治第四课《公民义务》核心素养教学设计
- 2026届湖北省襄阳市高二下生物期末调研试题含解析
- 2026年3月山东济南轨道交通集团运营有限公司社会招聘备考题库含答案详解(完整版)
- 2026年初级社工考试题库及答案
- 借用营业执照协议书样板
- 毒麻精神药品培训
- 农村人饮供水课件
- 2025年五类人员选拔考试试题及答案
- 新22J01 工程做法图集
- 电工知识培训课件
- 托业考试Toeic考题(含参考答案)
评论
0/150
提交评论