




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章描述统计 1 31 第八章描述统计的原理与应用 DataGraphing 第八章描述统计 2 31 课程目标 介绍描述统计的原理了解集中量数的特性与各量数了解变异量数的特性与各量数了解相对量数的特性与各量数了解标准分数的特性与各量数熟习描述统计的SPSS运作 第八章描述统计 3 31 描述统计 描述统计的定义一套用以整理 描述 解释资料的系统方法与统计技术数据从初始状态 rawdata 成为可被理解的统计量数 statistic 的一套操作程序透过统计量数来描述大量资料 并作为彼此沟通的共同符号语言 第一节 第八章描述统计 4 31 集中量数 集中量数 measuresofcentrallocation 用以描述一组数据或一个分配集中点的统计量数一个能够描述数据的共同落点的指标 常用的集中量数有平均数 中位数及众数 第一节 第八章描述统计 5 31 平均数 平均数 mean 以M表示 取某一变项的所有数值的总和除以观察值个数所得到的值因为是将数据直接以数学算式来计算平均值 又称为算术平均数 arithmeticmean 母体资料得出的平均数需以希腊字 表示 第一节 第八章描述统计 6 31 中位数 中位数 median 或以Mdn表示 又称为中数 百分等级为50的百分位数 P50 或第二四分位数 Q2 secondquartile 将某一个变项的数据依大至小或由小至大排列 取位居最中间 或能够均匀对分全体观察值的分数在中位数之上与之下 各有50 的观察值 50 55 60 60 60 65 66 70 90 50 55 60 60 60 65 66 70 90 95 62 5 第一节 第八章描述统计 7 31 众数 众数 mode 或以Mo表示 一组分数中 出现次数最多的一个分数一组数据中最典型 typical 的数值或次数分配最高点所对应的分数是各集中量数当中 最容易辨认的量数一个分配有两个分数具有相同的最高次数 此时即出现了双众数 称为双峰分配 bimodaldistribution 50 55 60 60 60 65 66 70 90 第一节 第八章描述统计 8 31 集中量数的特性与优缺点比较 第一节 第八章描述统计 9 31 三种集中量数与分配形状的关系 第一节 第八章描述统计 10 31 变异量数 变异量数 measuresofvariation 或离散量数用来描述观察值在某一个变项上的分数分散情形的统计量描述统计中 集中量数必须搭配变异量数 才能反应一组数据的分布特征常用的变异量数包括全距 四分差 变异数及标准差 第二节 第八章描述统计 11 31 全距 全距 range 一组分数中最大值 Xmax 与最小值 Xmin 之差是一群分数变异情形最粗略的指标全距容易计算 适用性高 可以应用在名义变项与顺序变项 来求出变项当中类别的多寡 缺点是不精确也不稳定 无法反应一个分配的每个数值的状态 第二节 第八章描述统计 12 31 四分差 四分差 semi interquartilerange QR 是一组数据当中的第三四分位数 区隔高分端的前25 的分数 简称Q3 与第一四分位数 区隔低分端的后25 的分数 简称Q1 距离的一半中间百分之五十的样本分数差距的二分之一 第二节 第八章描述统计 13 31 离均差与平方和 离均差一组数据中 各分数与平均数的距离 通常以小写的x来表示当离均差为正值时 表示分数落在平均数的右方离均差为负值时 表示分数落在平均数的左方平均数是每一个分数加总后的平均值 为一组分数的重心位置离均差平方和 sumofsquares SS SS的概念可以类比为面积的概念 表示分数与平均数变异的面积和 deviationscore x X 第二节 第八章描述统计 14 31 变异数与标准差 变异数平均化的离均差平方和标准差变异数的开方 以 表示 标准差或变异数越大者 表示该分配的变异情形较大 第二节 第八章描述统计 15 31 变异数的不偏估计数 标准差与变异数的不偏估计数的主要差别在于分母项为N 1而非原来的NN 1称为自由度 degreeoffreedom df 表示一组分数当中 可以自由变动的分数的个数 在离均差的计算上 自由度为样本数减1 表示在N个观察值中 只有N 1个数字可以自由运用于离均差的计算 第二节 第八章描述统计 16 31 变异量数的特性与优缺点比较 第二节 第八章描述统计 17 31 偏态 Skewness 描述一个变项的对称性 symmetry 的量数称为偏态系数不对称的资料称为偏态资料 依其方向可分为负偏 negativelyskewed 或左偏 即左侧具有偏离值 正偏 positivelyskewed 或右偏 即右侧具有偏离值 与对称 symmetrical 三种情形 第三节 第八章描述统计 18 31 地板与天花板效应 地板效应 flooreffect 指数据多数集中在偏低的一端 但在高分端则有极端值 分数不容易突破低分端 但会往高分端延伸 彷彿有一个地板 或真的存在一个低分限制条件 阻挡了数据往低分移动 由于地板阻隔作用 地板效应常伴随正偏态现象 天花板效应 ceilingeffect 则与负偏态有关 是指数据多数集中在偏高的一端 但在低分端则有极端值 分数不容易突破高分端 彷彿有一个天花板 或真的存在一个高分限制条件 阻挡了数据往高分移动 第三节 第八章描述统计 19 31 峰度 Kurtosis 是指一个次数分配集中部份的陡峭程度 两个分配都是对称的单峰钟型曲线时 并不一定具有一样的平坦或陡峭形态 峰度 一个对称的钟型分配 变项的数值会集中于众数所在位置 如果集中于众数附近的分数多 分散于两侧的分数少 将形成高狭峰 leptokurtic 的分配当集中于众数附近的分数较少 两侧分数多 则形成低阔峰 platykurtic 在常态分配时的理想峰度称为常态峰 mesokurtic 第三节 第八章描述统计 20 31 偏态与峰度系数的特性 偏态与峰度系数是一种标准分数的概念 因此不受分配变异程度的影响而可相互比较偏态与峰度系数具有标准分数的特性 因此均以0为常态值 也就是说 当偏态与峰度系数为0或接近0之时 次数分配可以说是一个对称 不偏的常态峰分配偏态与峰度系数在正负0 5到1之间是为偏态或特殊峰度 超过正负1的偏态与特殊峰度情况即属严重 严重的偏态与峰度会影响统计分析的运用 第三节 第八章描述统计 21 31 偏态与峰度系数的统计考验 检定原理求出偏态与峰度系数系数可利用Z考验来判定统计显著性Z值绝对值大于1 96时 设定为 05 即可推论S系数或K系数显著不等于0 也就是变项呈现非常态 常态化假设遭到违反 第三节 第八章描述统计 22 31 相对量数 数据的解读 绝对意义 由数值大小反应相对意义 需从相对比较 甚至于进行变项数据的标准化 才能对于数据的意义进行正确解读 相对量数或相对地位量数 measuresofrelativeposition 描述个别观察值在团体中所在相对位置的统计量将某特定观察值在样本中所处的位置 以其他分数进行参照 计算出观察值在该变项上分数的团体地位 位置 常用的相对量数包括百分等级 百分位数 标准分数 第四节 第八章描述统计 23 31 百分等级与百分位数 百分等级 percentilerank PR 系指观察值在变项上的分数在团体中所在的等级在一百个人中 该分数可以排在第几个等级 例如PR 50代表某一个分数在团体中可以胜过50 的人 他的分数也恰好是中位数 百分位数 percentilepoint Pp 系指在样本中位居某一个等级的观察值之分数若想在一百个人的样本中赢过多少百分之多少的人 则他的分数必须得到多少分例如中位数为60分时 表示有50 的人比60分还低 此时我们可以说第50百分位数为60分 以P50 60表示之 两者的数学关系百分等级是将原始分数转化为等级 百分比 百分位数则是由某一等级来推算原始分数 第四节 第八章描述统计 24 31 百分等级与百分位数的计算 样本数少时将资料依序排列 算出累积百分比 即可对应出每一分数的百分等级亦可从百分等级推算出各特定百分位数样本数大时百分等级的计算必须以分组资料的方式来整理资料百分等级的换算 必须以公式来计算之 第四节 第八章描述统计 25 31 标准分数 标准分数 standardscores 利用线性转换的原理 将一组数据转换成不具有实质的单位与集中性的标准化分数 不同的标准分数 其共通点是利用一个线性方程式y bx a进行集中点的平移与重新单位化 使得不同量尺与不同变项的测量数据具有相同的单位与相同的集中点 因此得以相互比较 常用的标准分数Z分数T分数 T 10Z 50 SAT考试 ScholasticAssessmentTest SAT 100Z 500 比西测验IQ分数 平均数为100 标准差为16的标准分数 IQ 16Z 100 魏氏智力测验为15Z 100 第五节 第八章描述统计 26 31 Z分数 定义指原始分数减去其平均数 再除以标准差后所得到的新分数表示该原始分数是落在平均数以上或以下几个标准差的位置上Z分数的特性任何一组数据经过Z公式转换后 均具有平均数为0 标准差为1的特性Z分数可以作分配内与跨分配的比较 Z分数仅是将原始分数进行线性转换 并未改变各分数的相对关系与距离 因此Z分数转换并不会改变分配的形状 以母体资料为基础时 以样本资料为基础时 第五节 第八章描述统计 27 31 常态分配 常态分配 normaldistribution 指一个随机变项的观察值 呈现对称的钟形曲线分配由德国数学家Gauss KarlF Gauss 1777 1855 所提出 因此又称为高斯分配 Gaussiandistribution 第五节 第八章描述统计 28 31 常态分配的特性 常态曲线并没有两端点极限值当x 时 函数值f x 达到最高点当x趋近无限大时 函数值f x 则趋近为0机率分配常态曲线内的机率变化呈现数学规则分配内绝大多数的机率 99 7 落于正负3个标准差之内一般来说 常态化的分配全距约为6个标准差反曲点 inflectionpoints 距离平均数负一个标准差位置上 切线斜率由渐增转为渐减在距离平均数正一个标准差位置上 切线斜率由渐减转为渐增 第五节 第八章描述统计 29 31 标准化常态分配与其应用 标准化常态分配 standardnormaldistribution 某一变项的观察值呈现常态分配 经转换后的Z分数所形成的分配称之常态分配的变量X已经不是原始分数 而是Z分数Z分数是距离平均数几个标准差的量数 不同的Z值 即代表距离平均值多少个标准差 透过机率对照表 可以很快的查出Z值与机率间的关系在常态分配中68 26 的观察值落在Z值 1个标准差 的区间内9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年文化产业与市场营销专业考试试题及答案
- 2025年图书馆与信息管理职业能力测试试题及答案
- 2025年统计师职业资格考试试卷及答案
- 2025年室内设计与装饰艺术试卷及答案
- 2025年市场调查专业研究生入学考试卷及答案
- 2025年声音与音乐治疗技术相关考试试卷及答案
- DSPE-PEG2000-GRGDS-生命科学试剂-MCE
- 2025年全国公务员考试题及答案
- 2025年农业经济与国家政策考试试题及答案
- 2025年生态环境专业期末测评考试试卷及答案
- 租房学位合同协议书范本
- JG/T 368-2012钢筋桁架楼承板
- 2025年环境科学与可持续发展综合素质评估测试题及答案
- 视频编辑考试试题及答案
- solidworks考试试题及答案
- 合肥市公安局招聘警务辅助人员考试真题2024
- 康复科建设可行性方案
- 2025年吉林省时事政治考试试卷带解析及答案(必背)
- 医院信息安全法律培训计划
- 2025国家开放大学《人类发展与环境保护》形成性考核123答案+终结性考试答
- 2025至2030年中国环氧改性硅油行业投资前景及策略咨询研究报告
评论
0/150
提交评论