绪论定量资料描述.ppt_第1页
绪论定量资料描述.ppt_第2页
绪论定量资料描述.ppt_第3页
绪论定量资料描述.ppt_第4页
绪论定量资料描述.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概论 1 总体 总体是根据研究目的确定的同质观察单位的全体 更确切地说 是同质的所有观察单位某种变量值的集合 2 样本 样本是从总体中随机抽取部分观察单位 其实测值的集合 所谓随机抽取亦就是总体中每一个观察单位都有同等可能性被抽到 随机抽样的目的是为了减少偏性 使样本对总体有代表性 在实际工作中经常从总体中抽取样本 目的是用样本信息来推断总体特征 即统计推断 3 概率 概率是描述随机事件发生的可能性大小的数值 常用P表示 所谓随机事件 亦就是在一定条件下 可能发生也可能不发生的事件 随机事件的概率在0与1之间 即0 P 1 常用小数或百分数表示 P越接近1 表明某事件发生的可能性越大 P越接近0 表示某事件发生的可能性越小 小概率事件 当一个事件的概率P 0 05或P 0 01时 称为小概率事件 小概率事件表示某事件发生的可能性很小 在一次试验中基本上是不会发生的 4 资料的类型 1 数值变量又称为定量资料或计量资料 其变量值是定量的 表现为数值大小 一般有度量衡单位 2 分类变量又称为定性资料 其变量值是定性的 表现为互不相容的类别或属性 有两种情况 无序分类包括变量值取无等级顺序的二项分类或多项分类 有序分类又称为等级资料 各类之间有程度的差别 给人以 半定量 的概念 即定性变量的变量值取有等级顺序的几类 5 误差 1 抽样误差是由于抽样原因引起的样本指标与总体指标间的差别 2 随机测量误差 3 系统误差 4 过失误差抽样误差和随机测量误差是不能避免的 但可控制 系统误差和过失误差是可以避免的 6 统计工作的基本步骤 1 设计 2 搜集资料 3 整理资料 4 分析资料 定量资料的统计描述 一 频率分布表与频率分布图 二 描述集中趋势的统计指标 三 描述离散趋势的统计指标 一 定量频数表的编制 1 求极差 全距 最大值 最小值 4 2 2 5 1 72 求组距 i 初定组数 10i 极差 组数 1 7 10 0 17 0 2 3 分组段原则 第一组段包括最小值 最后组段包括最大值 每一组段都有上限和下限下限 组段的起点 最小值 上限 组段的终点 最大值 频数表的用途 1 揭示资料的分布特征和分布类型2 便于进一步计算指标和统计分析3 便于发现特大或特小的可疑值 对称分布偏态分布 正偏态 负偏态 二 频数分布图 一 分布类型正态分布 集中位置居中 左右两侧频数基本对称的分布 常见近似正态分布 偏态分布 集中位置偏向一侧 频数分布不对称的分布 特点 有极端的数据 二 统计描述 统计描述包括两个方面 集中趋势的描述和离散趋势的描述 跟总体有关的叫参数 希腊字母表示 跟样本有关的叫统计量 用英文字母表示集中趋势指标 均数 几何均数 中位数离散趋势指标 一 集中趋势指标描述1 算术均数 均数mean 适用于正态分布或者近似正态分布总体均数 样本均数 2 几何均数 geometricmean 常适用于一种特殊的偏态分布资料 等比资料 如10 20 40 80 或对数正态分布资料 常见于抗体滴度 原始数据是偏态 原始数据取了对数之后 对数值成为正态分布 3 中位数 median M 主要适用于偏态分布资料 中位数是指将一组变量值从小到大排列 位次居中的变量值 描述偏态的是中位数和几何均数 注意事项对于偏态分布资料 中位数不受两端特大值和特小值的影响 只和位置居中的观察值有关 而均数受特大值和特小值的影响 会偏大或者偏小 所以对于偏态分布的资料 均数的代表性差 不适合描述偏态分布的集中趋势 二 离散趋势指标描述 1 极差或者全距 range R 表示一组变量值中最大值和最小值之差 R 最大值 最小值计算简单 但是不能反映所有变量值的变异程度 2 标准差 standarddeviation 和均数的单位一致 表示一组变量值的平均离散程度 适合描述近似正态分布资料的离散趋势 标准差 均数 原始数据三者单位一致 样本标准差等于离均差平方和除以样本量n 1再开方样本标准差表示样本的平均变异程度 这个公式有比较好的统计性质公式应该背下来 3 方差 variance 是标准差的平方 表示一组变量值的平均离散程度 方差越大 离散程度越大 方差是最常用的指标 4 变异系数 coefficientofvariation CV CV 单位不同 均数相差悬殊S 单位相同 均数相近才能用标准差比较例子 体重和身高相比较 单位不一样 标准差的大小也变了 所以单位不一样 没有可比性 比如身高单位是米 厘米 毫米 比较结果是不一样的例子二 婴儿和成人的体重的比较 用标准差的话 本来二者均数就不在一个水平线上 即均数不一样 就算单位相同也没有可比性 用变异系数的话 除以了均数 抵消了它的区别 5 四分位数间距 quartileinterval Q P75 P25分别表示第75百分位数和第25百分位数 P75

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论