SimSTAT-用SAS作统计分析基本概念和方法浏览.ppt_第1页
SimSTAT-用SAS作统计分析基本概念和方法浏览.ppt_第2页
SimSTAT-用SAS作统计分析基本概念和方法浏览.ppt_第3页
SimSTAT-用SAS作统计分析基本概念和方法浏览.ppt_第4页
SimSTAT-用SAS作统计分析基本概念和方法浏览.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 用SAS作统计分析 SASInstitute Shanghai Co Ltd 基本概念和方法浏览 2 统计的作用 对数据作出概要的描述基于数据作出推断 包括评价推断的有效性 3 SAS系统提供有力的统计分析功能 BaseSAS和SAS GRAPH包含常规的分析功能SAS有专用于各种分析功能的模块STAT QC ETS ORINSIGHT LAB ASSISTIMLSAS将其分析功能与其数据管理功能结合成强大的决策支持系统 4 SAS分析的特点 SAS将常用的统计方法用程序实现 是一个高品位的程序系统SAS是一个迅速发展的系统 融入最新的方法 不断适应用户的新需求SAS既可由编程也可用图形界面交互式地实现分析功能SAS将各种专门分析方法融入为用户提供的直接使用的专用系统中 5 了解学习SAS的分析决策功能 会找 针对问题和数据选用合适的分析工具会用 选PROC 选Option 写Statement会解释 对SAS提供的计算结果给出解释和分析 6 总体 母体Population 关心的对象全体关心对象的某些指标 Variable Var1 Var2 Varn总体的分布 这些变量取什麽值 各占多大比例总体的分布的特征 均值 方差 及其他参数 抽样 7 样本 子样Sample 样本 取自总体的若干 有代表性 的个体 计算统计量 8 统计量 Statistics 子样总体描述推断统计量 由样本运算而得到的量 均值 方差中位数 极差直方图 经验分布统计量能集中样本某一方面的信息 9 统计模型 母体 分布及其它特征 抽样 子样 分布及其它特征 计算统计量 统计量 描述 推断 10 统计模型 参数是总体的特征 统计量是由样本观测值计算而得到的 统计量可用于估计总体的参数 11 抽样的随机性 总体 子样 子样 子样 子样 子样 对同一个总体可以获得多个不同的样本 这些样本的观测值不全相同 相应的统计量也不一样 这是由抽样偶然性引起的但当样本的容量增大时 不同样本间的差异逐渐缩小 这是统计的规律性 rannor2 原数据rannor1 12 抽样的随机性 13 抽样的随机性 14 抽样的随机性 15 抽样的随机性 16 抽样的随机性 17 抽样的随机性 18 用SAS作常规统计的几种常用做法 用SAS作常规统计分析 在交互式运行方式下常用的做法有 用编程实现各种任务用SAS提供的菜单系统实现各种任务用SAS ASSIST用STATISTICALANALYST发命令analyst用SAS INSIGHT发命令insight 19 SAS INSIGHT 是一个可视化的数据探索工具 将统计方法与交互式地图形显示融合在一起随时为用户提供数据 图形和分析结果三方面的内容 便于用户发现奇异数据及包含在数据中的模式或规律 探索性地使用各种统计分析方法并观察分析结果 它为用户提供一种全新的使用统计分析方法的环境 20 SAS INSIGHT 如何在SAS系统中进入SAS INSIGHT键入命令INSIGHT用下拉菜单Globals Analyze Interactivedataanalysis通过SAS ASSIST或提交Procinsight 21 SAS INSIGHT 在SAS INSIGHT中 变量按其测量水平分为 区间型的 Interval 列名型的 Nominal 以连续变化尺度测量具有可进行分析的数值 有数值或字符值用于作分类变量 数值型字符型 区间型列名型 22 SAS INSIGHT对数据集的操作 在SAS INSIGHT中 可对SAS数据集进行数据输入和浏览修改测量水平移动变量显示次序建立新的变量按某个变量的值进行排序选取子集 23 AnalystApplication 分析员应用 AnalystApplication 是在SAS系统中进行基本统计分析菜单界面系统它将常用的统计方法按描述统计 表分析 假设检验 方差分析和回归分析等栏目提供菜单 也有制图和建表的功能菜单它对所进行的每项分析都提供按菜单设定的要求自动生成的程序它对分析的过程和结果建立项目并进行管理 24 AnalystApplication 在SAS中进入Analyst 键入命令ANALYST用下拉菜单Globals Analyze StatisticalAnalysis 25 AnalystApplication 在Analyst中 可对SAS数据集进行数据输入和浏览移动变量显示次序建立新的变量按某个变量的值进行排序选取子集转置数据集 26 变量取值的宏观描述 分布全面地描述了变量取值的概况分布 变量取什麽值 各占多少比例字符型变量 用表列举其取值和比例或用柱状图 拼花图 Mosaic 27 变量取值的宏观描述 连续变化数值型变量 用表列举其在各个范围取值的比例 用直方图 Box图或次序统计量 经验分布图 28 SAS INSIGHT数据取值频数的描述 柱状图与直方图 Barchart Histogram Analyze Histogram Barchart Y 频数表 Analyze Distribution Y Output FrequencyTable 29 Analyst数据取值频数的描述 Statistics Descriptive FrequencyCounts 30 变量取值特征的描述 运用各种统计量描述变量取值的不同特征均值 中位数描述变量取值的中心位置方差 极差描述变量取值的离散程度次序统计量也可描述变量取值的分布 31 次序统计量 样本 Sample 次序统计量 OrderStatistics 4 3 11 3 15 8 1 3 3 4 5 8 11 32 描述数据中心位置的统计量 样本观测值 4 3 11 3 1 5 8 33 描述数据离散程度的统计量 34 描述数据离散程度的统计量 样本观测值 4 3 11 3 1 5 8 35 与均值方差有关的统计量 标准差 StdDev 标准误 StdError 变异系数 CV 未校平方和 USS 校正平方和 CSS 36 偏度 Skewness 偏度 Skewness 精确地 0 0 0 37 峰度 Kurtosis 峰度 Kurtosis 精确地 0 0 0 0 0 38 分位数 Quantile 0 4分位数 39 分位数 Quantile p分位数 附近的一个数 小于p 分位点的样本数约占样本总数的100p 0 5 分位数即中位数 0 25 分位数称下四分位数 0 75 分位数称上四分位数 样本观测值 4 3 11 3 1 5 8 1 3 3 4 5 8 11 4 3 8 40 SAS INSIGHT数据的图形描述 盒须图 41 SAS INSIGHT与Analyst生成描述统计量 Insight生成描述性统计量 Analyze Distribution Y Analyst生成描述性统计量 Statistics Descriptive SummaryStatistics 或 Distributions 42 变量取值的宏观描述 对母体和样本都可考虑它们各自的分布 样本直方图 总体分布密度 样本经验分布 总体累计分布 43 中心极限定理 44 标准正态分布密度 45 对数正态分布 46 Weibull分布 47 SAS INSIGHT分布拟合 直方图 Graphs 拟合分布密度 Curves 经验分布 Curves 拟合累计分布 Curves QQ图 Graphs 参照线 Curves 非正态参数分布的拟合 Curves ParametricDensity 非参数分布密度拟合 Curves Kernel 由Analyze Distribution Y 进入后 48 Q Q图 49 Analyst直方图与分布拟合 Statistics Descriptive Distributions 50 方差分析 AnalysisofVariance 对多个均值进行统计推断通常使用方差分析方差分析是分析试验结果数据的重要方法 51 方差分析 AnalysisofVariance 在方差分析中 连续应变量 记录在各种条件下的观测结果若干个分类变量 设定观测条件 也称独立变量 分类变量可表示固定效因或随机效因分类变量的不同值又称为水平 52 方差分析 ANOVA 方差分析将观测到的应变量的变差分解为属于不同分类变量的和随机误差进行分析 53 方差分析 ANOVA 54 方差分析 ANOVA 自由度分解 方差分解 55 方差分析 ANOVA 方差分解与检验TotalSS SS 因素A ResidualSSTotalDF DF A ResidualDFMS SS DF F MS ResidualMS 56 方差分析数据要求 使用SAS进行方差分析时要求每条记录为一次观测的结果 不同因素或水平下因变量的观测值都记用同一个变量表示 57 方差分析SAS INSIGHT 单因素方差分析图形表现 Analysis Boxplot Y 区间型因变量 X 列名型独立变量 方差分析计算 Analysis Fit X Y Y 区间型因变量 X 列名型独立变量 58 方差分析Analyst 59 变量的相关关系 散点图是直观地观察连续变化变量间相依关系的重要工具 Insight AnalyzeScatterplot YX 或Multivariate Y s 编程 procgplot Analyst GraphsScatterplot 60 变量的相关关系 用直线描述 用曲线描述 可能有周期变化 无明显关系 61 相关系数 CorrelationCoef 线性联系是描述变量联系中最简单和最常用的一种 Y a1x1 a2x2 b 相关系数是描述两个变量间线性联系程度的统计指标相关系数的计算公式 62 相关系数 CorrelationCoef 正相关 一个变量数值增加时另一个变量也增加 负相关 一个变量数值增加时另一个变量减少 63 相关系数 CorrelationCoef 强相关并不表示存在因果关系 弱相关并不表示变量间不存在关系 个别极端数据可能影响相关系数 64 相关系数的计算SAS INSIGHT Analyze Multivariate Y s Output Corr 在多变量分析窗中 由下拉菜单Tables Corr 在散点图上加置信椭圆认识相关大小Curves ConfidenceEllipse Prediction 65 相关系数的计算Analyst Statistics Descriptive Correlations 66 相关与回归 相关分析量化连续变化变量间线性相关的强度回归分析确定一个连续变量与另一些连续变量间的关系 67 回归 Regression 描述一个变量与另一些变量间统计联系的关系式 Y f x1 x2 xm 用于解释和预测 确定回归 确定变量 Y与那些x1 x2 xm有关选择形式 Y与x1 x2 xm以什麽形式相联系 即f的表示式确定系数 确定Y a1x1 a2x1x2 a3x12 中的ai 68 回归的简单线性模型 Yi b0 b1xi eii 1 2 nYi 因变量的第i次观测值xi 自变量的第i次观测值b0 b1 待估计的未知参数ei 余差 residual相互独立 正态分布 零均值 同方差 一般的 Yi b0 b1x1i b2x2i bpxpi ei 69 回归的简单线性模型 70 回归的简单线性模型 71 线性回归的拟合 72 最小二乘法估计 LSE 73 回归的方差分解 总变异 回归阐明部分 回归未阐明部分 74 回归的方差分解 75 回归的方差分解 76 回归的假设检验 原假设 简单线性模型拟合数据不比基线模型好b1 0 r 0 b1 小 SS Model 小备选假设 简单线性模型拟合数据比基线模型好b10 r0 b1 不为零 SS Model 大 77 78 预测值与置信限 79 回归分析计算Analyst Analyst StatisticsRegression Simple 80 变量的测量水平名义型 Nominal 变量的值之间无逻辑次序可按任何次序排序编码 变量 饮料的种类 81 变量的测量水平有序型的 Ordinal 变量 饮料杯的型号 小 中 大 有序变量的值有明确的逻辑次序 但各个值之间的距离并不清楚 82 变量的测量水平连续型的 Continuous 变量 饮料的体积 连续型变量的值有逻辑次序 且它们之间的距离也是有意义的 83 变量的类型属性的与连续的 属性变量是指其测量结果只能取到较少的不同的值 通常用以表示对象的分类属性 与属性变量对立的是连续性变量名义型的 有序的和连续型变量当它们可能取到的数值较少时 可作为属性变量处理 84 属性变量取值的频数统计 对属性变量最基本的统计特征就是它可能取到的不同数值和取各个不同数值的概率 频率 85 属性变量取值的频数统计 Insight Distribution Y Frequency

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论