版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SAS统计软件及其应用 INSIGHT 模块,山西大学计算中心,建立SAS数据集,在编辑窗口中编辑程序来建立一个数据集 利用VIEWTABLE新建数据集 将其他格式的数据文件导入数据集 利用SAS ASSIST创建数据集 利用INSIGHT建立数据集,利用VIEWTABLE新建数据集,在SAS资源管理器窗口中,打开希望存储新建数据集的数据库。在这一栏中单击鼠标右键,在菜单中选择“新建”按钮。 弹出新建类型窗口,选择“表”,单击确定,就产生了一空表格。 向表中输入变量名称,属性,数据,将其他格式的数据文件导入数据集,SAS系统可以转换的标准格式的数据文件包括:,利用SAS ASSIST创建数据集
2、,单击“解决方案”菜单下的ASSIST选项,启动SAS ASSIST模块。 单击“继续” 选择“Data Mgmt”,Create data选项。 数据输入,目的和要求,掌握两个菜单功能(视窗操作) INSIGHT ANALYST 会使用基本的SAS过程(语言程序) Printsortmeansunivariate FreqCorrgplotgchart 会一些简单的SAS统计分析 Reg Arima Test Anova Princomp Cluster,介绍,SAS INSIGHT 模块是SAS系统中最常用的一个模块,利用它可以实现对数据的探索性分析. 所谓探索性分析,就是对数据分布情况一
3、无所知情况下,首先通过绘制数据的统计图表,对它的属性有一个大致的了解,然后通过各种统计分析的计算得到较为精确的分布.因为整个过程是从未知到已知,逐步摸索的过程,所以就称为对数据的探索性分析.,SAS INSIGHT 模块功能非常强大,几乎包含了常用的统计分析工具。它的主要功能包括一维数据探索,二维数据探索,三维数据探索,分布检验,曲线拟合,多变量回归,方差分析,相关系数检验,主成分计算,绘制各种图形,多元统计分析等等。,SAS INSIGHT 启动,启动INSIGHT模块有三种方法: 1. 从菜单启动 2. 在命令框内输入Insight 3. 在程序编辑窗口输入程序,然后Submit. pro
4、c insight; run;,INSIGHT菜单功能,全称交互式数据分析 Interactive data analysis 启动INSIGHT模块后,打开一个数据集,就可以看到它的窗口界面.,一维数据探索,对于一维数据,怎样用此模块来作直方图,盒形图与马赛克图. 例子: 德国某城市在一周内的空气污染情况,记录的变量包括时间,一氧化碳含量,臭氧含量,SO2含量,一氧化氮含量,可吸入颗粒,风力等.部分数据见下表. 目的:了解SO2的分布情况.,目的:想了解SO2分布情况,绘制直方图,首先打开数据集,选择分析 菜单下的直方图/条形图, 弹出对话框:,在左侧变量中选择SO2,然后单击右侧的Y,变量
5、SO2被添加,单击OK,得到直方图,设置,坐标轴间隔,是否显示坐标轴,添加指导线,显示的观测个数,是否显示观测值,分组直方图,选择分组变量,盒形图,选择分析菜单下的盒性图,SO2分布情况,有50%的值在2到2.5之间,多个盒形图,对比男女生语文成绩,分别画出它们的盒形图 女生的成绩平均水平高于男生,波动范围小,马赛克图,使用马赛克图命令可以对离散变量做马赛克图.,二维数据探索,SAS INSIGHT 可以绘制二维数据的散点图,曲线图,散点图列表 散点图可以将两个变量的值以散点的形式在图上表现出来.通过散点图,可以粗略地观察两个变量之间是否有数量关系 曲线图以曲线的形式给出两个变量之间的关系,散
6、点图,绘制SO2对时间的散点图,由此来看SO2和时间的关系. 首先,在菜单分析中选择散点图(Y,X), 则弹出对话框,结果:每天当中都存在一个峰值,散点图矩阵,绘制CO,O3,SO2两两之间的散点图.在数据窗口中选定3个变量,然后选择散点图(Y,X)即可.,曲线图,绘制SO2含量对时间的曲线图. 先在菜单中选择线图(Y,X),弹出对话框:,周六,日的含量明显低于其他几天,三维数据探索,通过绘制旋转图,三维曲面图,等高线图来揭示多个变量之间的关系. 旋转图,三维的散点图,可旋转. 三维曲面图,就是在旋转图中将点拟合为一个曲面.如果预测到一个变量可能由其他两个变量决定,就可以绘制这个变量的响应曲面
7、. 等高线图,将地表高度相同的点连成一环线直接投影到平面形成水平曲线,不同高度的环线不会相合.,旋转图,绘制wind,datatime,dust的三维散点图 选择分析菜单中的旋转图,弹出对话框,立体图象,三维曲面图,绘制dust对 wind, datetime的曲面图,单击,选中Fit Surface,单击OK.然后单击Method,选择生成曲面的 方法,选择Thin-Plate Smoothing Spline.,等高线图,使用分析菜单中的等高线图菜单,INSIGHT分布功能,分布分析可以对数值变量给出分布的讨论. 矩统计量 分位数 统计图: 直方图,盒形图 曲线拟合 密度及分布估计,检验,
8、创建分布分析,Analysis分布(Y), 弹出对话框:,结果: 1.盒形图 2. 直方图 3. 各阶矩 4. 分位数,添加密度估计,参数估计: 给出各种已知分布,只需对其中的参数进行估计 核估计: 对密度函数没有作假设, 曲线的形状完全依赖数据,参数估计,选择菜单中的 Parametric Density, 弹出对话框:,正态分布曲线,核估计,选择Curves菜单中的Kernel Density,弹出对话框:,曲线拟合,分析中的拟合(Y X),多变量回归,选择分析菜单下的拟合(Y X),将因变量添加到Y, 自变量添加到x, 单击应用即可. 所谓变量回归,就是研究变量之间相关关系的一种工具. 例如: 身高与体重的关系; 股票价格与流通盘,每股收益, GDP的关系 等等.,分析结果,1. 回归的基本模型 2. 回归的模型方程 3. 拟合概况 4. 模型方差分析, 检验模型是否成立 5. 第三类检验, 检验变量是否显著 6. 参数的估计 7. 残差对预测值的散点图,检验残差是否异常,方差分析介绍,比较多个总体之间是否存在显著差异。 是两独立样本均值检验的自然延续。 主要目的:研究某些因素对于指标有无显著影响。对有显著影响的因素,一般希望找出最好的水平(因素的不同取值)。 例1:研究三种不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 剧毒化学品道路运输通行证核发表格
- 2026安康公考面试题及答案
- 2026安徽民航面试题及答案
- 任务四 汽车垂直媒体平台促销
- 热力总站技术室工作职责培训课件
- 《物联网概论》课件 5.4应用实例-无线传感器网络
- 2025年区域粮食市场协同监管
- 拌和站安全技术交底汇编
- 教案3-项目一 汽车测评知识认知-汽车测评基础知识
- 招聘服务流程外包合同
- 2026及未来5年中国跟踪雷达行业市场现状调查及投资前景研判报告
- 雨课堂学堂云在线《人工智能原理》单元测试考核答案
- 2026年四川省简阳市房地产行业现状调研分析及发展趋势研究报告
- 激光技术在油田开采中的应用计划
- 《智慧医院医用耗材SPD供应链风险控制指南》
- 【MOOC】《知识创新与学术规范》(南京大学)期末考试慕课答案
- 物流运输法规与实务
- 2025年中华人民共和国食品安全法培训考试题库(含参考答案)
- 新能源光伏电站运维管理培训2025年模拟考试题(附答案)
- (正式版)XJJ 122-2020 《建筑物通信基础设施建设标准》
- 剪映课件剪辑教学
评论
0/150
提交评论