版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1菜单系统“分析家”的数据管理功能(analyst application )计算机统计分析软件(sas系统9.1.3)2“分析家分析家”的数据管理功能目录的数据管理功能目录 1. analyst入门入门 2. 数据操作数据操作 3. 数据变换数据变换 4. 合并数据表合并数据表 5. 数据的转置及堆叠和折分数据的转置及堆叠和折分 6.* 生成图形和统计分析功能生成图形和统计分析功能3“分析家分析家”简介简介分析家分析家(analyst)是为了完成基本统计分析而设是为了完成基本统计分析而设计的一个菜单系统计的一个菜单系统;它是用图形界面来调用它是用图形界面来调用sas功能功能的一个模块的一个模
2、块.用户通过选择菜单系统的不同菜单项用户通过选择菜单系统的不同菜单项可完成数据管理可完成数据管理,各种基本的分析功能和绘图功能各种基本的分析功能和绘图功能.在所选择的菜单项完成每项任务后在所选择的菜单项完成每项任务后,立即显示相应立即显示相应的结果的结果;因分析家是通过数据步编程和调用因分析家是通过数据步编程和调用sas过程过程联合完成的联合完成的,故所用的故所用的sas程序可以显示在一个单独程序可以显示在一个单独窗口供我们学习使用;每项任务完成后所保留的窗口供我们学习使用;每项任务完成后所保留的sas程序程序,有关的图形和结果有关的图形和结果,在分析的过程中随时在分析的过程中随时可以调出显示
3、可以调出显示.4“分析家分析家”简介简介分析家分析家(analyst)的功能的功能1. 从菜单栏目的从菜单栏目的文件(file),编辑(edit),查看(view)和和数据(data)下可完成数据管下可完成数据管理功能理功能;包括数据的筛选,数据的变换包括数据的筛选,数据的变换和转置等和转置等. 2. 图形(graphs)栏目下是图形功能栏目下是图形功能,包括包括直方图直方图,盒须图盒须图,饼图饼图,等高线图等高线图,二维或三二维或三维散点图和曲面图等维散点图和曲面图等. 3. 报表(report)栏目支持print过程的列表和tabulate过程的汇总报表.5“分析家分析家”简介简介分析家分
4、析家(analyst)的功能的功能4. 统计(statistics)栏目下是主要的统计分析功能栏目下是主要的统计分析功能,包括描述统计包括描述统计,列联表分析列联表分析,假设检验假设检验,方差分方差分析析(含线性模型和混合模型等含线性模型和混合模型等),回归分析回归分析,多变多变量分析量分析(主成分和典型相关主成分和典型相关),生存分析及功效生存分析及功效与样本量大小与样本量大小.5. 工具工具(tools)栏目可对图形查看器等的设栏目可对图形查看器等的设置进行修改置进行修改.6. 窗口窗口(wondows)栏目可切换窗口栏目可切换窗口,改变窗口的改变窗口的显示方式等显示方式等.6 analy
5、st 入门入门启动启动analyst(分析家分析家)的方法的方法(1) 键入命令键入命令analyst (2) 用下拉菜单用下拉菜单 解决方案(solutions) 分析分析(analysis) 分析家分析家( analyst) (3) 启动启动sas系统时系统时(从从“开始开始” “运运行行”打开打开)加上选项加上选项(-initcmd analyst ):“d:sas82sas.exe” -initcmd analyst9 analyst 入门入门启动分析家启动分析家(analyst)后的界面后的界面10 analyst 入门入门 进入分析家窗口后,系统自动生成一进入分析家窗口后,系统自动
6、生成一个新的分析项目。分析家窗口分为左右个新的分析项目。分析家窗口分为左右两部分:左边为两部分:左边为项目管理项目管理,用树状目录,用树状目录显示打开的数据及其对其所进行的分析显示打开的数据及其对其所进行的分析;右边;右边显示数据显示数据。该项分析所生成的输。该项分析所生成的输出结果的名字将列在项目管理的树状目出结果的名字将列在项目管理的树状目录中,而输出的结果或图形将在单独的录中,而输出的结果或图形将在单独的窗口里显示。窗口里显示。11 analyst入门入门analyst的主菜单的主菜单(menus)文件文件(file) - 新建新建,打开和存贮文件打开和存贮文件,项目和数项目和数 据集据
7、集,及打印报表及打印报表.(2) 编辑编辑(edit) -转换浏览和编辑的模式转换浏览和编辑的模式,并可并可 添加添加,拷贝和删除列和行拷贝和删除列和行.(3) 查看查看(view) -可以移动、隐藏列可以移动、隐藏列,还可修改还可修改 数据表的属性数据表的属性.(4) 工具工具(tools) -定制输出标题定制输出标题,画图选项等画图选项等(5) 数据数据(data) -对用户的数据筛选子集对用户的数据筛选子集,排序排序, 概括概括,串接和合并及进行计算串接和合并及进行计算, 数据变换和转置数据变换和转置. 12 analyst入门入门analyst的主菜单的主菜单(menus)(6) 报表
8、报表(reports)-产生报告产生报告,列出观测等列出观测等(7) 图形图形(graphs)-生成图表生成图表,图形和直方图形和直方 图等图等.(8) 统计统计(statistics)-选择统计分析及使用选择统计分析及使用 索引搜寻任务和统计量索引搜寻任务和统计量.(9) 窗口窗口(window)-切换到其他窗口切换到其他窗口.(10)帮助帮助(help)-显示显示analyst和和sas系统系统 的帮助信息的帮助信息 . 13 analyst 入门入门analyst的工具条的工具条(toolbar)analyst的工具条包括的工具条包括16个图标个图标(如产生新表如产生新表,打打开文件开文
9、件,存贮当前的表存贮当前的表,打印数据表打印数据表,预浏览预浏览,对对数据表排序数据表排序,取子集取子集,计算新列计算新列,生成汇总报表生成汇总报表,生成直方图生成直方图,生成二维散点图生成二维散点图,计算汇总统计计算汇总统计量量,计算相关系数计算相关系数,进行单因子方差分析进行单因子方差分析,进行进行回归分析回归分析,帮助帮助) .用户还可以定义其它工具条图标用户还可以定义其它工具条图标: 选菜单项选菜单项工具工具(tools)从下拉菜单选从下拉菜单选定制定制( (customize)=进入进入定制工具定制工具对话窗口对话窗口=建立建立图标图标.14 analyst入门入门analyst的工
10、具条的工具条(toolbar) 新建一个新表 产生汇总报表 打开一个sas文件 产生一个直方图 保存当前表格 产生一个散点图 打印数据表 计算汇总统计量 打印预览 计算相关系数 对表格进行排序 执行单向方差分析 对数据取子集 执行线性回归 由计算得到新列 分析家帮助15 analyst 入门入门analyst的索引的索引(index) 使用索引来访问经常使用的一些统计任务使用索引来访问经常使用的一些统计任务和绘图任务和绘图任务. 例如以下任务例如以下任务: brown-forsythe test, bar chart horizontal, one-way anova,n-way anova,
11、 pie chart 等等等等 从按字母顺序的任务列表中选择某项任务后从按字母顺序的任务列表中选择某项任务后=ok,则进入完成该任务的窗口则进入完成该任务的窗口.(在你不记得在哪个菜单中可以找到你想要的(在你不记得在哪个菜单中可以找到你想要的过程的时候,可以到过程的时候,可以到index中来寻找)中来寻找)16 analyst 入门入门analyst的项目的项目(project) 一个项目就是在一个或几个数据集上分析的一些结一个项目就是在一个或几个数据集上分析的一些结果果. .一个项目用项目树显示一个项目用项目树显示, ,该树包含不同的数据表该树包含不同的数据表, ,报表报表, ,程序码程序码
12、, ,以及同该项目有联系的其它结果的目录以及同该项目有联系的其它结果的目录. .这些结果在项目树里呈现为一些分枝这些结果在项目树里呈现为一些分枝. . 通过点击加号通过点击加号(+)(+)或减号或减号(-)(-)来打开或关闭一个目来打开或关闭一个目录录. .通过点击某个分枝可以浏览目录中的这个分枝通过点击某个分枝可以浏览目录中的这个分枝. .如如果分枝是一张数据表果分枝是一张数据表, ,可以浏览这张表可以浏览这张表, ,也可以打开这也可以打开这张表并进行分析张表并进行分析. .还可以从下拉菜单选择还可以从下拉菜单选择interactive interactive analysisanalysi
13、s来启动来启动sas/insightsas/insight并进行探索数据分析并进行探索数据分析. . 从从filefile菜单选择菜单选择 projects,projects,用户可以创建用户可以创建, ,打开打开, ,存贮或删除这个分析项目存贮或删除这个分析项目(v8).(v8).17 analyst 入门入门浏览和存贮程序码功能浏览和存贮程序码功能 用户在用户在analyst里对数据进行任里对数据进行任何统计分析和绘图任务后何统计分析和绘图任务后,都可以都可以浏览和存贮程序码浏览和存贮程序码.这些源程序可这些源程序可以拷贝到编辑窗进行编辑以拷贝到编辑窗进行编辑,然后再然后再提交系统执行提交
14、系统执行.18 analyst 入门入门在多个窗口浏览结果在多个窗口浏览结果 可以对一个或几个数据表进行分析可以对一个或几个数据表进行分析,并在多个窗口同时浏览结果并在多个窗口同时浏览结果. 若双击在项目树的某项结果上若双击在项目树的某项结果上,则则在单个窗口浏览这个结果在单个窗口浏览这个结果.在相同的在相同的结果上还可以打开一个新的窗口来结果上还可以打开一个新的窗口来浏览这个结果浏览这个结果.19 analyst 入门入门存贮任务选项功能存贮任务选项功能 通过在任务对话窗里双击通过在任务对话窗里双击 save options来存贮同这项任务有关的选来存贮同这项任务有关的选项项. 以后当用户点
15、击以后当用户点击reset纽时纽时,这些这些选项将用来作为用户的缺省选项选项将用来作为用户的缺省选项.20 analyst 入门入门存贮文本和绘图结果存贮文本和绘图结果 可把程序码及分析和绘图的结果存为可把程序码及分析和绘图的结果存为文件文件. 选中项目树中的某个分枝选中项目树中的某个分枝,并从下拉并从下拉菜单选择菜单选择另存为另存为 (save as) 来存贮程序来存贮程序码和结果码和结果.然后指定文件名并选择一种文然后指定文件名并选择一种文件类型件类型.对于绘图结果对于绘图结果,可用可用gif,jpeg等等格式来存贮格式来存贮.21analyst 入门入门定制用户的会话功能定制用户的会话功
16、能 通过从通过从工具工具(tools)菜单项菜单项=选择选择查看查看器设置器设置(viewer settings),=并设置浏览并设置浏览器的特性来定制用户的分析会话器的特性来定制用户的分析会话. 选择选择图形设置图形设置(graph settings),并设并设置绘图的特性置绘图的特性.全局选项全局选项,用户在某项任用户在某项任务中规定的设置务中规定的设置,这时都将被覆盖这时都将被覆盖.22 数据操作数据操作打开数据集打开数据集 analyst的数据表显示来自的数据表显示来自sas数数据集据集,sas视窗和其它数据源视窗和其它数据源(如文本如文本文件文件,excel 电子表电子表, spss
17、文件文件) 的数的数据据. 从从文件(文件(files)菜单可以创建新)菜单可以创建新数据表数据表,打开打开sas数据集及浏览数据集及浏览,打开打开非非 sas文件文件(v8).23数据操作数据操作打开数据集打开数据集从从文件(文件(files) 打开 将进入以下窗口:用户可以选择将要打开用户可以选择将要打开的数据文件的类型的数据文件的类型24数据操作数据操作打开数据集打开数据集 如果打开的数据为如果打开的数据为sas数据集数据集,则常则常通过从通过从 文件(文件(files) 用用a a名称名称打开打开 在弹出的选择成员选择成员窗口中从某个逻辑库中选择将被打开的sas 数据集名字(比如从sa
18、suser库中选择数据集库中选择数据集 class).25数据操作数据操作数据集的浏览与编辑模式数据集的浏览与编辑模式 在分析时当打开一个文件或在分析时当打开一个文件或sassas库的成员时库的成员时, ,数据被转换为数据表数据被转换为数据表. .在此可浏览在此可浏览, ,编辑及整编辑及整理数据表的行和列理数据表的行和列. . 数据表被打开的模式可以是浏览数据表被打开的模式可以是浏览, ,编辑和编辑和共享编辑三种模式之一共享编辑三种模式之一( (类似于类似于vt界面界面).). 由由 编辑编辑(edit) = 模式模式(model) = 可以从浏览可以从浏览, ,编辑和共享编辑编辑和共享编辑
19、三种模式中任选一种三种模式中任选一种. . 26数据操作数据操作对列的操作对列的操作 在数据表中可以对列或行进行操在数据表中可以对列或行进行操作作. .如移动列如移动列, ,插入列插入列, ,拷贝列或删拷贝列或删除列除列, ,隐藏列隐藏列, ,固定列固定列; ;添加行或删添加行或删除行除行, ,按变量的值对行排序按变量的值对行排序; ;以及浏以及浏览变量名或列标签览变量名或列标签. .27数据操作数据操作对列的操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 1. 改变列的显示顺序改变列的显示顺序 由由查看查看(view) = 列列( (columns) = 移动移动(move)在
20、出现的在出现的move columns( 移动列移动列)对话窗口选中想对话窗口选中想移动的变量按箭头方向上下随意移动来改变移动的变量按箭头方向上下随意移动来改变列的显示次序列的显示次序.也可以先选中某列(该列加亮),然后点鼠标也可以先选中某列(该列加亮),然后点鼠标右键,在弹出的菜单项中选右键,在弹出的菜单项中选 move来改变列来改变列的显示顺序。的显示顺序。 以下介绍的其它列操作也可用类似的方法。以下介绍的其它列操作也可用类似的方法。 28数据操作数据操作对列的操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 2. 隐藏一些列不显示隐藏一些列不显示 由查看(view) =列列(
21、 (columns) = 隐藏( (hide )在出现的在出现的hide columns(隐藏隐藏列列) )对话窗口选中想对话窗口选中想隐藏起来不显示的变量放到隐藏起来不显示的变量放到hide框里,然后按框里,然后按ok可以让所选中的几列不显示。可以让所选中的几列不显示。 若由查看(view) =列列( (columns) = 取消隐藏 (hide )又可以把已被隐藏不显示的列重新显示在数据表中。又可以把已被隐藏不显示的列重新显示在数据表中。29数据操作数据操作对列的操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 3. 固定几列在表的前面不随游标而左右移动固定几列在表的前面不随游
22、标而左右移动 由查看(view) =列列( (columns) = 保持(hold) 可以固定选中的几列总保持在表的左边位置显示可以固定选中的几列总保持在表的左边位置显示. 4. 用列标签显示用列标签显示 由查看(view) =列列( (columns) = 标签(lables) 要求用变量(列)的标签要求用变量(列)的标签显示数据表。显示数据表。30数据操作数据操作对列的操作对列的操作-在编辑模式下在编辑模式下编辑数据编辑数据1. 插入新变量(列):插入新变量(列): 由 编辑编辑(edit) = 插入列插入列(insert column) = 选字符型(character)或数值型 (nu
23、meric),即可在数据表的最右边或选中变量即可在数据表的最右边或选中变量(列列)的左边插入新的左边插入新变量变量.2. 拷贝选中的一列或几列拷贝选中的一列或几列 首先选中数据表中要复制的几个列,然后首先选中数据表中要复制的几个列,然后 由 编辑(edit)= 复制(duplicate)把它们复制到所选中列的面前把它们复制到所选中列的面前.31数据操作数据操作对列的操作对列的操作-在编辑模式下在编辑模式下编辑数据编辑数据 3. 删除选中的一列或几列删除选中的一列或几列 首先选中数据表中要删除的某个列或几首先选中数据表中要删除的某个列或几个列,然后个列,然后 由编辑编辑(edit) = 删除删除
24、 (delete)可删除选中的列可删除选中的列.32数据操作数据操作对行的操作对行的操作-在编辑模式下在编辑模式下编辑数据编辑数据 在分析家窗口将光标置于打开数据表的在分析家窗口将光标置于打开数据表的某一行序号上并点击右键某一行序号上并点击右键,就表示选中该就表示选中该行行,同时在弹出菜单中也显示了可对这一同时在弹出菜单中也显示了可对这一行进行的操作行进行的操作: add在数据表的最后加入一新行在数据表的最后加入一新行; ; duplicate将该行复制到数据表的最后一行将该行复制到数据表的最后一行; ; delete-删除选中的行删除选中的行. .33数据操作数据操作对行的操作对行的操作-在
25、编辑模式下在编辑模式下编辑数据编辑数据 或者先选中某行或者先选中某行, ,然后然后 由编辑编辑(edit) = 删除删除 (delete)则系统在询问对话框得到肯定后立即将把这一行则系统在询问对话框得到肯定后立即将把这一行从数据表中删除从数据表中删除; 或由编辑编辑(edit) =复制复制(duplicate)则则将选中的行复制到数据表的最后一行将选中的行复制到数据表的最后一行. . 由编辑编辑(edit) = 添加行 (add row)则在数据表的最后加入一新行则在数据表的最后加入一新行. . 34数据操作数据操作存贮数据存贮数据 可以存贮数据表中的数据为可以存贮数据表中的数据为sassas
26、支持的任何支持的任何格式格式, ,包括包括sassas数据集数据集, ,文本文件文本文件,excel,excel和和lotuslotus文件文件. . 由由 文件文件(file(file)=)=保存保存(save(save),),可存贮修改后可存贮修改后的数据集的数据集; ; 由由文件文件(file(file)=)=另存为另存为(save as),(save as),可存贮当可存贮当前数据表为非前数据表为非sassas格式或存为其它格式或存为其它sassas数据集数据集. . 由由文件文件(file(file)=)=用用sassas名称另存为名称另存为(save as (save as sas
27、 namesas name),),可存贮当前数据表为所选择的可存贮当前数据表为所选择的sassas库中的库中的sassas数据集数据集. . 35 数据操作数据操作筛选数据筛选数据 由 数据数据(data) =过滤过滤(filter),然后选择取数据子集取数据子集(subset data) ,并对数据集应用 where条件(如sex=m)来浏览数据集的子集. 若要保存,可若要保存,可 选选 文件文件 = 另存为另存为 sas . (比如找出所有男生的观测)(比如找出所有男生的观测) 36 数据操作数据操作排序对话窗排序对话窗(编辑模式编辑模式) 由由 数据数据(data)=排序排序(sort)
28、,可对数据表里的行进行排序可对数据表里的行进行排序.先从先从候选的变量列表中选择用于排序的候选的变量列表中选择用于排序的变量变量;如选中的变量不只一个如选中的变量不只一个,对对sort by列表可用向上或向下的箭头规定列表可用向上或向下的箭头规定排序变量的顺序排序变量的顺序;选中一变量后选中一变量后,还可还可规定按上升或下降的次序排序规定按上升或下降的次序排序.37数据操作数据操作产生某些分布的随机变量产生某些分布的随机变量(编辑模式编辑模式) 由 数据数据(data)=随机变量随机变量 (random variates),可生成基于某个分布的随机变量.分布包括正态分布,均匀分布,二项分布,泊
29、松分布,指数分布,伽码分布,几何分布,极值分布. 38数据操作数据操作分组概括数据分组概括数据由 数据数据(data)=按组汇总按组汇总 (summarize by group) ,可对数据表里的观测按分组变量所分成的几个组分别计算概 括统计量.39数据操作数据操作产生随机样本产生随机样本 由数据数据( data)=随机抽样随机抽样 (random sample),可由原数据表生成用户指定样本个数为n(或抽取的比例)的随机样本. 40数据操作数据操作生成汇总报表生成汇总报表 由 报表报表 (report)= 数据列表数据列表(list data),可用列表方式显示数据表里数据(可选择id变量,
30、列表变量等). 由报表报表(report)=表表.(tables) ,可用汇总报表的方式生成五种形式的报表. 41 数据操作数据操作生成汇总报表生成汇总报表选择菜单项选择菜单项报表报表(reports)=表表.(tables),再选择一再选择一种表格形种表格形式进行设式进行设置置. .如选择如选择表格表格(5)(5)(1 1)(2 2)(3 3)(4 4)(5 5)42 数据操作数据操作生成汇总报表生成汇总报表summary标签下汇总了变量的选择43 数据操作数据操作生成汇总报表生成汇总报表options按键可打开设置附加选项的窗口totaltotaltotaltotal44数据变换数据变换在
31、编辑模式下在编辑模式下1. 计算新变量计算新变量 由由 数据数据(data) = 变换变换(transform) = 计算计算(compute),将显示计算对话窗,利用这个窗口来规定关系式,公式或表达式,以便在数据表中生成新的变量(列). 45数据变换数据变换在编辑模式下在编辑模式下2. 求秩求秩(rank) 由数据(data)=变换(transform)=求秩(rank),将显示求秩对话框,利用这个窗口来变量(列)的秩(包括简单秩等).3. 对变量标准化对变量标准化 (standardize) 由数据(data) =变换变换(transform) =标准化标准化(standardize) ,
32、将显示变量标准化对话窗,利用这个窗口可以将变量(列)标准化.46数据变换数据变换在编辑模式下在编辑模式下 4. 重新定义记录的值重新定义记录的值(recode values) 由 数据(data)=变换(transform)=记录值(recode values),将显示重新定义记录值的对话窗,利用这个窗口可以对某一个列重新赋值5. 重新定义记录的范围重新定义记录的范围(recode range) 由数据(data)=变换(transform)=记录范围(recode range),将显示重新定义记录范围的对话窗,利用这个窗口可以对某一个列按照一定的区域重新赋值.47数据变换数据变换在编辑模式下
33、在编辑模式下6. 转换变量类型转换变量类型(convert type.) 由 数据(data)=变换( transform)= 转换类型(convert type.),将显示转换变量类型对话窗,利用这个窗口来指定将转换的变量(把数值型转换为字符型,或反之).7. 计算对数计算对数(log(y) :先选中一数值变量, 由数据(data)=变换( transform)= log(y),对该变量进行对数变换,并得到新的变量。48数据变换数据变换在编辑模式下在编辑模式下8. 计算平方根计算平方根 (sqrt(y): 先选中一数值变量,由 数据(data)=变换( transform)= sqrt(y)
34、,对该变量进行求平方根变换,并得到新的变量。 9. 计算倒数计算倒数(1/y) :先选中一数值变量, 由数据(data)=变换(transform)= 1/y,对该变量进行求倒数变换,并得到新的变量。49数据变换数据变换在编辑模式下在编辑模式下10. 计算平方计算平方(y*y) :先选中一数值变量, 由数据(data)=变换变换(transform) = y*y,对该变量进行求平方变换,并得到新的变量.11. 计算指数计算指数(exp(y) :先选中一数值变量, 由数据(data)=变换变换(transform)= exp(y) ,对该变量进行求指数变换,并得到新的变量。50合并数据表合并数据
35、表 合并数据表功能是版本合并数据表功能是版本8新增加的功能新增加的功能. 可按列来合并数据表可按列来合并数据表,或者按行连接数据表或者按行连接数据表.(1)由)由数据数据 (data)=合并表(combine tables) =按列合并按列合并(merge by columns) 可将指定的几个数据表由可将指定的几个数据表由by变量匹配合并变量匹配合并.(2)由)由数据数据(data) =合并表(combine tables) =按行合并按行合并(concatenate by rows) 可将指定的几个数据表按行串接成新数据表可将指定的几个数据表按行串接成新数据表.51合并数据表合并数据表ab
36、 ab ab合并表合并表数据串接数据串接sas sas 数据集数据集sas sas 数据集数据集数据并接数据并接52合并数据表合并数据表串接串接sas数据集数据集-简单连接简单连接num vara 1 a1 2 a2 5 a3串接(concantenate)a:b:num vara varb 1 a1 2 a2 5 a3 3 b1 4 b2 6 b3 combine:num varb 3 b1 4 b2 6 b3把第二个数据集把第二个数据集b b的观测串接在第的观测串接在第一个数据集一个数据集a a的所的所有观测后面有观测后面53num varb 3 b1 4 b2 6 b3合并数据表合并数据
37、表串接串接sas数据集数据集-插入式连接插入式连接num vara 1 a1 2 a2 5 a3串接(interleave)a:b:num vara varb 1 a1 2 a2 3 b1 4 b2 5 a3 6 b3 combine:按两个数据集按两个数据集a a和和b b的共同变量的共同变量num的值的值排次排次序后串接在一序后串接在一起起(analyst41.sas)54 合并数据表合并数据表串接串接sas数据集数据集在在analyst环境下要串接环境下要串接数据集可在下拉菜单选数据集可在下拉菜单选:(1) 数据数据(data)合并表合并表( combine tables) 按行连接按行
38、连接( concatenate by rows)选要串接的数据集选要串接的数据集选选byby变量变量 (2) 选要串接的数据集选要串接的数据集(3)(3)指定是简单连接还是插指定是简单连接还是插入式连接入式连接(4) (4) 选择串接的变量名选择串接的变量名55 合并数据表合并数据表并接并接sassas数据集数据集-匹配合并匹配合并 num vara 1 a1 2 a2 3 a3num varb 1 b1 2 b2 4 b3并接(match merge)c:d:num vara varb 1 a1 b1 2 a2 b2 3 a3 4 b3combine:按两个数据集按两个数据集c c和和d d
39、的的共同变量共同变量num的相的相同值同值匹配合并匹配合并. . (analyst42.sas)56合并数据表合并数据表并接并接sas数据集数据集在在analyst环境下要并接数据集环境下要并接数据集可在下拉菜单选可在下拉菜单选:(1)数据数据(data)合并表合并表( combinetables) 按列合并按列合并merge by columns 选选byby变量变量选并接数据集选并接数据集(2)选并接的数据集选并接的数据集(3)(3)指定并接的方式指定并接的方式( (有三有三种种: :见右边屏幕的中间见右边屏幕的中间) )(4) (4) 选选byby变量变量(5) (5) 选择并接的变量名
40、选择并接的变量名57数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集转置数据集 当希望把数据表中的某些列变为行当希望把数据表中的某些列变为行,行变为列行变为列时时,可用此项功能可用此项功能.在浏览模式下在浏览模式下, 由由 数据数据(data)=转置转置(transpose), 则显示转置对话窗则显示转置对话窗,在这里可以规定将被转置在这里可以规定将被转置的一些的一些(变量变量)列列(transpose)名字名字;还可以规定还可以规定一个变量一个变量(group by),用于转置时按该变量的不用于转置时按该变量的不同值进行转置同值进行转置.转置后新列的前缀用户可以规转置后新列的前缀用户可
41、以规定定,记录源变量名的列名也可以规定记录源变量名的列名也可以规定,当然也可当然也可以用缺省名字以用缺省名字.58数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集例转置数据集例1 例例1 1:sassas数据集数据集produprodu中包含三种产品中包含三种产品从从20022002年年1 1月开始共月开始共1515个月的销售数据,即三个月的销售数据,即三个观测个观测1616个变量(个变量(3 3行行1616列)的列)的sassas数据集,数据集,其中变量其中变量limelime记录产品号。为了分析三种产记录产品号。为了分析三种产品的销售量如何随时间而变化的规律,首先品的销售量如何随时间
42、而变化的规律,首先应把该数据集转化为应把该数据集转化为3 3个变量(即三种产品)个变量(即三种产品)1515个观测(即个观测(即1515个月份的销售量)的数据个月份的销售量)的数据; ;在在转化后的数据集中还要求加上日期变量转化后的数据集中还要求加上日期变量datedate。(analyst51.sas)59数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集转置数据集-例例1转置数据集数据集produproduanalyst: 数据(data) 转置(transpose)60数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤1.1.启动启动“分析家分析家”
43、, ,并打开数据集并打开数据集produprodu;2.2.选选 数据(data) 转置(transpose);3. 在转置窗口下,在转置窗口下, 选中想要转置的变量(这里是选中想要转置的变量(这里是t1t15),然后点),然后点击击transpose,即即把选中的变量送到把选中的变量送到transpose窗口内;窗口内; 规定转置后列变量的名字,如规定列变量名的前规定转置后列变量的名字,如规定列变量名的前缀为缀为produ,缺省时前缀名字为缺省时前缀名字为col; 规定存放转置后源变量的列名字,缺省时名字为规定存放转置后源变量的列名字,缺省时名字为_sourse_; 按按ok键键.61数据的
44、转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤4. 4. 存贮转置后的数据为一新的存贮转置后的数据为一新的sassas数据集数据集 文件文件(file)=(file)=用用sassas名字另存为名字另存为=选择逻辑库选择逻辑库, ,并规并规定数据集的名字定数据集的名字( (如如product)product)后按后按保存保存键键. .5. 5. 加工数据集加工数据集product;product; 因转置后生成的数据集没有日期变量因转置后生成的数据集没有日期变量date,date,以下步以下步骤就是用来增加一个日期变量骤就是用来增加一个日期变量. . 打开刚生成
45、的打开刚生成的sassas数据集数据集product,product,并转换为编辑并转换为编辑模式模式; ; 选选数据(data) 变换(transform) 计算(compute)在以下出现的compute:product窗口做以下的选择:62数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤( (计算公式由计算公式由sassas日期时间函数给出日期时间函数给出) )63数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤选择正确后,按ok键,则在数据表窗口变量列后面生成新变量date,但此时该变量的值为日期时间相应的数值.
46、选中变量date,点右键,在弹出的子菜单中选properties, ,然后在出现的列属性column properties对话框中修改输出格式为format:monyy7. .; ;按按ok键键. . 变量_sourse_在这里没有用,可以删除. 把符合要求的数据表存为sas数据集(如仍用名字product).64数据的转置及堆叠和拆分数据的转置及堆叠和拆分转转置数据集置数据集-例例2 例例2 2:sassas数据集数据集transtrans中包含某企业从中包含某企业从19811981年至年至19951995年的销售资料年的销售资料. .该数据集的每个该数据集的每个观测记录年度及该年观测记录年
47、度及该年1212个月的销售量个月的销售量, ,共有共有1515行行1313列列. .为了分析该企业月销售量如何随时间为了分析该企业月销售量如何随时间而变化的规律,请把该数据集转化为而变化的规律,请把该数据集转化为2 2个变量个变量(datedate和和salessales)180180个观测(即个观测(即1515年年 1212个月个月)的数据)的数据. .(analyst52.sas)65数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集转置数据集-例例2按年转置并加日期66数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤1.1.启动启动“分析家分析家”
48、, ,并打开数据集并打开数据集transtrans;2.2.选选数据(data) 转置(transpose);3. 在转置窗口下,在转置窗口下, 选中想要转置的变量(这里是选中想要转置的变量(这里是jandec),然后点),然后点击击transpose,即即把选中的变量送到把选中的变量送到transpose窗口内;窗口内; 选选group by变量(这里是变量(这里是year),然后点击),然后点击 group by,即即把选中的变量送到把选中的变量送到group by窗口内;窗口内; 规定转置后列变量的名字规定转置后列变量的名字,如规定列变量的前缀名如规定列变量的前缀名为为sales; 规定
49、转置后源变量的列名字,缺省时名字为规定转置后源变量的列名字,缺省时名字为_sourse_; 按按ok键键.67数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤68数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤4. 4. 存贮按年转置后的数据为一新的存贮按年转置后的数据为一新的sassas数据集数据集 文件文件(file)=(file)=用用sassas名字另存为名字另存为=选择逻辑库选择逻辑库, ,并规并规定数据集的名字定数据集的名字( (如如trans1) )后按后按保存保存键键. .5. 5. 加工数据集加工数据集t
50、rans1; ; 因转置后生成的数据集没有日期变量因转置后生成的数据集没有日期变量date,date,以下步以下步骤就是用来增加一个日期变量骤就是用来增加一个日期变量. . 打开刚生成的打开刚生成的sassas数据集数据集trans1, ,并转为编辑模并转为编辑模式式; ; 选选数据(data) 变换(transform) 计算(compute)在compute:product窗口选择合适的日期时间函数窗口选择合适的日期时间函数,给给出的计算公式出的计算公式,并计算出并计算出date的数值的数值.69数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤转置数据集的具体步骤 选中变量
51、选中变量date,date,点右键点右键, ,在弹出的下拉菜在弹出的下拉菜单中选单中选propertiesproperties, ,然后在出现的列属性然后在出现的列属性column propertiescolumn properties对话框中修改输出格式对话框中修改输出格式为format:format:yymmdd8.yymmdd8.; ;按按okok键键. . 变量变量_sourse_sourse_和和yearyear在这里没有用在这里没有用, ,可以可以删除删除. . 把符合要求的数据表存为把符合要求的数据表存为sassas数据集数据集( (如如用名字用名字trans2).).70数据的
52、转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列堆叠列(stacking column) 把选中的几个把选中的几个(变量变量)列的数值叠加为一列列的数值叠加为一列(即即每一个观测行叠加后变成几个观测行每一个观测行叠加后变成几个观测行).在浏览模式下, 由 数据(data)=堆叠列 (stacking columns)则显示叠加列的对话窗则显示叠加列的对话窗,在这里可以规定将叠加为一在这里可以规定将叠加为一列的哪几个变量列的名字列的哪几个变量列的名字;还可以规定叠加后新列的还可以规定叠加后新列的名字名字,及规定一个名字用于记录叠加的这些列名及规定一个名字用于记录叠加的这些列名.
53、 当数据表中每个观测的一些数值是对同一个对象当数据表中每个观测的一些数值是对同一个对象重复几次测量得到的重复几次测量得到的,叠加列的功能特别有用叠加列的功能特别有用 (见见pr0数据集数据集) .71数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子 例例3. 数据集数据集pro记录了记录了27个人在个人在8岁岁,10岁岁,12岁岁,14岁的生长指数岁的生长指数(用用y1y4表示表示).因分析处因分析处理的需要理的需要,希望把每一行记录希望把每一行记录(观测观测) ,如如 person sex y1 y2 y3 y4 1 f 21 20 21.5 23加工为加工为 p
54、erson sex age y 1 f 8 21 1 f 10 20 1 f 12 21.5 1 f 14 23 加工后生成的新数据集加工后生成的新数据集pr包含有包含有27 4=108行行4列列.(analyst53.sas)72数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤1.1.启动启动“分析家分析家”, ,并打开数据集并打开数据集propro;2.2.选选数据(data) 堆叠列堆叠列(stacking column);3. 在在堆叠列堆叠列窗口下,窗口下, 选中想要选中想要堆叠堆叠的变量(这里是的变量(这里是y1y4),然后),然后点击点击st
55、ack ,即即把选中的变量送到把选中的变量送到stack窗口内;窗口内; 规定堆叠所成的新列的名字为规定堆叠所成的新列的名字为y (缺省时名字为缺省时名字为_stack_); 规定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字,缺省时名字为缺省时名字为_source_; 按按ok键键.73数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤y74数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤4. 4. 存贮堆叠后的数据为一新的存贮堆叠后的数据为一新的sassas数据集数据集 文件文件(file)=(file)=用用
56、sassas名字另存为名字另存为=选择逻辑库选择逻辑库, ,并并规定数据集的名字规定数据集的名字( (如如pr1)pr1)后按后按保存保存键键. .5. 5. 加工数据集加工数据集pr1;pr1; 因堆叠后生成的数据集没有记录年龄的变量因堆叠后生成的数据集没有记录年龄的变量age,age,以下步骤就是用来增加一个年龄变量以下步骤就是用来增加一个年龄变量. . 打开刚生成的打开刚生成的sas数据集数据集pr1, ,并转为编辑模式并转为编辑模式; ; 选选数据(data) 变换(transform) 记录值(recore)在出现的记录值信息窗口修改新列的名字在出现的记录值信息窗口修改新列的名字 为
57、为age;75数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤76数据的转置及堆叠和拆分数据的转置及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤1.1.启动启动“分析家分析家”, ,并打开数据集并打开数据集transtrans;2.2.选选数据(data) 堆叠列堆叠列(stacking column);3. 在在堆叠列堆叠列窗口下,窗口下, 选中想要选中想要堆叠堆叠的变量(这里是的变量(这里是jandec),然后),然后点击点击stack ,即即把选中的变量送到把选中的变量送到stack窗口内;窗口内; 规定堆叠所成的新列的名字为规定堆叠所成的
58、新列的名字为sales (缺省时名字缺省时名字为为_stack_); 规定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字,缺省时名字为缺省时名字为_source_; 按按ok键键.77数据的转置及堆叠和拆分数据的转置及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤 4.4.存贮堆叠后的数据为一新的存贮堆叠后的数据为一新的sassas数据集数据集 文件文件(file)=(file)=用用sassas名字另存为名字另存为=选择选择逻辑库逻辑库, ,并规定数据集的名字并规定数据集的名字( (如如trans1)trans1)后按后按保存保存键键. . 5. 5. 加工数据集加工数据集tr
59、ans1;trans1; 因转置后生成的数据集没有日期变量因转置后生成的数据集没有日期变量date, 用与例用与例2类似的方法来增加一个日类似的方法来增加一个日期变量期变量. 78数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-拆分列拆分列(splitting column) 把选中的一个将被分拆的把选中的一个将被分拆的(变量变量)列列,按分拆按分拆by变量变量的不同值分拆为几个新列的不同值分拆为几个新列.新列的名字用户可以规定新列的名字用户可以规定名字的前缀名字的前缀,也可以使用缺省的名字也可以使用缺省的名字. 在浏览模式下在浏览模式下, 由由 数据数据(data)= 拆分
60、列拆分列(split columns), 则显示分拆列的对话窗则显示分拆列的对话窗,在这里可以规定将被分拆的在这里可以规定将被分拆的变量列名字变量列名字;还可以规定分拆后新列的名字还可以规定分拆后新列的名字.比如想把比如想把数据表中某个数值变量数据表中某个数值变量y的值按性别的不同分拆为二的值按性别的不同分拆为二列列,则可以此项功能则可以此项功能.79生成图形功能生成图形功能在在analyst中可以生成以下几种类型的图形中可以生成以下几种类型的图形:1. 条形图bar plot(v8) 2. 饼图pie plot(v8)80生成图形功能生成图形功能在在analyst中可以生成以下几种类型的图形
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陕西西安中学高2025届高三第六次模拟考试英语
- 亳州职业技术学院《口腔工艺技术》2025-2026学年期末试卷
- 闽北职业技术学院《建设法规》2025-2026学年期末试卷
- 2026年石家庄市井陉矿区社区工作者招聘考试参考题库及答案解析
- 马鞍山师范高等专科学校《飞行电学基础》2025-2026学年期末试卷
- 运城学院《商务英语》2025-2026学年期末试卷
- 邢台新能源职业学院《采购管理》2025-2026学年期末试卷
- 厦门华天涉外职业技术学院《电动力学》2025-2026学年期末试卷
- 福建水利电力职业技术学院《管理运筹学》2025-2026学年期末试卷
- 仰恩大学《中国当代文学》2025-2026学年期末试卷
- 卫星运控技术科普
- 2025年开封大学单招职业技能测试题库附答案
- 招标专员考试题库
- CKD患者心理状态分期评估与干预方案
- 汉语言文学本科专业毕业论文撰写规范要求
- 2026届新高考数学冲刺突破复习新题型研究
- 2025上半年四川省属教师招聘面试试题(含答案)
- GMP计算机系统验证实施方案模板
- 食品仓库建设项目可行性研究报告
- 建筑外立面施工风险辨识和分析及应对措施
- GB/T 19839-2025工业燃油燃气燃烧器通用技术条件
评论
0/150
提交评论