




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘原理与数据挖掘原理与SPSS Clementine应用宝典应用宝典 元昌安元昌安 主编主编 邓松李文敬刘海涛编著邓松李文敬刘海涛编著 电子工业出版社电子工业出版社 第第19章章 Spss Clementine 数据管理数据管理 本章主要内容本章主要内容 数据源节点数据源节点 记录选项节点记录选项节点 字段选项节点字段选项节点 19.1数据源节点数据源节点 包括: 数据库 变项文件 固定文件 SPSS 文件 Dimensions SAS文件 Excel 用户输入 图图19-1 数据源节点选项板数据源节点选项板 19.1.1从开放数据库中导入数据从开放数据库中导入数据 从数据库中获取数据的
2、步骤: (1)在数据库节点对话框中,使用“表”模型 和“SQL查询”模型连接数据库。 (2)从数据库中选择表。 (3)使用数据库节点对话框中的各个页签,用 户可以更改使用类型和过滤数据字段。 用户可以使用数据库节点对话框中“数据”页签来进入数据库和从选 定的表中读取数据。 图图19-2 从所选表中加载数据从所选表中加载数据 19.1.1.1数据库连接的添加数据库连接的添加 图图19-3 数据库连接对话框数据库连接对话框 在“数据”页签中,从数据源的下拉列表中选择“添加新的数据库连 接”,打开如图19-3所示的数据库连接对话框。 图19-3参数说明: 数据源:列出可用的数据源。点击“连接”按钮进
3、行 连接。点击“刷新”按钮会更新菜单。 用户名:如果数据源被密码保护,键入用户的用户名 。 密码:如果数据源被密码保护,输入用户的密码。 连接:显示目前连接的数据库。若要删除连接,可从 菜单中选定一个连接,点击 “删除”按钮。 19.1.1.2选择表或视图选择表或视图 图图19-4 从连接的数据库中选择表从连接的数据库中选择表 用户可以在表名输入框处输入表名或者点击“选择”按钮打开对话框,列 出可用的表/视图,如图19-4所示。 部分参数说明: 显示:列出用户目前连接的数据源的列。 (1)选择“用户表” 浏览由数据库用户建立的普通数据库表 。 (2)选择“系统表”来浏览数据库的系统表(包含数据
4、库信 息、索引的描述等)。该选项在浏览用于 Excel 的数据库时是 非常必要的。 (3)选择 “视图”来查看视图,通常这是对一个或者多个普 通表进行某个查询后,其生成记录组成的一个虚拟表。 (4)选择 “同义名” 查看在数据库中对任意现存的表建立 的表名相似的同义名。 19.1.1.3 SQL查询查询 图图19-5 查询编辑窗口查询编辑窗口 从“数据”页签中选择“SQL查询”单选按钮作为连接模式,这将 在对话框中增加查询编辑窗口,如图19-5所示。 参数说明: 载入查询:点击“载入查询”按钮后打开文件浏览器 ,用户可以载入先前保存的查询,如图19-6所示为使 用SQL查询载入数据对话框。 保
5、存查询:点击“保存查询”按钮后打开保存查询对 话框,用户可以用来保存目前查询,如图19-7所示使 用SQL查询保存数据对话框。 导入默认值:点击“导入默认值”按钮后选择一个 SQL SELECT 语句的例子,它是使用对话框中的表 格和项目自动建立的。 清除:“清除”按钮清除工作区域的内容。如果用户 想重新编辑时,使用这个选项。 图图19-6 使用使用SQL查询载入数据对话框查询载入数据对话框图图19-7 使用使用SQL查询保存数据对话框查询保存数据对话框 19.1.1.4 查询表的实例查询表的实例 其步骤如下: 在数据库节点对话框“数据 ”页签中,选择“表”模式, 从数据源的下拉列表中选择“
6、添加新的数据库连接”,如 图19-8所示。打开数据库连接 对话框。 例例19-1:利用数据源节点连接test1数据库,并选择表名为 dbo.sysoledbusers的表,同时使用导入默认值的方式导入数据库查询并将 该查询保存,再清除该查询后通过载入查询的方式载入已保存查询。 图图19-8 添加新的数据库连接添加新的数据库连接 在数据库连接对话框中选择test1数据源,输入用户名和密码(如果没有用 户名就可不输),点击“连接”按钮,即可显示目前连接的数据库test1, 如图19-3所示。 点击“确定”按钮返回到主对话框中。 点击“选择”按钮从test1选择表/视图对话框中选择表dbo.syso
7、ledbusers 。 点击“确定”按钮返回到主对话框,如图19-2所示。 选择“SQL查询”模式,并点击“导入默认值”按钮导入数据库查询。 点击“保存查询”按钮保存该查询。 点击“清除”按钮,清除该查询内容。 点击“载入查询”按钮,载入已保存的查询。 19.1.2 从无格式文本文件中读取数据从无格式文本文件中读取数据 数据存储和数据类型: 数据存储:描述字段中数据的存储方式。存储 类型有:实数型、字符型、时间型、日期型和 时间戳。 数据类型:是用来描述给定字段内容的一种方 式,也就是常称的类型。数据类型有:默认型 、连续型、离散型、标志型、集合型和有序集 合型等。 使用使用“存储类型存储类型
8、” 来获取每一个字来获取每一个字 段存储类型的列段存储类型的列 表或从列表中选表或从列表中选 择存储类型来重择存储类型来重 置现有的存储类置现有的存储类 型(这时必须要型(这时必须要 勾选勾选“覆盖覆盖”列列 的复选框),如的复选框),如 图图19-9所示。所示。 图图19-9 重置一个数据字段的存储类型重置一个数据字段的存储类型 19.1.3 从固定字段的文本文件中读取数据从固定字段的文本文件中读取数据 图图19-10固定文件节点文件页签固定文件节点文件页签 从固定字段的文本 文件中读入数据 可以使用固定文件 节点。 其“文件”页签如 图19-11所示,可 以很容易的指定数 据库中数据列的位
9、 置和长度。 19.1.4导入导入SPSS文件文件 图图19-11 SPSS文件节点数据页签文件节点数据页签 输入一个保存过的缓冲区文件,就应该使用SPSS文件节点。如图19- 11是其对话框 导入SPSS文件相应的步骤如下: (1)输入文件名或者用自定义()按钮选择文件。文件选定后,路径会显 示在文本框中,如图19-12所示。 (2)选择“变量名称”或“值”。 变量名称:如果在.sav 文件中想使用描述性变量标签而不是简短的字段名 ,可选择这一选项。这个选项缺省为取消选定,意味着.sav文件中的长名 称将不能从SPSS文件读入Clementine中,也不能输出。 值:在.sav 文件中如果想
10、使用变量值标签而不是用表示变量值的抽象符号 和数字就选择这一选项。 例如,用1和2来分别表示性别“男”和“女”的 数据中,就可以使用这个选项,该字段将会转换为字符型,并导入“男” 和“女”为真实值。 19.1.5元数据和个例数据的导入元数据和个例数据的导入 Dimensions节点来导入元数据或个例数据集,如图节点来导入元数据或个例数据集,如图19-12所示。所示。 图图19-12 元数据导入对话框元数据导入对话框 19.1.5.1元数据设置元数据设置 元数据源: 元数据属性: 图图19-1319-13元数据属性对话框元数据属性对话框 19.1.5.2个例数据设置 个例数据源: 个例数据类型:
11、。 个例数据项目: 19.1.6 SAS格式数据的设置格式数据的设置 SAS 文件节点对话框数据页签如图19-13所示。 图图19-14 导入一个导入一个SAS文件文件 参数设置如下: 导入:选择传送何种类型的 SAS 文件。用户可以以下列四种文件类型导入: (1)适用于Windows/OS2 (.sd2)的SAS(.sd2)。 (2)适用于UNIX 的SAS (.ssd)。 (3)SAS 传输文件 (.tpt) 。 (4)SAS版本7/8/9 (.sas7bdat) 。 导入文件:指定文件名。可以键入文件名或者点击自定义()按钮来浏览文件的位置。 成员:从上面选定的 SAS 传输文件中选定一
12、个成员来导入。 从 SAS 数据文件中读用户格式:读取用户格式,SAS 文件以不同的方式储存数据和数据格式 格式化文件:如果需要一个格式化文件 ,勾选复选框可被激活。 变量名称:选择处理变量名称和标签的方式。 19.1.7导入导入Excel格式的数据格式的数据 图图19-15 导入一个导入一个Excel文件文件 Excel节点可以从节点可以从Microsoft Excel文本中导入数据,文本中导入数据,Excel节点对话框如图节点对话框如图19-15所示。所示。 相关参数的说明如下: 导入文件:指定输入电子表格文件的名称或点击自定义() 按钮来浏览文件的位置。 使用指定范围:指定一个已经命名的
13、单元范畴设为Excel工作 表。点击自定义按钮可从可用的范畴列表中选择。 工作表:指定输入的工作表,是按“索引”还是按“名称”输 入。 数据范围:输入的数据的开始可以是第一行无空格或带有外在 范围的单元。可以选择“第一个非空行”或者指定“显示范围 ”。 第一行包含字段名:表示Excel文件的第一行是字段的名称。 19.1.8用户手动创建数据用户手动创建数据 图图19-16 用户输入节点对话框输入节点用户输入节点对话框输入节点 19.1.8.1从无到有创立数据 其步骤是: (1)点击节点选项板的数据源项目。 (2)拖放或者双击用户输入节点,将其添加 到流程区域。 (3)双击该节点,在打开的对话框
14、中指定字 段和变量值,如图19-16所示。 19.1.8.2从已存数据源中产生数据 用户可以从数据流中的任何非终端节点中产生用户输入 节点,其步骤是: (1)确定在流程的哪一点输入一节点。 (2)在节点上单击鼠标右键,此节点的数据将进入 用户输入节点中,并且从内容菜单中选择 “生成用户 输入节点(P)”。 (3)用户输入节点上负载了该数据流下游的所有过 程,在流的某点处代替已存在的节点。当产生后,节 点从原数据中继承了(如果可以被继承)所有的数据 结构和字段类型信息。 19.2记录选项节点记录选项节点 记录选项节点选项板包括以下节点: 选择 抽样 平衡 汇总 排序 合并 附加 区分 图图19-
15、17记录选项节点选项板记录选项节点选项板 19.2.1选择节点选择节点 图图19-1819-18选择节点对话框设置页签选择节点对话框设置页签 选择节点来设置对数据集的初步筛选工作,也可以通过编写特定的选择节点来设置对数据集的初步筛选工作,也可以通过编写特定的CLEM表达式来实现筛选。表达式来实现筛选。 选择节点对话框如图选择节点对话框如图19-18所示所示 相关的参数设置: 模式:指定满足条件的记录是包含在流程中还是被排除在流程 外。 (1)包含:选择以便在流程中包含符合选择条件的记录。 (2)丢弃 :选择以便将符合选择条件的记录排除出流程。 条件:用于检验每一条记录的选择条件,选择条件通过C
16、LEM 表达式指定。用户可以在窗口中输入表达式,也可以点击窗口 右边“表达式构建器”按钮来构造条件。 用户可以使用选择节点根据具体条件从数据流程中选择或排除某 一记录子集,如符合以下条件的记录子集: Class=“Drink” 选择节点也用于选择一定比例的记录,用户可以使用选择节点来 创建自己的条件。例如,用户可以创建如下条件: Class=“Drink”and random(10)=4 这一条件将从 Class 为“Drink”的记录中,选择大约 40,并 向流程的下游下传这些记录以用于进一步分析。 19.2.2对数据的抽样对数据的抽样 图图19-19抽样节点的设置抽样节点的设置 抽样节点来
17、明确限制通过流的记录数或排除一定比例的记录,抽样节点来明确限制通过流的记录数或排除一定比例的记录, 进入到抽样对话框,如图进入到抽样对话框,如图19-19所示。所示。 19.2.2抽样节点抽样节点 模式 :模式选择是否通过(包含)或丢弃 (排除)记录。 样本:通过以下选项选择抽样方法: (1)从第一条记录开始连续抽取:选择使用连续数据抽样法。 例如,如果最大样本量设为 10,000,则前 10,000 个记录将通过流(如果模式为“包含”) 或被丢弃(如果模式为 “丢弃”) 。 (2)n中取1:选择数据抽样法为每 n 个通过或丢弃一个记录。 例如,如果 n 设置为 5,则每五个记录将有一个记录根
18、据上述模式通过或丢弃。 (3)随机:选择随机抽取数据集一定百分比的样本。 例如,如果把百分比设置为 20,那么数据集有 20的记录将会根据上述模式设置通过流或丢弃 。 最大样本量:确定通过流程的最大样本量。如果想在选择 “n中取1”选项或“随机”抽样选 项中不使用该选项,可将最大样本量数目设置为超出数据集容量。 设置随机数种子:设置随机种子值,用于生成随机数。 19.2.3修正数据集中的不均匀性修正数据集中的不均匀性 图图19-20平衡节点的设置平衡节点的设置 平衡节点可以用来修正数据集中的不均匀性,以便能够符合特定的平衡节点可以用来修正数据集中的不均匀性,以便能够符合特定的 测试原则,如图测
19、试原则,如图19-20所示为平衡对话框。所示为平衡对话框。 相关参数的说明如下: 记录平衡指令:列出目前的平衡指令。每一指令都包括一个因 子和一个条件,使软件在条件为真时,根据指定的因子,提高 记录的比率。 添加指令:通过点击文本区域右边的“生成新字段”按钮,会 插入一行空行以便输入新的条件。如果要为此条件生成CLEM 表达式,可点击“表达式构建器”按钮。 删除指令:使用红色的删除按钮。 对指令排序 :使用上下箭头按钮。 19.2.4统计汇总统计汇总 图图19-21 一个汇总节点实例一个汇总节点实例 汇总节点可以把一汇总节点可以把一 系列输入记录变换系列输入记录变换 成总括性的、汇总成总括性的
20、、汇总 的输出记录,汇总的输出记录,汇总 对话框如图对话框如图19-21 所示。所示。 分组字段 :列出可用于汇总的分组字段。数值型字段和字符型字段都可以用作分组字段。如果所选组合字 段不止一个,则所有值将组合起来生成汇总记录的组合字段。各个不同的分组字段会产生一条集成记录。 例如,如果Sex和Region是组合字段,则M与F和地区N与S的各个不同组合(一共四个不同的组合)将会有一 条汇总记录。要添加一个组合字段,使用窗口右边的“字段选取器”按钮。 数据已按分组字段排序:若分组字段值出现在相邻记录中,该选项按相同值处理。 汇总字段:列出将按照所选汇总模式汇总的数值型字段。若要添加字段到列表中,
21、可使用窗口右边的“字段 选取器”按钮。 默认模式:指定对新添加的字段所使用的默认汇总模式、如果频繁使用同样的汇总方式,此处可选择一个或 以上的模式,使用右边的 “所有默认操作”按钮将所选模式应用于以上列出的所有字段。 在 Clementine 中可以使用以下汇总模式: (1)合计(2)平均值(3)最小值(4)最大值(5)标准差 新的字段名扩展:选择添加“后缀”或“前缀”,以复制汇总字段。比如,如果选择了后缀选项,并规定“1 为扩展名,则对字段 Age 的最小值汇总结果会产生成名为 Age_Min_1 的字段名。 在字段中包括记录计数:选择在每个输出记录中包括一个名为 “记录记数” 的额外默认字
22、段。这一字段表 明有多少输入记录被用于形成每一汇总字段。 19.2.5对节点数据的排序对节点数据的排序 排序节点根据一个或多个字段值对记录进行升 序或降序排列。 一般做法是:首先使用汇总节点汇总数据,然 后使用排序节点将汇总数据按照记录数目降序 排序。将这些结果显示在一个表中,会有助于 探索分析数据并作出决策。 19.2.6合并节点合并节点 图图19-22 合并节点的设置合并节点的设置 合并节点的功能是接受 多重输入记录,并生成 包含部分或全部输入字 段的单一输出记录,这 一操作在合并来自不同 数据数据源的数据时很 有用。如图19-22所示 相关的参数设置如下: 合并方法: (1)按照顺序合并
23、:按照输入顺序连接来自所有数据库的对应 记录,直至最小的数据源输入完毕。 (2)按照关键字段合并:使用诸如用户 ID号等作为关键字段, 以指定来自某一数据库的数据在合并时如何与来自其它数据库 的数据匹配。 可能的键值:列出所有输入数据源中的所有字段。 用于合并的键值 :列出用于合并所有输入数据源的记录的关 键字段。 合并重复关键字段:当选择了不止一个关键字段时,这一选项 确保一个关键字段名只有一个输出字段。 只包含匹配记录(内部连接):选择只合并完整的记录。 包含匹配的和不匹配记录(完整的外部连接):表示如果某一 关键字段存在于其中的一个数据源,而在其它的数据源中不存 在,则不完整的记录仍然保
24、留着 包含匹配的和选定的未匹配记录(部分外部连接):要求指定 一个用于保留在合并过程中不完整的记录。 包含第一个数据集中的且不与任何其他记录相匹配的记录(反 连接):仅保留第一个数据集和其他数据集的不匹配记录。 19.2.7追加节点数据追加节点数据 图图19-23 追加节点的设置追加节点的设置 追加节点读取并下传来自 同一数据源的所有记录直 至该数据源不再有记录为 止,然后使用与读取首个 输入数据源记录相同的数 据结构(记录和字段数目 等)读取下一个数据源的 记录。如图19-23所示 相关参数的说明如下: 字段匹配依据 :选择附加匹配字段的方法,又两种设置,分别为: (1)位置(2)名称 输出
25、字段 :列出连接到追加节点的数据源节点。 包含字段数据源 :选择“仅主数据集” 以生成基于主数据集字段的输出字 段。选择“所有数据集” 以生成所有数据集中所有字段的输出字段而不考 虑是否有匹配所有输入数据集的字段。 生成新字段,显示记录的数据源数据集:选择在输出文件中添加一个附加 字段,该字段表明每个记录的数据源数据集。 19.2.8区分节点来清除重复记录区分节点来清除重复记录 图图19-24区分节点的设置区分节点的设置 区分节点可以用来区分节点可以用来 清除重复性记录清除重复性记录 , 其对话框如图其对话框如图19-24 所示所示 19.2.9对数据的统计输出实例对数据的统计输出实例 【例1
26、9-2】利用Clementine系统提供的数据集snapshottestn.db,分析不同 性别不同区域未生育人员的平均年龄和平均收入,并按平均收入降序排列 输出到表格中。 其分析和步骤如下: (1)在数据流程区域中加入一个变项文件节点以便读取数据集 snapshottestn.db,一个选择节点用于筛选出未生育的人员,一个汇总节点 对不同性别不同区域人员的平均年龄和平均收入汇总,一个排序节点对汇 总出的平均收入进行降序排列,一个表节点以显示分析结果。并将这些节 点依次连接,如图19-25所示。 图图19-25 一个记录选项节点实例一个记录选项节点实例 图图19-26 在在“ “打开 打开”
27、”对话框中选择 对话框中选择snapshottestn.db文文 件件 (2)双击变项文件节点,打开其对话框,并点击)双击变项文件节点,打开其对话框,并点击 自定义(自定义()按钮,在弹出的)按钮,在弹出的“打开打开”对话框中选对话框中选 择择snapshottestn.db,如图,如图19-26所示。所示。 (3)点击)点击“打开打开”按钮,读取数据集按钮,读取数据集 snapshottestn.db,如图 ,如图19-27所示。所示。 图图19-27读取数据集读取数据集snapshottestn.db (4)双击选择节点,打开其对话框,并在)双击选择节点,打开其对话框,并在“条条 件件”框
28、中输入框中输入“children=0”,如图,如图19-28所示。所示。 图图19-28 键入未生育人员的条件键入未生育人员的条件 (5)双击汇总节点,打开其对话框,选择)双击汇总节点,打开其对话框,选择Sex和和 Region字段作为分组字段, 字段作为分组字段,Age和和Income 作为汇作为汇 总字段,并选择这两个字段的总字段,并选择这两个字段的“平均值平均值”复选框求复选框求 平均年龄和平均收入,如图平均年龄和平均收入,如图19-29所示。所示。 图图19-29求不同性别不同区域未生育人员的平求不同性别不同区域未生育人员的平 均年龄和平均收入均年龄和平均收入 (6)双击排序节点,打开
29、其对话框,选择)双击排序节点,打开其对话框,选择 income_mean作为排序字段,其顺序为降序,如 作为排序字段,其顺序为降序,如 图图19-30所示。所示。 (7)双击表节点,打开其对话框,并点击)双击表节点,打开其对话框,并点击“执行执行” 按钮,得到如图按钮,得到如图19-31所示的结果。所示的结果。 图图19-30 按平均收入降序排列按平均收入降序排列 图图19-31显示分析结果显示分析结果 19.3对字段数据的进一步处理对字段数据的进一步处理 字段选项节点选项板包含以下节点: 过滤 导出 填充 重新分类 分级 分区 设为标志 从新结构化 转置 时间区间 历史 字段重排 图图19-
30、32字段选项节点选项板字段选项节点选项板 19.3.1类型节点类型节点 图图19-33类型节点的设置类型节点的设置 类型节点指定字段类型节点指定字段 的一系列重要属性。的一系列重要属性。 我们可以实现对类我们可以实现对类 型节点进行特征描型节点进行特征描 述、实例化、对缺述、实例化、对缺 失数据的处理等等。失数据的处理等等。 19.3.1.1类型节点数据类型类型节点数据类型 在Clementine中数据使用下列类型: 连续型:用于描述数值。 离散型:用于当一个具体值的精确数量未知时描述字符串。 标志型:用于只取两个具体值的数据,如T或F,Y或 N,0或1。 集合型:用于描述带有多个具体值的数据
31、,每个值作为集合中的一个元素 ,如高、中、低。 有序集合型:用于描述带有多个具体值且有内部顺序的数据。如工作类别 无类型:用于不符合上述任一种类型的数据或者含有太多元素的集合类型 数据。这对于类型是含有众多元素的情况很有用。 数据类型以下列两种方式中的任意一种存在或得到: (1)从类型节点或者数据源节点手动设置类型。 (2)自动定类,或者让软件读取数据并基于其所读取的值来确定类 型。 下列方法用于使软件决定数据字段的使用类型: (1)在流程中插入类型节点,并将“值”栏设置为或者。 (2)使用数据源节点的类型标记,对于所有字段,都把“值”栏设 置为。 (3)在一个流程中把一个终端节点附加到类型节
32、点上。 手工设定字段类型的步骤: (1)选择表格中的一个字段 。 (2)从类型栏的下拉菜单中 为字段选择一个类型。 (3)在使用下拉菜单选择一 种类型之前,用户也可以采 用Ctrl+A或者Ctrl+Click方 法选择多个字段。 图图19-34手工设置字段类型手工设置字段类型 19.3.1.2实例化实例化 定义:实例化是读取或详细说明信息的过程。 数据的执行有3种方式: (1)为实例化 (2)部分实例化 (3)完全实例化 在以下情况时,类型节点上的实例化是有用的: (1)数据集较大,而且流在类型节点前就过滤了子集 。 (2)数据在流程中被过滤 。 (3)数据在流程中被合并或附加。 (4)在处理
33、过程中导出新的数据字段。 19.3.1.3设置字段方向设置字段方向 指定一个字段的方向可以为建模节点提供有用信息,它们可以告诉建模引 擎,字段可用于哪个方向。设置类型节点的定位选择如图19-35所示。 图图19-35 设置字段方向设置字段方向 19.3.1.4复制类属性复制类属性 步骤如下: (1)在要复制属性的字段上单击鼠标右键,选择“复制”。 (2)在要改变属性的字段上单击鼠标右键,选择“选择性粘贴”。 (3)选择欲贴上的属性栏 。 当用户想要粘贴上时,一个新对话框(类型节点粘贴选项对话框,如图19- 36所示)就会打开,从中可以选择具体属性进行粘贴。 类型节点粘贴选项类型节点粘贴选项 对
34、话对话 19.3.2对节点数据的过滤对节点数据的过滤 用户可以用过滤节点对话框中的选项重命名或过滤掉重复的或 下游操作不必要的字段。过滤节点对话框如图19-37所示。 图图19-37 过滤节点对话框过滤节点对话框 相关参数的说明如下: 字段:显示目前连接的数据源字段。 过滤:显示所有输入字段的过滤状态。已过滤字段包括此栏中 的一个红色,指出该字段在下游不会通过。 字段:当字段离开过滤节点时显示这些字段。重复的名字会以 红色显示。用户可以通过单击该栏并输入一个新的名称来编辑 字段名,或者通过点击“过滤”栏取消重复字段来剔除它们。 查看当前字段:选择观察与过滤节点连接的数据集的字段。 查看未使用的
35、字段设置:选择曾经观察但现已不再连接到过滤 节点的数据集的字段。 19.3.3导出节点数据导出节点数据 图图19-38导导 出节点出节点 的参数设的参数设 置置 19.3.3.1 多重字段的导出多重字段的导出 图图19-39导出多重字导出多重字 段对话框设置页签段对话框设置页签 当用户选择“多重”模式时,下列选项会 添加到对话框设置页签中: 导出自:用字段选取器选择字段来导出新 字段。对于每一个选中字段都会产生一个 输出字段。 字段名扩展:键入用户想要增加到新字段 的扩展名。例如,对于一个含有变量 K,Na 对数化的新字段,用户可以增加扩 展名_derive2 到原字段名,即 K_derive
36、2 。 19.3.3.2公式节点数据公式节点数据 图图19-40导出公式节点对话框导出公式节点对话框 19.3.3.3标志节点的导出标志节点的导出 图图19-41导出标志节点对话框导出标志节点对话框 19.3.3.4导出集合节点导出集合节点 图图19-42 导出集合节点对话框导出集合节点对话框 19.3.3.5导出状态节点导出状态节点 图图19-43导出状态节点对话框导出状态节点对话框 19.3.3.6导出条件节点导出条件节点 图图19-44导出条件节点对话框导出条件节点对话框 其参数说明如下: If:指定一个 CLEM 条件表达式,在执行时为每个字 段进行评估。如果条件为真(或者在数值的条件
37、下非 假),则新字段赋的值在下面的 Then 表达式中。 Then:在前面定义的 If 语句为真(或者非假)时, 给新字段赋一个值或者 CLEM 表达式。 Else:在前面定义的 If 语句为假时,给新字段赋一个 值或 CLEM 表达式。 19.3.4对节点数据的填充对节点数据的填充 图图19-45 填充节点对话框设置页签填充节点对话框设置页签 选择选择“字段选字段选 项项”“填充填充”菜单,菜单, 可以进入填充设置界可以进入填充设置界 面,如图面,如图19-45所示。所示。 用户可以选择使用以下方法替换选中字段的值: 根据以下条件:此选项激活“条件” 字段和“表达式构建器”图标按钮, 创建一
38、个表达式,以此作为用指定值作替换的条件。 始终:替换所有被选中的字段的值。比如,用此选项通过CLEM表达式( to_string(income))把income 的存储值转换成字符串。 定义缺失值: 替换被选中的字段中所有用户指定的空值。标准条件 BLANK(FIELD)用来选择空缺。 数值型空值:替换被选中字段中的所有系统无效值。标准条件 NULL(FIELD)用来选择无效值。 空白值和数值型空值:替换被选中的字段中的空值和无效值。 19.3.5为节点数据设置标志为节点数据设置标志 图图19-46设为标志节点的设置设为标志节点的设置 设为标志节的设置包括以下几个方面: 集合字段:列出数据中已
39、经设置了的类型的所有字段。 字段名扩展:选择来启动设置扩展名的控件,这些扩展名将作 为新的标志字段的前缀或后缀。 可用的集合:此项用于显示上面操作中从数据集选中的域值。 选择一个或更多域值用来创建标志。 创建标志字段:此项用于显示新创建的标志字段。 汇总分组字段:在以下定义中的关键字段的基础上选择一组记 录。一旦选择“汇总分组字段”,如果所有记录设置为真,则 将打开所有的标志字段。 19.3.6分析医生开处方药的依据实例分析医生开处方药的依据实例 【例19-5】利用Clementine系统提供的数据集 Drugn1,分析医生开取药方的参考依据。 其分析和步骤如下: (1)在数据流区域中加入一个变项文件节点并读取 在数据流区域中加入一个变项文件节点并读取 数据集数据集Drugn1,如图,如图19-47所示所示为读取的数据。所示所示为读取的数据。 图图19-47 读取
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湿地生态系统恢复技术研究-洞察及研究
- 光场同步与光相干长度的同步机制-洞察及研究
- 宠物美容服务行业创新案例研究-洞察及研究
- 智能钻井决策支持系统-洞察及研究
- 基于跨平台融合的广告片交互技术研究-洞察及研究
- 保险业数据挖掘技术-洞察及研究
- 做中成长 传承饺子文化说课稿小学劳动冀科版六年级上册-冀科版
- 2024年五年级数学下册 五 方程5.4 解方程(二)说课稿 西师大版
- 人教版九年级道德与法治上册 6.1正视发展挑战 说课稿
- 2.5 一元一次方程 教学设计2024-2025学年北京版(2024)数学七年级上册
- 2025-2030中国在线总有机碳(TOC)分析仪行业市场现状供需分析及投资评估规划分析研究报告
- 合伙购买墓地协议书
- 英语教学课件Unit 2 Different families课件9
- 医学综述研究进展汇报
- 2025年福建省泉州市中考二模历史试题(原卷版+解析版)
- 2025春 新人教版美术小学一年级下册致敬平凡
- 危险废物分析制度
- 换药室工作制度
- 宜家在物流成本管理上的问题及对策
- 水资源开发与保护联合协议
- 社区康复服务在医疗旅游中的价值体现
评论
0/150
提交评论