版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录TOC\o"1-3"\h\u1绪论 绪论1.1研究背景在2018年发表的《中国城镇居民心理健康白皮书》中,对中国城镇居民当前心理健康状况的调查结果显示,73.6%的居民处于心理亚健康状态,16.1%的居民存在不同程度的心理问题,而只有10.3%的人处于心理健康状态[1]。因此,我们需要加强对心理健康问题的认识,推动心理健康问题的研究,不断研究不同群体的心理健康特点和心理健康治疗对策。掌握全国总体心理健康水平、心理健康状况的变化趋势、不同群体的心理健康特点、群体和个体层面的心理健康影响因素,心理健康问题的影响等数据对制定相关指南和开展相关工作具有重要参考价值。为了更好地了解人们的心理健康状况,许多专家和学者开始研宄在线的心理测评系统。希望通过心理测评系统来了解国民的心理健康问题。而在心理测评系统中,其中最重要的一部分就是对所有最终测评结果进行分析,挖掘出其潜在的价值,找到数据中存在的客观规律,这有利于心理健康工作的开展。心理评测系统是把传统的线下的心理评测和心理咨询搬到互联网上,通过在线的方式进行心理方面的评测、咨询和治疗[2]。心理评测系统一般是由量表管理系统,用户管理系统,心理评估系统,危机预警系统、和网上咨询系统等相关子系统构成,对于这种功能比较综合全面的服务系统,在心理领域方面又称之为心理云系统。数据挖掘一般是指从大量数据中通过算法搜索隐藏信息的过程。目前,数据挖掘技术在电信、金融、零售等行业的应用己经卓有成效。如果同样将数据挖掘技术应用到心理健康管理系统的开发中,并且通过相关算法对学生心理健康档案中大量模糊、随机的数据信息进行相关处理,挖掘出潜在的有价值的信息,这在一定程度上有助于心理咨询师提高工作效率,能够更科学、快速地对患者进行心理判断,并及时进行对患者进行心理咨询和干预。1.2研究意义本课题主要是研宄用户基础属性信息和量表测评因子结果之间潜在的规律,采用数据挖掘技术,通过实验对比建立算法模型,挖掘出数据之间的潜在规律,并最终应用到“贵商青年”公众号中,设计出用户心理画像模块,与“贵商青年”公众号系统配合使用。2相关理论及技术2.1用户心理画像的概念用户心理画像是在用户画像研究的基础上进一步的精细化的分析。建立用户画像,可以更加细致的抽象出用户的全貌信息,可以通过跟踪了解用户需求的变化分析研究用户需求改变的本质原因,然后对客户实现精准营销,同时建立用户画像也越来越成为更加成熟的数据分析方法。以下学者对用户画像做了不同的定义。用户画像的概念最早是由交互设计之父A.Cooper提出的,他首次将用户画像的概念定义为:基于用户真实数据的虚拟代表[3]。Amato,R.M.Quintana[4]等学者将用户画像定义为:“一个从海量数据中获取的、由用户信息构成的形象集合”,用户的基础属性信息、兴趣、个性化偏好和用户需求等信息都可以通过这个集合去描述。王宪朋[5]把用户画像的定义概括为三个方面:第一方面是用户画像构建的基础和前提是用户数据的获取,获取数据是创建用户画像的首要之基;第二方面是构建用户画像要和具体也无需求紧密结合,要构建契合业务特定需求的准确的用户画像,必须要体现出业务特色;第三方面是构建数学和算法模型,要从海量无规律的数据中发现隐藏的更深层次的用户信息,创建用户画像并直观地显示有价值的用户数据信息。余梦洁认为,用户画像是大数据环境下用户信息标注的一种方法,即大数据为他提供了一个数据库。然后,通过提取用户标签信息,可以完美地呈现用户的全貌,最终形成虚拟用户的全貌,即用户画像。综上所述,用户画像的内涵可以概括如下:首先,用户画像是用户真实数据的虚拟代表,是具有相似背景、兴趣和行为的用户在使用产品或服务时的共同特征。其次,用户画像是对静态和动态属性特征提取后的“典型用户”进行刻画,这是一种具有显著特征的用户群体概念模型。最后,用户画像强调用户的主体地位,突出用户的具体需求。2.2心理数据挖掘研究理论基础数据挖掘是从海量的、有噪声的、模糊的、非完整的、随机的数据中提取隐藏的、潜在的、但又有使用价值的信息和知识的过程。通俗地讲,数据挖掘就是从数据中挖掘知识。获取的知识通常使用规律、概念、模式和规则等方式表示呈现,然而获取知识的原始数据通常是半结构话或者是结构化的,也可能分布在不同的数据网络结构中,这大大增加了知识发现的难度。随着网络科技的发展,信息领域的知识也在不断积累,从大量的数据中提取有价值的信息己经成为重要的研宄焦点。数据挖掘就是顺应这种趋势产生的,它是数据的管理和分析技术,是知识发现的重要手段[6]。根据不同的应用场景,它通常包括数据分类、关联分析、预测时序模式、聚类和偏差分析等不同方面的知识发现。随着各种各样的应用环境的变换、不同需求的差异、以及适应于不同的数据挖掘算法中也有各自的属性和使用过程,数据挖掘的基本过程也会有相应的变化,但是最基本的过程还是围绕着以下几个步骤,如图2-1所示:图2-1数据挖掘过程2.3心理健康预测算法2.3.1聚类分析算法聚类分析(clusteranalysis)也称为聚类(clustering),随着时代的发展,聚类成为数据挖掘领域一个非常重要的分支,同时也是最有潜力和发展的研究领域之一,它被广泛的应用在教育、金融、商务、生物等不同学科的各个领域。例如,在生物学中,使用聚类推导动植物之间的分类、对基因进行分类,从而获取对陌生种群的固有结构的认识[7]。聚类是一种统计分析方法,通常是依据事物自身的特性,通过它们之间某种相似度进行类别的划分,最终划分为不同的子集,这划分出的每个子集又称为簇(cluster),每个簇之间的数据彼此相似,但是不同的簇和簇之间彼此存在很大的差异性[8]。聚类不仅可以作为一种单独使用的工具去挖掘数据样本中的一些潜在未知的、深层次的信息,而且可以作为其他数据挖掘算法的一个预处理方式,把相关数据筛选出来,进行进一步研究。聚类分析过程一般分为:1.数据预处理,即对数据进行初步筛选过滤、标准化、降维、转换;2.定义相似度量。相似度量即数据对象两者之间的距离函数,通过它来计算它们是否属于同一簇。;3.聚类,选择合适的聚类算法进行聚类,得到聚类结果。4.进行聚类结果评估,即使用评价指标对聚类结果进行评估。5.结果解释,将聚类最终的结果转换成生活特定场景中有用的知识[9]。聚类的方法有很多,主要可以分为划分式聚类方法((Partition-basedMethods),基于密度的聚类方法(Density-basedmethods)、层次化聚类方法(HierarchicalMethods)等。分式聚类方法需要首先指定初始化聚类数目或类簇中心,通过反复迭代,直至最后达到”簇内的点足够近,簇间的点足够远”的目标。经典的划分式聚类方法有k-means及其变体k-means++、bi-kmeans,kernelk-means等。基于密度的聚类方法方法最大的特征就是它不是基于距离计算的,而是通过密度计算的,方法的主要思想是:区域中的某个点的密度大于某个特定阈值,就把它归为与之相近的聚类中去[10]。代表算法有optics算法、dbscan算法等。层次化聚类方法是对给定的数据集进行层次化的分解聚类,将数据划分为一层一层的类簇,后面生成的一层类簇是基于前面的一层结果。常用算法有birch算法、cure算法等[11]。2.3.2决策树算法决策树算法是一种非常经典的采用逼近离散函数值的分类算法。它使用自顶向下的递归方法来构造决策树。首先,决策树主要由决策节点、分支和叶节点组成,决策树最上面的决策节点是根决策节点。每个分支都有一个新的决策节点。决策节点下面是叶节点。每个决策节点表示要分类的数据类别或属性,每个叶节点表示结果。整个决策过程从根决策节点开始,自上而下,根据数据的分类,在每个决策节点上交付不同的结果。从本质上看决策树整个建造的过程就是对一系列的数据通过相应规则对其分类。在早期,决策树主要的使用就是用于分类,随着科技的发展研究的深入,现在的一些决策树算法不仅仅适用于分类的问题,而且适用于回归问题。在这中,最经典的算法是ID3算法和C4.5算法,其中C4.5算法是从ID3算法中演进而来,是它的继承和改进[12]。通常情况下,决策树是根据某些情况下出现的概率来构建生成决策树的,它是一种评估项目风险的决策树方法,更是一种使用概率分析的图形方法。构建决策树首先要训练样本集,通过对样本集进行分类,产生最终的决策集合。整体来看,最终的决策树是由树状结构组成的决策集合,其叶子节点代表着属性类名,与决策根节点相连的叶子节点代表着一种分类,而从决策根节点到叶子节点之间的路径代表着属性的分类规则。3实验与结果分析3.1心理健康预测模型构建FCTCP模型是采用k-mean++算法和C4.5算法构建的先聚类再分类预测模型。因为仅使用C4.5算法其建立的决策树进行分类预测时与建立模型输入的数据集有很大关系,影响其最终的决策路径的建立[13]。FCTCP模型通过使用k-mean++算法对数据集中的基础信息数据进行聚类,把具有相似属性的人归为一类,改变了建立决策树的数据集仅在这一组群内在进行预测分析。FCTCP模型主要利用k-mean++算法首先对数据集中被试人员的基础信息属性进行聚类,把被试人员数据分成不同组,意义在于相似基础属性的人员归为一类;然后把分成的每组数据作为一个新的数据集,通过基础信息作为属性,健康因子作为标签,建立决策树,进行类别预测;当测试数据进行预测时,要首先根据基础信息进行分类,然后在根据其类别进行预测。这个过程中,首先是对数据进行聚类,但是实际情况,我们未知聚类的初始个数,因此我们需要根据聚类的效果对其进行调整,然后根据评价指标选择合适的聚类个数。根据第二章中介绍,聚类效果的评价指标众多,基于轮廓系数具有较好的区分度,本文选用轮廓系数作为评价指标。下面介绍FCTCP模型的具体构建过程。第一步:选择初始化聚类个数,通过使用k-means++算法对数据集中B部分数据进行聚类,根据轮廓系数指标,选择合适的聚类个数。第二步:根据“第一步”选择的聚类个数进行聚类,使用k-means++算法对数据集中B部分数据进行聚类,对把数据聚为sum个群组。第三步,使用C4.5决策树算法,对sum个群组分别建立决策树。例如:要观察a、c、d对y的影响,则抽出每个群组中C中的a、c、d作为属性,y作为标签分别建立决策树,如图3-6所示:图3-1FCTCP模型通过上述方式建立好模型,当需要对一条数据进行预测时,只需要把数据处理成样本一样的格式,然后输入模型,模型会首先对这个数据的B部分进行聚类,根据所属类别,进行入其建立的决策树进行预测,得到最终结果[14]。3.2模型的实证检验FCTCP模型主要分两步首先是通过k-mean++聚类算法进行分类,然后在根据所分得类别使用C4.5算法建立决策树。因此在本模型中使用k-mean++聚类算法进行分类的初始值个数设定至关重要。本文采用轮廓系数法作为内部评价指标去检验聚类的效果,原因是轮廓系数法结合了内聚和分离的两种因素,非常适用于本类型数据集。其中轮廓系数的公式(3-1)为:S=(b-a)/max(a,b),其中a是单个样本离同类簇所有样本的距离的平均数,b是单个样本到不同簇所有样本的平均。(1)确定聚类初始化个数首先初始化聚类个数范围[2,9],然后使用轮廓系数评价算法进行测试,结果如下图3-2所示。使用轮廓系数确定合适的聚类数目,是可以通过前后两个轮廓系数的差值确定,差值越大的点就是最好的聚类数目。如下面折线图所示斜率越大的前面的那个点就是最合适的聚类数目,因此选择聚类个数为6时,聚类效果最好。图3-2轮廓系数折线图(2)实验对比FCTCP模型初始化聚类个数为6,与参照实验RE作对比。使用测试集,利用基础信息数据对分别身体不适、强迫症状、人际敏感、抑郁情绪、焦虑情绪、情绪冲动和恐怖症状心理健康因子进行预测结果如图3-3所示:图3-3模型FCTCP和RE对比结果从图4-2中我们可以看出,在对整体心理健康因子预测的过程中,本实验的模型要比参数实验(RE)预测结果要好,尤其在对人际敏感、抑郁情绪和思维异常因子预测的结果中表现更好。虽然在焦虑情绪、情绪冲动和恐怖症状因子预测的结果中表现得优势不够明显,但是整体而言是比RE实验要好。因此,模型FCTCP首先对整体数据集进行分类是有价值的,证明该模型是有效的。4模型在“贵商青年”公众号中的应用4.1需求分析4.1.1系统的功能需求“贵商青年”公众号系统主要包括用户管理功能、心理评测功能、量表管理功能、预警管理功能等。各个功能之间相互协调工作,可以很高效系统地反映被试用户的心理健康状况和心理素质水平,并且为心理健康教育和心理健康工作者提供直接现实的评测依据。作者的主要工作是建立用户心理画像,利用数据挖掘相关技术,将用户心理画像嵌入到“贵商青年”公众号中,主要是利用公众号中现有的数据资源进行采样,然后对数据进行清洗,选择合适的数据,除去数据中不相关数据和“噪声”,这个过程中不可避险的要使用到用户管理和量表评测的相关性功能。下面主要介绍相关重要功能的相关需求:(1)用户管理需求这里讲的用户管理主要是被试用户管理,系统管理员可以对被试用户进行新增、查询、启用、废除和恢复密码等常见操作。同时系统提供学生导入模板,模板中学生的基本信息均需严格按照教育部的要求,涵盖需考查的所有个体背景变量,如性别、年龄、是否独生子女、户口所在地、家庭情况等人口学和社会学变量。学生信息可以采用EXCEL格式一次性导入系统或直接调用导入学校学籍信息。导入的被试人员数据具备预览功能,可预览被试人员数据和机构数据的正确性,可随时取消导入操作。对于未导入成功的数据,给出详细的错误类型提示信息,便于及时修正后重新导入。(2)心理评测需求管理员可以对个体、团体建立评测计划,同时可以查询评测结果。个体心理评测主要分为添加、修改个人评测计划;团体心理评测方面也分为添加团体评测计划和修改团体评测计划。同时可以查询评测计划、完成评测计划和评测详情等。评测结果主要包括查询测评结果列表、查看团体评测详情、查看个人评测结果详情等相关功能。图3-1是心理评测需求用例,主要展示了管理员与心理评测需求中相关功能之间的关系。图3-2用户画像需求用例图根据上述三个功能需求分析不难看出,用户管理和心理测评是用户画像建立的基础,因为用户画像的建立需要用到用户的基础信息和心理评测的信息,所以本文主要选取这三个主要功能重点介绍。4.1.2系统的非功能需求“贵商青年”除了满足用户的功能需求外,公众号中用户心理画像功能还对软件的可用性、可维护性和安全性提出了一定的要求。这就需要在软件设计之前充分理解这一需求,开发出一个完整的用户心理画像功能软件,以满足用户的基本使用需求和用户体验。系统的非功能性需求一个接一个地呈现出来。1.软件易用性“贵商青年”公众号软件需要满足普通用户在易用性方面的需求。软件的设置项目应尽可能少,以减少不必要的设置。管理员可以通过系统管理界面上醒目的操作按钮,通过简单的操作来添加、更新和删除相关信息。对于模型维护模块,维护人员可以通过页面的快捷操作完成模型的迭代和发布。因此,系统维护的效率可以大大提高。2.可维护性“贵商青年”公众号中相关模块的开发和设计应满足可维护性要求。整个系统采用微服务的设计方法。微服务将单个应用程序分解为一组小服务。所有小型服务独立运行、独立提供并相互合作以满足需求。同时,微服务体系结构中的服务可以作为进程外组件独立部署和访问。此外,微服务体系结构具有网关、负载平衡、配置管理和备份等基础设施,可以有效地管理服务集群。因此,有必要确保每个模块的迭代更新和可维护性。此外,在一个真实的操作系统中,系统开发是通过前后端分离的设计进行的。后台服务的开发遵循控制层、业务逻辑层、数据访问层和数据层的体系结构。后台服务与表示层之间的通信采用前后分离的通信设计。通过设计系统的每个级别,系统功能逻辑被分配到每个相应的级别。通过以上设计,系统分工明确,便于系统维护[15]。3.安全性用户心理数据挖掘软件在安全性上也有较高的需求。用户的基础户信息数据和心理健康因子测评数据都是一些高敏感数据,因子在数据传输的过程中要注意数据的加密。4.2系统总体设计4.2.1系统架构设计“贵商青年”公众号系统的整体架构,本着“高内聚,低祸合”的体系要求,采用了用户界面、网关、后台服务和存储等四层的架构方式;其中用户界面采用前后端分离的方式。后台服务是采用了微服务的架构方式,选择使用基于领域划分的方法进行划分。首先,抽取公共服务,根据业务的相关性,从心理测评系统中抽取三个公共服务分别是网关服务、字典服务和统一登录服务。这些服务变化性较小可独立升级。其次,根据系统业务场景划分业务服务,例如:把用户在线答题测评的过程及分数的相关计算这一业务划分成一个单独的服务即在线测评服务;把管理量表的添加、删除等先关业务划分成量表管理服务等等[16]。整个系统的架构图如图3-3所示。图3-3“贵商青年”公众号架构图(1)用户界面层用户界面层是用户通过web浏览器与系统进行数据交互的过程。在该系统中,用户界面主要分为三个交互界面:用户门户、后台管理和应用端。该层的主要功能是接收和显示用户通过该层输入的数据,操作员管理和维护系统数据源和用户基本信息。计算收集的信息,以获得表面结果信息,并呈现数据挖掘生成的价值信息[17]。(2)网关服务层网关服务主要的功能是路由转发和充当过滤器的功能。路由转发:接收一切外界请求,转发到后端的微服务上去;过滤器:在服务网关中可以完成一系列的横切功能,例如权限校验、限流以及监控等,这些都可以通过过滤器完成。(3)后台服务层后台服务层是中间业务逻辑层,其基本功能是响应和处理前端用户界面的应用需求。在这个系统中,这一部分接管了微服务的类型,并以基于域的方式划分了整个服务,因此每个服务独立地负责一项任务。该层从逻辑上分离最初放在前端用户层的内容,并将它们放在服务器应用层。在完成thinglogic的计算任务后,处理结果将返回给前端用户。心理健康信息的收集、数据挖掘和分析过程都体现在这一层面。(4)数据存储层数据存储层用于存储用户交互生成的数据和用户的一些基础数据。该层的主要功能是向系统的每一层提供采集、存储的数据和处理后的数据。数据库服务器保证了数据的有效传输和分析,使心理健康评估信息的数据能够长期存储。综上所述,从图3-3中展示的可以看出“贵商青年”公众号系统非常复杂,本文主要是针对作者实现及与用户心理画像相关的功能进行分析,下面会对用户管理服务、心理评测服务和心理画像服务进行重点分析。4.2.2系统要功能模块设计根据上面的需求描述下面分别对用户管理、心理测评和用户心理画像进行详细的功能模块设计。(1)用户管理模块本模块是系统管理员对被试用户进行管理的一些功能设计,系统管理员可以对被试用户进行查询、新增、更新、启用、废弃、恢复密码、批量导入操作。查询被试用户:管理员可以通过具体的筛选条件来选出想要查看的被试用户信息。新增和更新被试用户:新增和更新这个两个功能主要是对被试者的用户信息进行维护,前者是从无到有的添加,后者是对被试用户的修改。启用和废弃被试用户:当被试用户不在该系统中使用时,可以选择废除该用户,比如:当被试用户从该学校毕业了,管理员可能会废除该用户。同时与之对应的启用功能和其有相反的功能。恢复密码功能:当被试用户忘记密码时告诉管理员,管理员可以通过查询被使用户功能,为其恢复初始密码。导入被试用户功能:当系统需要录入一大批被试用户时,可以选择导入功能。用户管理模块功能图如图3-4所示。图3-4用户管理模块功能图(2)心理评测模块根据心理评测需求分析提取心理评测功能模块,心理评测模块主要包括个体心理评测、团体心理评测和评测结果三方面。它们每个功能模块下面又包括了更详细的子功能模块分别如下:个体心理评测模块包括三个子功能模块分别为添加个人评测计划、修改个人评测和删除个人评测计划。团体心理评测模块与个体心理评测模块类似也包括三个子功能模块分别为添加、修改、删除团体评测计划。评测结果主要包括查看团体评测结果、查看个人评测结果和下载评测报告三方面的功能。另外,整个心理评测模块还包括公共的查询评测计划、完成评测计划、发布评测计划。具体心理评测模块功能图如3-5所示。图3-5心理评测模块功能图(3)用户心理画像模块根据上述需求分析可知,用户心理画像的需求重点是用户画像的建立和查看,用户心理画像的建立需要用到用户管理功能和心理评测功能模块产生的数据信息。根据用户心理画像整体对外展示的数据信息可以把它分为三个模块分别是基础属性信息模块、心理预测信息模块和心理评测信息模块,用户心理画像模块图如图3-6所示。基础属性信息模块主要是展示查看用户与心理预测信息相关的自身基础属性信息。心理预测信息模块是查看用户心理健康因子预测情况,它的实现主要包括三部分分别是数据处理、构建模型和数据预测。其中数据处理是提取数据库中用户基础数据和评测数据依据上述第三章讲述的数据预处理方法对其进行预处理;构建模型其本质就是根据预测因子选择是使用FCTCP模型还是选择CACS模型,确定模型初始参数对其进行预测;数据预测就是根据该用户的基础属性信息对其心理健康因子进行预测。心理评测信息模块就是展示该用户通过心理量表评测最终得到的评测结果值。4.2.3数据库设计(1)概念模型设计数据库设计中的一个很重要的部分是概念模型设计,其最典型的方法是采用E-R模型图设计。E-R模型是由实体,属性和联系三部分组成,它能够非常清楚的展现出实体与实体之间的关系以及实体中的具体属性。本文主要设计了和研究内容相关的数据库E-R模型图如图3-7所示,从图我们可以看出一个被试用户可以有多个评测计划,同时一个评测计划也有多个被试用户,因此它们是多对多的关系。每个被试用户对应一张心理因子预测表,因此它们之间是一对一的关系。另外,每个被试用户可以测量多张量表,但是每个量表只允许测一次,因此它们之间是一对多的关系。图4-7数据厚主要关系E-R模型(2)逻辑模型设计上述概念模型设计主要展示了实体与实体之间的关系,下面分别介绍每个实体的主要逻辑模型,即每个表的具体设计和属性。1)被试用户表用户表基础信息表主要记录的是一些用户登录系统的信息和用户本身的基础信息,例如用户登录系统所用到的用户名、密码以及用户此时在系统中的状态,另外被试用户基础信息主要指其真实姓名、年龄、身份证号、是否单亲等基础信息,被试用户表如下表4-1所示:表4-1用户基础信息表字段名称字段类型字段长度字段描述idint11自增主键usernamevarchar40用户名passwordvarchar40密码truenamevarchar40真实姓名sexvarchar5性别birthdaydata30出生日期phonevarchar20电话typevarchar80身份类型residentidvarchar20身份证号Singleparentfamilyvarchar4单亲家庭orphanvarchar4是否孤儿livewithfamilyvarchar4是否与父母同住Onlychildvarchar4是否独生子urbanresidentsvarchar4是否城镇居民maritalstatusvarchar10婚姻状况familyrankingint8家庭排行hobbymediumtext爱好createtimedata创建时间2)量表信息表量表信息表主要包括量表类型、名称、状态信息等属性,它和因子量表是一对多的关系,其详细设计见表4-2所示:表4-2量表信息表字段名称字段类型字段长度字段描述idint11自增主键typevarchar255字典项类型namevarchar100量表名称statevarchar10量表状态infovtext500量表信息instructiontext500量表指导语createtimedatetime量表创建日期modifytimedatetime量表修改日期Suitableagestartint11量表适用年龄Suitableageendint11量表适用年龄Suitablegendervarchar4量表适用性别Organizationidint11量表创建机构idtimelimitint11量表答题时间Creatoridint11量表创建人idcreatornameint11量表创建人姓名Organizationnamevarchar255量表创建机构名称verifytext500审核信息Filekeyvarchar255量表模板在OSS上文件名Savescalelongtext500保存量表时存储量表信息Isimgaeint11是否为图片量表Departmentidint11创建量表的部门id3)评测计划表评测计划表是当系统管理员建立评测计划时存储信息的表,其主要包括计划名、计划信息描述、计划的创建开始时间等信息。它和量表信息表是一对一的关系,一个评测计划可以选择一种量表。评测计划表具体设计如4-3所示:表4-3评测计划表字段名类型长度描述idint11自增主键scalejdint11量表名namevarchar255计划名planneridint11计划idcreattimedatetime创建时间starttimedatetime开始时间finishtimedatetime完成时间infotext500信息描述groupreportvarchar255团体报告statevarchar45计划状态group_namevarchar255团体评测名称orgnizationidint11机构idgroupidint11团体id4)评测结果表评测结果表主要记录用户id、评测状态、评测结果等信息,它和评测详情表存在一对多的关系,一个评测结果对应多条的评测详情信息。评测结果表详细信息表4-4所示:表4-4评测结果表字段名疝长度播述idint11自增主键planidint11测评计划iduseridint11用户idstatevarchar10评测状态reportvarchar255测评报告resultFloat16评测结果totaltimedouble20总耗时5)评测详情表评测详情表记录了计划id、题号、答案、分数等信息,其详细设计如表4-5所示。表4-5评测详情轰字段名长度描述idvarchar255uuidplanidint11计划idusejidint11用户idnumberint11题号answertext答案scoreint11分数secondsfloat12用时orgnizationjdint11机构id6)心理因子预测表心理因子预测表主要包含了用户id、因子id、预测值、更新时间等信息,它和被试用户表是一一对应的关系和因子表是一对多的关系,具体心理因子预测表如下表4-6所示:表4-6心理因子预测表字段名类型长度描述idint11自增idfactoridint11因子iduseridint11用户idpredictdouble20预测值datadatetime完成时间5总结随着计算机技术的发展,数据挖掘技术开始被应用于各个领域,并取得了较好的效果。本文同样借助于数据挖掘方面相关技术,将其应用于心理健康领域中去,针对被试用户的基础信息和量表评测数据进行分析,挖掘其中潜在的有价值的信息,并应用到实际的“贵商青年”公众号
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校场馆开放奖惩制度
- 学校校本培训奖惩制度
- 工地保安奖惩制度范本
- 市政环卫管理奖惩制度
- 制造业行政奖惩制度规定
- 如何给幼师制定奖惩制度
- 医院奖惩制度文件范本
- 商业项目招商奖惩制度
- 事故判定标准奖惩制度
- 幼儿园疫情考核奖惩制度
- 高中英语必背3500单词表完整版
- 土木工程专业认识教育课件
- 动脉血气分析六步法杜斌
- 说明书hid500系列变频调速器使用说明书s1.1(1)
- 全套电子课件:数据结构(C语言版)(第三版)
- 测量管理体系标准宣贯ppt课件
- 2020年小学中高年级书法教程ppt课件
- 前期手续横道图
- 计算机各种进制转换练习题(附答案)参考模板
- MFB60T系列自动封边机
- 非开挖水平定向钻牵引管专项施工方案
评论
0/150
提交评论