版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本和文本知识库中粗分类中的文本进行融合处个分类参数分别采用预选的分类模型对第二样文本知识库中的文本类别和数量实现对分类参2根据待分类文本和文本知识库形成第一样本集,所述文本知识根据所述目标数量确定聚类中心的数量,并在所述第一样将所述待分类文本和所述文本知识库中所述粗分类中的文本进行融合获取多个分类参数,基于每个所述分类参数分别采用预选的其中,在所述获取多个分类参数,基于每个所述分类参数分将所述第二样本集中除所述待分类文本之外的文本划分为第一测试集和第二采用最邻近节点算法,利用所述第一测试集对所述第二测试集中的每个样本进行分将所述第二测试集中分类错误的样本从所述第所述获取多个分类参数,基于每个所述分类参数分别采用预选的分类模基于每个所述分类参数采用最邻近节点算法对所述第二样本集进行分若存在超过预设数量的分类结果相同,则将相同的分类结果在所述第一样本集所包含文本知识库中的各类别文本中,分别获取所述第一样本集中的样本与每个所述第一聚类中心的距离若存在目标候选样本集中样本的数量小于第一预设数量阈值重新确定每个所述其他候选样本集对应的第二聚类中心,3若存在粗分类对应子分类中样本数量大于第二预设数量阈值的建立所述待分类文本与所述目标子类别中目标展示信息之间的对应第一样本集获取模块,用于根据待分类文本和文本知识聚类处理模块,用于根据所述目标数量确定聚类中心的数第二样本集获取模块,用于将所述待分类文本和所述文本分类处理模块,用于获取多个分类参数,基于每个所标子类别;将所述第二样本集中除所述待分类文本之外的文本划分为第一测试集和第二采用最邻近节点算法,利用所述第一测试集对所述第二测试集中的每个样本进行分将所述第二测试集中分类错误的样本从所述第基于每个所述分类参数采用最邻近节点算法对所述第二样本集进行分若存在超过预设数量的分类结果相同,则将相同的分类结果7.一种计算机存储介质,其上存储有计算存储装置,用于存储一个或多个程序,当所述一个或多个程序被器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的文本分类方4[0005]本公开的目的在于提供一种文本分类方法及装置、计算分类结果确定所述待分类样本所属的目标子类别。标数量的样本作为第一聚类中心,基于所述第一聚类中心对所述第一样本集进行聚类处5标候选样本集对应的类别,并将所述目标候选样本集中的样本分配至其他候选样本集中;样本集的数量少于所述候选样本集的数量;将所述待分类样本所属的目标样本集的类别,类中样本数量大于第二预设数量阈值的,则对所述粗分类对应子分类中的样本进行欠抽分类文本与所述目标子类别中目标展示信息据得到的多个分类结果确定所述待分类样本所属的目标子类别。6使得所述一个或多个处理器实现如上述任一项所[0020]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目[0022]图2示出了根据本公开示例性实施方式的基于第一聚类中心对第一样本集进行聚[0023]图3示出了根据本公开示例性实施例的基于每个分类参数分别采用预选的分类模[0024]图4示出了根据本公开示例性实施例的删除粗分类对应的细分类之间的重叠部分7[0031]附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对公开一示例性实施例中,文本知识库可以包括大量问题文本,如“社区组织形态是怎样8并基于得到的3个第一聚类中心,采用K均值聚类算法对第一样本集进行聚类处理,得到待9丢弃目标候选样本集对应的类别,并将目标候选样本集中的样本分配至其他候选样本集类中心,采用K均值聚类算法对第一样本集进行聚类处理,得到多个类别对应的目标样本[0058]在本公开的示例性实施例中,由于第二聚类中心的数量少于第一聚类中心的数[0059]通过本示例性实施例,在基于第一聚类中心对第一样本集进行聚类处理的过程结果对类别进行丢弃,并将被丢弃类别对应的候选样本集中的样本分配至其他候选样本[0067]图3示出了根据本公开示例性实施例的基于每个分类参数分别采用预选的分类模[0068]在步骤S310中,基于每个分类参数采用最邻近节点算法对述第二样本集进行分[0083]第二样本集获取模块530,用于将待分类文本和文本知识库中粗分类中的文本进[0090]聚类处理单元还用于基于第一聚类中心,采用K均值聚类算法对第一样本集进行[0093]样本处理单元,用于若存在目标候选样本集中样本的数量小于第一预设数量阈述聚类处理单元还用于基于第二聚类中心,采用K均值聚类算法对第一样本集进行聚类处[0107]由于本公开的示例性实施例的文本分类装置的各个功能模块与上述文本分类方单元的特征和功能可以进一步划分为由多个模块或[0110]参考图6所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序[0114]可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序[0116]下面参照图7来描述根据本公开的这种实施例的电子设备700。图7显示的电子设[0118]其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执[0119]存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元[0120]存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具[0121]总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储[0122]电子设备700也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备[0124]此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说适应性变化遵循本公开的一般性原理并
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026陕西延安市洛川县人民政府办公室大学生到政府机关见习工作30人备考题库附完整答案详解【有一套】
- 中石化招聘笔试题库答案
- 纪检监察领域题库和答案
- 护理伦理探讨:职业道德与法律
- 护理程序与护理评估工具的使用
- 2026-2030中国草本饮料市场营销渠道与未来价格走势预测报告
- 2026-2030中国副车架行业销售态势及投资盈利预测报告
- 某机械加工厂设备保养准则
- 某玻璃厂浮法管控办法
- 急救护理与应急处理
- 施工现场迎检布置实施方案
- GB/T 1969-2026多孔陶瓷渗透率试验方法
- 2025年湖南省张家界市事业单位人员招聘笔试试题及答案详解
- 2026贵州省专业技术人员继续教育公需科目考试题库
- 2026年重庆市中考历史真题(原卷版+解析版)
- 2026年黑龙江、吉林、辽宁、内蒙古高考物理试卷(含答案及解析)
- 2026年秋季新教材统编版九年级上册道德与法治全册知识点背诵提纲精简版
- 中国不稳定型心绞痛临床诊疗指南(2025版)
- 2026上海市检察系统辅助文员招聘考试参考试题及答案解析
- 2026-2030中国激光打印机行业发展现状与市场前景趋势洞察报告
- 风管吊装施工方案
评论
0/150
提交评论