CN110457476B 用于生成分类模型的方法和装置 (北京百度网讯科技有限公司)_第1页
CN110457476B 用于生成分类模型的方法和装置 (北京百度网讯科技有限公司)_第2页
CN110457476B 用于生成分类模型的方法和装置 (北京百度网讯科技有限公司)_第3页
CN110457476B 用于生成分类模型的方法和装置 (北京百度网讯科技有限公司)_第4页
CN110457476B 用于生成分类模型的方法和装置 (北京百度网讯科技有限公司)_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本公开的实施例公开了用于生成分类模型实现了基于云计算技术的文本分类模型的自动2获取与所述统计特征匹配的包括多个初始超参数组的初始超参设的预训练模型集合中选取与所述初始超参数组中的初始模型超参数匹配的预训练模型满足超参数组确定条件的评测结果对应的准文本分类模型中确定用于表征文本类别与文本之间对应关系的文本分类模型;响应于所生成的评测结果不满足所述超参数组确定条所述从预设的预训练模型集合中选取与所述初始超参数组中的初始模型超参数匹配从所述预训练模型集合中选取与所述内容特征和所述初始超参数组中的初始模型超从所述训练样本集合中选取训练样本,以及执行以下训练步骤:将接收用户端发送的标注文本集合,其中,标注文本包括文本和与文本对应将所述待分类文本集合输入至所述文本分类模型,生成所述待分类文将所生成的类别信息与对应的待分类文本信息发送至所述用户3获取模块,被配置成获取与所述统计特征匹配的包括多个初确定模块,被配置成从所述初始超参数组集合中选取初始超模型中确定用于表征文本类别与文本之间对应关系的文本更新模块,被配置成响应于所生成的评测结果不满足所述超从预设的预训练模型集合中选取与所述内容特征和所选取的初始超参数组中的初始调整子模块,被配置成响应于确定不满足所述训练完成第三生成模块,被配置成对所述标注文本集合进行划分,生4第二生成单元,被配置成将所述待分类文本集合输入至发送单元,被配置成将所生成的类别信息与对应的待分类文本信息发送至所述用户5[0001]本公开的实施例涉及计算机技术领域,具体涉及用于生成分类模型的方法和装训练模型集合中选取与所选取的初始超参数组中的初始模型超参数匹配的预训练模型作67作为样本文本的文本和作为与样本文本对应的样本类别的使得一个或多个处理器实现如第一方面中任一实该程序被处理器执行时实现如第一方面中任[0021]本公开的实施例提供的用于生成分类模型的方法和装置,首先获取训练样本集8[0025]图3是根据本公开的实施例的用于生成分类模型的方法的一个应用场景的示意[0031]图1示出了可以应用本公开的用于生成分类模型的方法或用于生成分类模型的装[0036]需要说明的是,上述训练样本集合也可以直接存储在服务器105的本地,服务器9[0040]继续参考图2,示出了根据本公开的用于生成分类模型的方法的一个实施例的流的训练样本集合,也可以获取与之通信连接的电子设备(例如图1所示的终端设备)发送的[0046]在这些实现方式中,上述执行主体可以接收用户端(例如图1所示的终端设备)上[0050]在本实施例中,上述执行主体可以通过各种方式确定训练样本集合的统计特集而生成的预训练模型可以分别看作在不同领域下的元学习(model-agnosticmeta-型结果调整后可以用于上述海量数据集所属领域的子领[0056]在这些可选的实现方式中,上述执行主体可以将步骤202所确定的形式特征输入超参数可以包括但不限于以下至少一项:学习率(learningrate),批处理参数(batch[0065]在这些实现方式中,上述执行主体可以获取预先存储于本地的初始超参数组集特征中的最大文本长度与初始超参数组中的隐层节点数之间可以具有匹配关合中选取与内容特征和所选取的初始超参数组中的初始模型超参数匹配的一个或多个预述执行主体可以计算上述训练样本集合的字频向量与上述语义标签之间的采用各种方法调整所选取的初始模型的相关参数,以及从训练样本集合中选取训练样本,还可以基于接收到的用户端发送的标注文本集合的划分[0084]基于上述可选的实现方式,响应于确定所生成的评测结果满足超参数组确定条验证文本集合的准确率之间的差值小于预设的[0085]作为示例,上述执行主体可以从初始超参数组集合中每次选取一个初始超参数以有多个。上述执行主体通常可以选取评测结果最优的准文本分类模型作为文本分类模组集合中的超参数组进行更新;以及从更新后的初始超参数组集合中选取初始超参数组,以包括但不限于以下至少一项:遗传算法(geneticalgorithm,GA),模拟退火算法(simulatedannealing,SA),蚁群算法(antcolonyalgorithm,ACA),贝叶斯优化成本的投入下快速落地适合自身需求的文本分类应[0092]进一步参考图4,其示出了用于生成分类模型的方法的又一个实施例的流程40可以通过有线连接方式或者无线连接方式接收用户端(例如图1所示的终端设备)发送的待[0101]在本实施例中,上述执行主体可以将步骤405所接收的待分类文本集合输入至步骤403所生成的文本分类模型,生成待分类文本集合中的待分类文本对应的类别信息。其基于上述步骤401所获取的训练样本集合训练得到,因而所生成的待分类文本对应的类别针对性地训练和应用所需要的文本分类模型。进而降低了文本分类模型的训练和使用门一生成单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤[0108]在本实施例的一些可选的实现方式中,上述第一生成单元503可以包括第一生成[0109]在本实施例的一些可选的实现方式中,上述第一生成单元503可以包括获取模块[0113]在本实施例的一些可选的实现方式中,上述用于生成分类模型的装置500可以包[0115]下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的[0116]如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)600操作所需的各种程序和数据。处理装置601、ROM602以及RAM603通过总线604彼此相通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以模型用于表征文本类别与文本之间的对应关系,初始模型从预设的预训练模型集合中选[0121]可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、特征进行任意组合而形成的其它技术方案。例如上述特征与本公开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论