知识驱动的智能问答在企业计算中的落地实践_第1页
知识驱动的智能问答在企业计算中的落地实践_第2页
知识驱动的智能问答在企业计算中的落地实践_第3页
知识驱动的智能问答在企业计算中的落地实践_第4页
知识驱动的智能问答在企业计算中的落地实践_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

12341234风险管控客户服务企业计算定义市场市场内容优化产品页社交媒体产品页客户服务BusinessIntelligenceAnalyticsAnalyticsSales/MarketingSalesBusinessIntelligenceAnalyticsAnalyticsSales/MarketingSales/Marketing美国2B市场40%中国2B市场BusinessBusinessIntelligenceAnalyticsAnalytics中国2B市场:巨大的发展潜力美国美国Microsoft暂无超过Microsoft$10B的企业ORACLe面向外部行业知识图谱面向 面向外部行业知识图谱面向 智能咨询服务平台••Web(H5)•…用户提问微信/APP/Web知识学习智能引擎语义理解智能引擎人机协同知识智能监控查询回复更新官方网站市场动态专家整理其他知识用户提问微信/APP/Web知识学习智能引擎语义理解智能引擎人机协同知识智能监控查询回复更新官方网站市场动态专家整理其他知识智能咨询服务平台——智能问答产品信息知识库知识库12341234问答范式的演变 基于知识图谱的基于多引擎的问答问答系统成为下一代搜索引擎问答系统成为下一代搜索引擎的11问答数据的几种形态及关系问答技术形态IRQA:基于信息检索的问答IRQA:基于信息检索的问答KBQAKBQA:基于知识库的问答MRC:基于阅读理解的回答13乐言智能问答战略9乐言问答引擎——以基金行业为例•基于检索的问答(IRQA)模块•数据:业务人员积累的基金领域的FAQ对•基于知识库的问答(KBQA)模块•数据:基于业务人员提供的基金领域知识点构建的知识图谱•基于阅读理解的问答(MRCQA)模块•数据:业务人员提供的基金领域知识文本IRQA在问答对中对用户查询进行检索,IRQA在问答对中对用户查询进行检索,返回语义最相关的FAQ对对应的答案。16KBQA对用户查询进行语义解析,并在知识图谱中查询推理得到答案。MRCQAMRC(机器阅读理解在候选段落中找到能回答用户问题的精确片段。多引擎QA融合的必要性不同的QA技术擅长回答的问题不同,需要取长补短。12341234问答在对话系统中的位置IRQA架构设计IRQA在线部分IRQA使用的模型•基于梯度提升树的排序模型•学习FAQ对的偏序关系•参考文献[1][2]•面向表示的深度模型•侧重于对query对的语义表示进行建模•参考文献[3][4][5]•面向交互的深度模型•侧重于对query对内部的词语交互建模•参考文献[6][7][8][9]IRQA:面向表示的建模优点优点缺点[4]AlatentsemanticmodelwithconvolutioIRQA:面向交互的建模优点考虑两个句子词语间的语义交互缺点模型复杂,对数据量要求非常高[6]ConvolutionalNeuralNetworkArc•知识特征••知识特征•语义特征•语言理解特征IRQA:挑战和应对•端到端学习,三步合为一步?•对训练数据量要求巨大,不合适冷启动场景建模•可解释性差•我们的创新•从可解释的角度做特征工程•通用领域训练•当前领域精调•刻画领域关系的迁移学习IRQA;基于CQA数据的挖掘•社区问答(CQA)数据挖掘,缓解数据少的问题•领域词挖掘•赎回、卖出•句式挖掘•一回事•同一个业务[10]QuestionGenerationforQuestionAnswering.KBQA架构设计乐言KBQA:基于模板匹配的语义解析xxxxxxKBQA:基于模板匹配的语义解析•查询模板匹配(打分排序)时使用的特征,•实体/属性值实体的matching特征•谓词关系的matching特征•问题子图结构的matching特征•包括实体类型,关系空间,答案类型等•模板的生成•人工撰写•从数据学习模板+人工审核•参考文献[11][11]Automated templategenerationforquestion[11]Automated templateKBQA:基于复述的语义解析xxxxxx[12]Semanticparsingviaparaphrasing.KBQA:基于复述的语义解析Q:申购xxx基金要多少钱1基于ES的粗排2基于语义匹配的精排match(n:Instance{Q:申购xxx基金要多少钱1基于ES的粗排2基于语义匹配的精排match(n:Instance{name:”xxx主题混合型证券投资基金"})-[r:HAS_PROPERTY]-(v:Property{name:"申购费"})returnv.valueas申购费KBQA:基于复述的语义解析标准问法库标准问法库ESES初选xxxxxx主题混合型证券投资基金的赎回费xxx主题混合型证券投资基金的申购费xxx主题混合型证券投资基金的基金代码语义匹配模型语义匹配模型C:xxx主题混合型证券投资基金的申购费KBQA:语义解析方法的融合缺点实体/关系识别部分的误差会导致查询模板匹配的召回率不高MRC架构设计MRC在线部分MRC模型框架Extractionbasedquestionanswer 划分Span(起始位置->终止位置)[13]BidirectionalAttentionFlowforMachine并行执行并行执行MRC与IRQA、KBQA的关系串行执行串行执行QA:多策略融合[14]Textual analysis[14]Textual analysis问答在对话系统中的位置语言理解实体识别和链接实体识别和链接•识别查询中的领域实体,意图理解意图理解问题类型判定问题类型判定答案类型判定语言理解模型•FastText分类模型•意图理解•问题类型判定•答案类型判定•FastText分类模型•意图理解•问题类型判定•答案类型判定•双向LSTM的序列标注(实体识别)模型•实体识别[17]Character-BasedLSTM-CRFwithRadical-LevelFeaturesforChineseNamed•实体识别语言理解实例实体识别和链接:申购实体识别和链接:申购->行为意图理解:咨询交易规则问题类型:预测型答案类型:时间回复生成•将QA的结果进行友好化,生成符合用户profile设定,并返回给用户•KBQA•将KB查询的结构化结果生成最终的序列•参考文献[18][19]•MRC•基于阅读理解的答案合成•参考文献[20]•IRQA•将QA结果友好化,例如,加上“您好”、“上午好”等前缀•参考文献[21][22][23][24] 回复生成实例xxx基金公司有回复生成实例几种货币性基金多用户管理多用户管理多轮对话设计 Session_Obj_1 12341234乐言问答:离线部分架构数据获取模型更新智能导航•热点问题推荐•热点问题推荐反馈收集热点问题推荐热点问题推荐交互设计用户反馈用户反馈实体相关问题推荐实体相关问题推荐交互设计其他请求负载均衡数据存储分流乐言智能问答每天服务五百万人次每天服务五百万人次ThankYou!参考文献[1]TianqiChenandCarlosGuestrin.XGBoost:AScalableTreeBoostingSystem.In22nd[2]J.H.Friedman.Greedyfunctionapproximation:Agradientboostingmachine.AnnalsofStatistics,29:1189–1232[3]HamidPalangietal.Semanticmodellingwithlong-short-termmemoryforinformationretrieval.arXivpreprintarXiv:14[4]Shen,Yelong,etal.Alatentsemanticmodelwithconvolutional-poolingstructureforinformationretrieval.Proceedingsofthe23rdACMInternationalConferenceonConferenceonInformationandKnowl[5]Po-SenHuang,XiaodongHe,JianfengGao,LiDeng,AlexAcero,LarryHeck.Learning[6]BaotianHu,ZhengdongLu,HangLi,QingcaiChen,ConvolutionalNeuralNetworkArchitecturesforMatchingNaturalLanguageSentenceDocChat:AnInformationRetrievalApproachforChatbotEnginesUsingUnstructured 9o]cuWmenngYin,HinrichSchütze,BingXiang,BowenZhou.ABConvolutionalNeuralNetworkforModelingSe参考文献knowledgegraphs."InProceeding1191-1200.InternationalWorldWideWebConf[12]Berant,Jonathan,andPercyLiang."Semanticparsingviaparaphrasing."InProceedingsofthe52ndAnnualMeetingoftheAssociationforComputationalLinguistics(Volume1:Long Farhadi,HannanehHajishirzi.BidirectionalAttentionFlowforMachineComprehen[14]Murdock,J.William,etal."Textualevidencegatheringandanalysis."IBMJournalofBasedLSTM-CRFwithRadical-LevelFeaturesforChineseNamedEntityRecognition,Structure-awareSeq2seqLea参考文献[19]NeuralTextGenerationfromStructuredDatawithApplicationtotxheBiography[20]S-Net:FromAnswerExtractiontoAnswerGenerationforMachineReadingComprehension,ChuanqiTan,Fur[21]JiataoGu,Zheng

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论