版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第第页星火快答建设方案科大讯飞股份有限公司2025-4-7
版本说明日期版本作者说明审批人发布日期2025-04-071.0星火快答建设方案V1
目录TOC\o"1-3"\h\u46371.建设背景 610431.1.大模型发展背景 6102371.2.虚拟人技术发展背景 7264461.3.企业数据应用发展背景 879052.现状及需求分析 9295713.总体设计 9122133.1.设计目标 921193.2.设计原则 9258033.3.总体架构 11131903.4.使用流程 1255574.核心技术 13211084.1.大模型技术 13181774.2.虚拟人技术 14109944.3.语音识别技术 15134434.4.语音合成技术 19187034.5.意图匹配技术 20172465.功能清单 2224435.1.智能展示 22166185.1.1.智能讲解 22167785.1.2.多模态交互 25159065.1.3.移动端控制 26135355.1.4.桌面端演示 2749405.2.数据问答 27224125.2.1.数据问答 27138005.2.2.数据源 27318545.2.3.指标管理 2869695.2.4.指标实例库 29251425.2.5.数据权限 29296575.3.公共组件 30227985.3.1.知识文档 30126075.3.2.长文本知识库 31201385.3.3.标准问答 3131045.3.4.技能和接口 31152465.3.5.监控播放 32151085.3.6.专有词库 339745.3.7.日志管理 33170535.3.8.租户和用户管理 33119305.4.能力底座 33219075.4.1.系统意图管理 33131335.4.2.接口技能 33102066.实施方案 34204466.1.需求调研 34312206.2.系统构建 34153276.3.部署上线 355876.4.测试验收 36257117.部署方式及外部依赖 36204797.1.多模态硬件 362037.2.部署方式 3722432①SaaS公有云服务 373174②平台私有化 379073③混合云模式 37建设背景大模型发展背景目前,大模型的发展已经取得了显著的进展,随着计算能力的提高,大型模型的参数规模不断扩大,基础设施逐步完善,应用场景逐渐增加,大模型已成为迈向通用人工智能的最重要手段,同时大模型的自主完善和不断自我优化的能力,加快了通用人工智能到来。大模型未来将会助推数字经济,为智能化升级带来新范式,直接影响人们生活、工作的各个方面,大模型从技术和应用两个方面进行趋势评估。(一)技术方面:大模型通用性持续加强,实现AI开发“大一统”模式。大模型由于其泛化性、通用性,为人工智能带来了新机遇。通过无标注数据进行自监督学习,从而降低标注数据的人力要求。同时,多模态大模型也逐渐兴起,数据形态差异化问题也将得到解决,未来大模型将进一步致力于构建通用的人工智能底层算法框架,融合多领域的模型能力,不同领域中“自我学习”,通过一个大模型解决产业中各种问题,各行业正利用精调或prompt的方式加入任务间的差异化内容,提高模型的利用率,实现大模型统一部署,赋能于多场景应用的局面。(二)应用方面:通用认知智能技术将持续快速发展,给全世界带来多方面的重大模式创新和产业变革:1)改变信息分发获取模式,实现更高效的信息整合和更精准的知识推荐等,让整个社会的信息获取更加简洁高效,深刻改变人们工作和学习方式;2)革新内容生产模式,机器的自动文章撰写能力能显著提升人们的写作和办公效率,带动AIGC技术实现图片、音视频等多模态内容的自动生成;3)全面升级人机交互模式,未来人机之间可能实现多模态“类人”的自然对话,进一步降低学习成本、提高交互效率;总之,认知智能认知大模型的持续发展将有望支撑实现诸多此前技术不可达的行业重大创新应用,为各行各业带来重大产业颠覆和发展机遇,同时认知智能认知大模型技术也有望演进成为每个人的人工智能助手,让每个人能站在人工智能肩膀上发挥更大的创造力。虚拟人技术发展背景早期虚拟人受限于3D建模与动作捕捉技术,主要应用于影视特效领域。代表案例如《阿凡达》中的动作捕捉技术,奠定了数字形象构建基础,但存在制作成本高、交互能力弱等瓶颈。语音合成(TTS)、自然语言处理(NLP)技术突破推动虚拟人进入对话交互阶段。微软小冰、苹果Siri等智能助手验证了语音交互可行性,日本初音未来等虚拟偶像验证了IP商业化路径。近期,生成式AI技术爆发重构产业格局,GPT-3实现自然对话生成、StyleGAN提升数字人形象真实度、NeRF技术突破3D建模效率、多模态交互框架成熟,使虚拟人具备情感表达与场景适应能力。目前,AIGC+大模型驱动“智能体”的进化,使数字员工实现与业务系统集成、数字分身实现企业个性化服务。Gartner预测到2026年,30%企业将部署虚拟员工处理客户服务场景。企业数据应用发展背景随着数字技术的持续突破与业务场景的深度耦合,企业数据应用已从基础的信息化工具演变为驱动智能决策的核心引擎。早期以关系型数据库为核心的技术架构,仅能支撑结构化数据的静态管理;大数据时代的Hadoop生态虽解决了海量数据处理难题,但实时分析与价值挖掘能力仍显不足。近年来,云计算、机器学习与实时计算技术的融合,推动数据应用进入“感知-决策-执行”一体化阶段,数据湖仓、AI模型与低代码平台等技术重构了数据资产化路径。IDC数据显示,2023年数据智能市场规模突破3000亿元,83%企业将数据应用列为最高优先级投入,金融、制造、医疗等领域已涌现出客户画像精准度提升、设备运维成本降低的实践标杆。政策与市场的双重驱动加速了数据要素价值释放。技术的普惠性也在持续增强:物联网与5G实现工业设备数据覆盖率提升。然而,企业仍面临数据孤岛、非结构化数据利用率不足等挑战,未来向量数据库与大模型的深度结合、湖仓一体架构的普及,将进一步推动数据应用从“辅助分析”向“自主决策”跃迁,为业务创新构建实时、闭环的智能底座。现状及需求分析总体设计设计目标星火快答是一款专为企业打造的智能展示和智能数据问答场景的工具。基于先进的大模型构建,通过智能演示、数据管理、指标管理、知识管理、集成管理等核心功能,为企业用户提供了互动的全新体验。助力企业提高数据获取和分析效率、降低数据分析应用开发成本、提升大屏交互体验。设计原则为确保实现星火快答平台建设目标,充分发挥产品核心技术能力,真正创造业务价值,系统在设计时遵循了如下设计原则。(1)标准化设计系统设计采用的各项软、技术等均应符合国际通用标准,符合开放性原则,使用的技术要与技术发展的潮流吻合,保证系统的开放性和技术可伸性,与未来技术发展应具有良好的兼容性。系统严格遵循软件相关标准和规范进行设计、实施,严格按照ISO9001:2000质量体系要求进行系统建设、实施。(2)平台化设计系统按照平台化的设计思想,利用SOA(ServiceOrientedArchitecture)技术,以松耦合的思路进行系统建设。系统由多个子模块组成,每个子系统仅通过服务接口与外界联系。这种设计架构尽可能的减少了平台各子系统之间关联,以及平台自身与后台支撑软件和环境的关联。最终系统可以方便挂接各类工具和数据,对现有的应用和以后新增加的应用,软件无需二次开发。(3)模块化设计系统采用模块化设计方式,并对大部分功能实现插件化管理。平台中各个服务和模块的设计都采取“高内聚、低耦合”的原则。每个服务和模块都应当是能够独立运行的模块,模块和服务之间通过基于业务的标准接口进行互联。杜绝了模块的复杂依赖关系,便于实现灵活的部署结构,以及单独模块的升级改造。系统中各模块既是一个独立的功能,又同时以WEBSERVICE的方式对外提供各种服务,各模块服务接口进行了预先定义,使得用户可以随时扩展、更新,并以自定义方式实现模块功能的修改,模块的替换、加载和卸载的功能。(4)可扩展性为适应业务量的不断增长,以及星火快答系统自身水平的发展,系统必须具备高度的可扩展性。系统整体的可扩展性要求系统在数据存储、数据结构、接口和应用功能的实现上预留空间,系统架构设计上应可扩展,以满足未来变化的需要。系统采用应用群集等技术,可随未来业务量的变化,方便的实现横向及纵向扩展。(5)稳定性设计星火快答是关键业务系统,随着未来业务的进一步开展,系统的稳定性将越发关键。本系统在设计过程中,根据模块和服务的功能、重要性等分别采用容错、备份等技术,以保证局部的错误不影响整个平台的运行。关键模块和服务应当采用冗余设计,避免局部故障导致平台整体应用崩溃。总体架构星火快答作为一款先进的人工智能应用产品,其技术架构遵循了行业标准的多层架构设计,以确保系统的高可用性、可扩展性和安全性。同时星火快答提供了一个直观、响应式的界面,支持多种浏览器和设备,确保用户可以从任何地点、任何设备访问应用。结合虚拟人交互,提供全新的用户交互体验。为了满足全球用户的需求,平台提供了多语言界面,方便不同语言背景的用户使用。星火快答产品架构如下:整体架构分为四大核心模块。在交互方式上,系统深度融合语音识别、文字输入、发音人追踪等自然语音输入技术,同时输出文字、语音、图表等动态反馈。业务场景方面,无论是展厅自动讲解、迎宾接待的智能演示,还是会议指挥中心的数据问答,系统都能化身工作助手,实时生成图表、调取数据。功能实现上,我们通过PC端配置大屏与数据库、大屏端支持多人互动与智能语境引导、移动端集成快问快答。底层能力则依托大模型、虚拟人、语义知识库等核心技术,并与企业数据库、数据中台深度打通,让每个交互动作都有强大的数据引擎驱动。使用流程核心技术大模型技术大模型为星火快答注入了先进的多领域处理能力,它不仅在文本生成、语言理解和多模态数据处理方面有着卓越的表现,还在逻辑推理、用户问题匹配、Function-Call和上下文推理等多个维度上展现出了非凡的性能。在逻辑推理方面,大模型运用常识推理、科学推理和时空推理等方法,能够深入分析并准确推理出复杂情境中的逻辑关系。这种能力让模型在教育、市场策略制定和舆情分析等关键领域大放异彩,为用户在面对错综复杂的问题时提供明晰而有效的解决策略。在本平台中,大模型还能迅速地基于现有的指标体系,精确地理解和定位用户提出的问题,实现对问题要素的精准捕捉,从而进行高效的数据分析和处理。借助大模型Function-Call能力,可以根据用户的具体需求,灵活调用相应的算法或处理流程,例如进行数据分析和统计计算,为用户提供定制化的服务和技术支持。同时上下文推理能力进一步强化了模型的问题解决实力,让模型在理解问题的本质的同时,也能考虑到问题所处的具体环境和背景,从而提供更为全面和深刻的洞见和答案。星火快答支持讯飞星火商用大模型,同时也支持DeepSeekV3大模型、Qwen72B大模型等开源模型(应用前需进行适配)。虚拟人技术星火快答采用先进的虚拟人技术,打造了一种模拟真人的交互模式,极大地提升了实时汇报和沟通的自然性和亲和力。这种交互方式不仅让用户感受到更加贴近人类伙伴的沟通体验,还增强了信息传递的直观性和易理解性。文字转音频:AI虚拟人,可直接通过输入文字方式一键生产出新闻、资讯等内容的有声播报,且声音具有丰富的音色和风格,满足不同领域新闻或资讯等内容对声音的要求。文字转视频:AI虚拟人支持文字一键生产主播播报新闻视频,生产的视频具有口型匹配度高、表情自然、整体效果流畅真实,为视频新闻等内容的生产助理,且虚拟主播形象造型丰富,在不同的场景下均可高度满足使用需求。成品视频混编功能:AI虚拟人提供文字生产虚拟人视频功能外,还支持对外采视频、外采视频配音、视频画中画、视频标题等素材的混编,通过上述功能,可完成最终的成品视频输出,让内容生产便捷高效。虚拟人技术的制作流程涵盖了人物设计、模型构建、动画制作和皮肤渲染等关键步骤,融合了人工智能(AI)、自然语言处理(NLP)、机器学习以及计算机视觉等多项前沿技术,共同营造出一种流畅而自然的交互体验。为了满足不同行业和领域的多样化需求,星火快答内置了丰富的虚拟人形象和音色库,用户可以根据自己的偏好和场景需求进行个性化组合和选择。这种灵活性确保了星火快答能够无缝适应各种环境,为用户提供定制化的交互体验,无论是在商务汇报、营销宣传还是经营分析等场景,都能发挥出色的表现。虚拟人技术主要功能参数如下:支持提供标准API接口或SDK,以接入第三方应用系统支持以语音对话的形式,为用户提供服务交互打断:支持全双工交互方式,支持交互过程中随时打断,终止当前对话进入下一轮交互调整语速:支持对虚拟人说话语速进行调节切换分辨率:支持对虚拟人视频进行分辨率切换,应支持1080P、720P、480P。切换帧率:支持对虚拟人视频进行帧率设置。切换流格式:虚拟人视频流支持H264、FLV格式切换,以满足客户端对不同视频流的格式要求。横竖屏:支持竖屏、横屏展示,虚拟人形象大小、背景尺寸根据横竖屏进行适应,满足在不同终端屏幕尺寸下的显示效果字幕显示:数字人播报的同时,支持设置字幕显示语义提取正确率和召回率F-1值平均≥80%语音识别技术语音识别,英文全称AutomaticSpeechRecognition,简称ASR。其能力是将语音中包含的文字信息识别出来,实现把语音转换成对应的文字信息,使得将音频内容转化为文本内容。语音识别是智能语音的核心能力,是语音处理的基础。本项目所需的是在线实时进行语音识别的能力(音频时长长度小于60s)。(1)主要功能支持中文和英文两个语种的识别,同时还支持中文中夹带英文单词、简单的英文语句,基本可以达到中国人日常生活的要求;可提供武汉话、四川话、粤语等不少于23种主流的方言的识别能;支持pcm、wav、speex、speex-wb、opus等音频编解码算法;支持热词设置方式,分为会话级热词、全局热词和个性化热词,且热词设置方式可同时设置生效;支持面向专业领域、场景优化的定制训练,以提升该场景的识别效果;支持对输入的音频流进行前后端点检测的语音预处理,可以在会话启动时动态设置前后端点超时时间,也可以关闭端点检测功能以达到长音频语音听写;针对口语化语音交互中因为不流畅停顿等现象导致的交互中断现象,需具有基于语义信息的断句能力,以提升非连贯交互场景中的识别准确率;支持对识别结果语句智能预测其对话语境的文本后处理,提供智能断句和标点符号的预测;支持结果格式智能转化,对结果中出现数字、日期、时间等内容格式化成规整的文本;支持动态修正及中间结果返回。中间结果,即识别过程中产生的过渡结果,这个结果可能会根据后面音频的上下文分析发生修正。开启中间结果功能可以减少识别结果返回的时间间隔,提高识别过程中的视觉流畅度,并达到动态修正的功能体验。具备降噪处理能力;普通话识别支持采样率支持8k/16k,采样深度支持16bits;正常环境下中文普通话识别率达到95%。(2)技术特色深度神经网络(DNN)声学建模技术支持海量数据的DNN并行训练支持多语种共享结构的DNN训练支持个性化DNN建模基于DNN的非线性建模提升鲁棒性用户个性化声学建模技术和二遍解码技术数万小时声学模型训练数据,显著提升通讯录人名的个性化识别一遍解码生成Lattice后,根据人名列表对Lattice进行优化,再进行二遍解码针对超大规模语言模型的快速更新技术支持小语言模型和WFST网络建模并联小语言模型网络和更新通用超大规模语言模型网络,并调节权重针对说话人和口音方言的自适应技术引入可变长度的码字层,改变传统DNN结构引入对模型参数变化的限制将目标函数从帧级别的信息熵扩展到串级别区分性准则海量多语种语言模型的高速训练和数据资源库构建支持T级以上语料的统计语言模型训练覆盖中英粤维藏等多语种海量语音语言数据的收集、整理和标注语音识别技术主要功能参数如下:标点智能预测:支持对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测。智能端点检测:支持对说话过程中进行前端点检测,即智能检测说话过程中的有效语音的开始位置;支持对说话过程中进行尾端点检测,即智能检测说话是否结束智能数字规整:支持将识别结果的数字如日期、分数、小数等,智能的转换为易于理解的数字格式,使展现形式更符合人的习惯智能文本顺滑:支持将识别结果中无意义的停顿词、语气词、重复词等进行智能过滤,使识别结果更易用阅读和理解动态结果修正:支持字词级识别结果实时返回,并根据上下文语境,对历史返回结果进行动态修正。音频编码:支持pcm、wav、speex、opus等多种音频编码格式音频采样率:支持8k及16k的音频,采样精度为16bit通用场景语音识别率≥95%语音合成技术语音合成,英文全称TextToSpeech,简称TTS。主要解决如何将文字信息转化为可听的声音信息,涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,可以“让机器像人一样开口说话”。科大讯飞采用最先进的中文文本、韵律分析算法和最大语料库的合成方法,合成语音已经接近真人的自然效果。语音合成引擎在完成文本到语音数据的转化过程中可以简单分解为两个步骤的处理。文本先经过前端的语法分析,通过科大讯飞公司精心制作的词典和规则的处理,得到格式规范,携带语法层次的信息,传送到后端。后端在前端分析的结果基础上,经过韵律方面的分析处理,得到语音的时长、音高等韵律信息,再根据这些信息在音库中挑选最合适的语音单元,语音单元再经过调整和拼接,就能得到最终的语音数据。在整个转化处理的过程中牵涉到大量的中英文语法和韵律知识的运用,以及语法和语义分析的算法,最佳路径搜索,单元挑选和调整的算法,语音数据编码方面的知识。语音合成技术主要功能参数如下:音频格式需要支持主流的音频格式,如mp3、wav、m4a、pcm等。支持角色分离功能,可通过配置设定角色的数量,也可以不指定进行盲分。返回结果支持时间戳,即结果中的文本时间点,精确到毫秒。提供词、句的置信度得分,便于业务判断识别的准确度。支持标点预测功能,即识别的结果文本中的相关语句和段落已经具备了标点符号。支持数字规整,即遇到时间、日期等识别内容可自动转化为标准的数字书写形式,例如十二点三十分转写为12:30。支持效果优化能力,主要为通过热词的形式即时解决特定的专业术语识别不准确问题并支持相应语料的模型训练,来进一步提升识别率。在安静环境下,中文标准普通话的综合识别率大于95%。意图匹配技术为了确保用户输入能够精确对应到相应的意图,系统采取了精准的意图识别和匹配策略。首先,利用预训练的语义相似度模型(SimBERTv2)对意图进行向量化处理,这一步骤将意图转化为高维空间中的向量表示,以便更精确地捕捉和存储意图的语义信息。这些向量化的意图随后被存储在一个专门的向量数据库中,以便快速检索和比对。当用户发起输入时,我们同样使用Embedding技术将用户的输入转换为向量形式,并在向量数据库中进行高效检索。一旦检索到与用户输入向量高度一致的意图向量,我们便可以确认用户的输入已经成功匹配到了相应的意图。确认匹配后,系统将进入下一阶段,即实体提取和执行器执行。实体提取过程将从用户输入中识别出关键信息,而执行器则根据已识别的意图和实体信息执行相应的操作或服务。这整个过程的设计旨在提高系统的响应速度和准确性,确保用户能够获得满足其需求的精准服务。具备知识编译及语义解析能力,支持将知识库的数据资源编译成语义资源,能够根据语义资源将文本解析成固定格式的json;提供语义理解并发能力;支持实现长、短句的分词能力;相同词义的短词规整、合并;上下文指代词的歧义;在交互过程中自动缓存、匹配上下文信息、历史数据等,提供多轮人机交互记忆机制;配合知识库,实现对话意图的关键词槽抽取、如地址、时间、关键动作;支持对相关业务以外的话题拒识功能;支持敏感词过滤功能;支持复杂任务的多轮对话以及多轮纠错;用户可在任意时间打断对话并发出需求,引擎可以对非相关交互进行拒识;通过知识图谱、生成式问答等引擎处理,可以做到有问必答,无应答率大大下降。功能清单智能演示智能演示可以实现进行演示场景的新建、并在新建时选择单屏或多实体大屏联动演示。场景列表可展示本用户创建场景或本租户下所有用户新建的场景。新建场景后可以对场景界面进行可视化配置,包括页面设计和问答设计。智能讲解虚拟人自动讲解虚拟人根据配置好的讲解词进行自动讲解,讲解的内容可以通过单页、多页、多大屏的方式进行展示,当展示内容为多个大屏时支持大屏之间的联动。虚拟人讲解的对象可以是公司不同的产品介绍、数据大屏、公司文化简介等,展示的方式可以是通过浏览器打开的大屏、PPT页面、数字孪生大屏等。讲解的场景可以是展会、展厅、公司大厅展台等。页面调度支持在讲解词中配置固定的切换动作,即虚拟人讲到大屏中哪一页内容的同时将大屏切换到对应的页面,也可以在不讲解时通过自然语言的方式切换大屏页面;切换页面的方式有接口调度、模拟点击大屏按钮、RPA方式操作大屏。虚拟人走动虚拟人讲解过程中支持根据高亮走动到对应位置指示讲解内容;配置虚拟人消失与出现的位置,可避免因为虚拟人走动导致的大屏数据遮挡。虚拟人跨屏讲解在多屏讲过的过程中,支持多个大屏之间的联动,在虚拟人讲解完前一个大屏内容之后自动走动到下一个需要讲解的大屏上。单屏循环讲解在无人值守或需要重复讲解大屏内容时,可以通过循环讲解的意图让虚拟人不断的讲解当前大屏内容。多套解说词在一个页面下支持有多种风格的讲解词,在遇到不同的参观对象时可以给出不同的讲解;可以通过多套讲解词的功能实现多语言讲解,每一套讲解词都是不同的语种;多套讲解词支持随机切换或固定讲解,且可以通过手机控制器上一键完成。多语言交互在长文本知识库模式下,用户可通过自然语言直接切换当前交互的语言,例如给出“接下来我们用英语交流吧”之后虚拟人即可进行英文交互。目录可以设置讲解内容轮播,展示了当前大屏讲解的产品(分类);可在目录项中配置缩略图、slogan等,同时可通过自然语言直接切换到对应的产品下进行讲解。分类讲解将大屏中某几页内容贴上分类的标签组成一个整体,讲解过程中可以按顺序讲解全部的内容也可以按照分类进行单独讲解;适合在一个大屏上对多个产品或多个不同的模块单独进行介绍。高亮展示在讲解词中配置高亮展示,可在虚拟人讲解到当前位置时通过高亮框的方式标记大屏中的位置,这样就可以指示出目前的讲解内容与大屏的关联;也可通过自然语言的方式直接高亮标记大屏中的区域。技能调度在自定义操作中关联技能,将技能配置到讲解词中在虚拟人讲解到当前位置时即可执行该技能;该功能是通过向第三方系统的接口对接固定的参数实现调度;目前主要应用有,为讲解词获取实时数据,或自动切换大屏页面。模拟点击通过在大屏上以简单的画框方式,为虚拟人指示点击位置;可以将模拟点击配置在讲解词中,这样在虚拟人讲解到当前位置时即可点击大屏,让讲解与大屏进行联动;也可以将模拟点击直接配置在大屏上,通过自然语言的方式进行调度;模拟点击的方法配置起来简单方便,但是效果会受到大屏分辨率变化等的影响。多模态交互(1)多模态设备将多模态设备接入快答平台,同时关联到对应的大屏上这样即可实现无需唤醒的自然语言交流;多模态设备同时还可以支持图像识别、肢体语言交互。(2)欢迎语在多模态交互模式下,观众经过展台时(3米内),多模态通过图像识别到人员走过可主动进行打招呼,邀请观众进行交流,提高展台人气。(3)邀请语在多模态交互模式下,观众经过展台时(3米内),多模态通过图像识别到人员走过可主动进行打招呼,邀请观众进行交流,提高展台人气。移动端控制(1)手机控制器每个演示都会自动生成一个手机控制器的二维码,用手机扫码进入,链接到对应的演示大屏上,可对大屏进行操作;一方面是功能性的操作,虚拟人切换、多套解说词切换、页面刷新、语言切换等,这些操作需要产研侧开发完成之后才能使用;另一方面是指令,可在手机上点击语音输入按钮直接向关联的大屏发送语音指令;也可提前讲意图等指令配置好直接点击发送,将意图发送到大屏上。(2)虚拟人切换通过手机控制器上的虚拟人切换功能直接在演示过程中一键切换虚拟人形象;虚拟人形象需要提前配置。(3)页面刷新手机控制器上的固定功能,需要先连接到对应的大屏,点击刷新按钮之后即可将正在展示的大屏页面(快答平台可刷新,外部大屏只有在接入快答平台的情况下才刷新)进行刷新;在虚拟人或其他页面元素出现故障时可通过一键刷新的方式重新开始。桌面端演示(1)多种不同的形式的大屏接入通过桌面端插件,通过在用户系统上覆盖虚拟人交互图层,能够直接在客户桌面端系统上进行演示。目前可支持的外部大屏形态有:①链接地址②C/S应用,如数字孪生③桌面应用,如微信、QQ等④图片。(2)RPA流程在讲解词编辑中可添加RPA流程,目前支持固定的动作执行,有20种,包括了浏览器打开、关闭、元素点击、输入内容等;这些功能可被编辑为一个固定的流程按顺序去执行,在虚拟人讲到此处时执行该流程动作。数据问答数据问答数据源星火快答的底层数据来源,支持链接多种类型数据库(数据库类型支持MySQL、GAUSS、SQLServer、POSTGRESQL、DORIS、STARROCKS等)和csv数据文件上传,提供了详细的连接参数配置和连接测试,确保了数据的准确接入和高效处理。同时针对上传后的数据支持添加字段描述,提高大模型对于数据的理解能力。指标管理指标分类采用“指标域”分类管理指标数据,“指标域”是一类指标的集合,可将指标按照应用场景进行分类。目前系统支持3类指标类型:原子指标:即最小粒度的数据指标,构建一些简单的不需要涉及指标之间的计算。例如“销售额数值”、“新客户数量”。也是组成复合指标的最小颗粒度。系统默认数据源充分的条件下不需要配置则支持原子指标查询其同比与环比。复合指标:构建一些较为复杂的数据指标需要涉及原子指标间的计算,例如“销售额”,通过“销售单价”*“销售数量”计算得出。明细指标:用于查询数据源中的某个数据明细,例如上传的数据csv文件中的某一单元格的数据值,无聚合方式。指标构建支持多层次、多维度的指标体系构建。设置相应的数据指标描述,可增强大模型对数据指标的理解能力,从而更加精准的深度分析数据;设置数据指标的数据格式和计算方式,帮助平台准确快速的计算处理数据并呈现。数据维度:在数据分析中,业务需要在得到特定条件或分类下的数据指标数值,某个特定条件和分类就是单个的数据维度。设置数据维度得到各分类和分组下的数据指标值,帮助更深入地理解和分析数据,发现潜在的趋势和模式。设置数据筛选条件,可过滤无用的数据源,增加数据的可靠性和数据分析的真实性。设置时间维度:年、季度、月、日等,平台将按照选择的时间颗粒度对数据进行统计与分析。指标实例库数据权限问数类型举例:问数类型问题示例直接问数-单指标2024年1月SUV的销量是多少?直接问数-多指标今年SUV的产量、销量、市占率分别是多少?直接问数-计数查询今年李四负责了多少项目直接问数-维度模糊查询今年学习机在各个渠道的市场表现怎么样?直接问数-均值计算今年第一季度所有项目的合同总金额均值直接问数-最值今年1月合同总金额最低的是哪个项目直接问数-聚合计算2024年1季度SUV的销量是多少?今年生产调度部人工费用累计是多少?明细指标查看所有合同金额大于10万的项目信息数据罗列今年各月人工费用的变化趋势?2024年各种车型的销量是多少?2023年各月肥东服务区和巢湖服务区人流量对比情况TOPN2023年12月,哪个城市的仓储费用最高?排名前3的城市是哪些?查询今年合同总金额最高的10个项目?占比问题本月的管理费用中,各类费用占比情况今年公司各级别员工分布情况同环比问题看一下本月SUV销量环比情况看一下今年各事业部人数同比情况复合指标本月新能源车型渗透率是多少?今年各月X3学习机利润率变化情况?连续追问(上下文)本周SUV销量是多少?哪家车企第一?哪家品牌第一?xx车企排名第几?快照数据(累计数)去年公司有多少人(默认查询最近账期的数据,非一整年的合计)维度澄清-时间第一事业部的收入是多少(无时间维度)维度澄清-重复维度今年特斯拉的收入是多少(品牌和车企两列数据中均有“特斯拉”)宽泛性问答今年生产一部的费用是多少?(没有明确指标,会查询多个“费用”关联的指标)公共组件知识文档知识文档指的是RAG模式的知识库,用户将文档上传知识库之后系统可自动切片或用户自定义切片;通过匹配问题与知识切片的方式实现知识问答。平台提供多种格式的知识文档上传,上传到平台的知识文档平台会自动对文档做切片分割,用户也可以自己整理文档并根据标识符切割文档切片。完成文档切片后,用户就可以对绑定了该知识的大屏应用做知识问答。用户提问后,平台会检索知识文档,找到相关的文档切片,打包处理后,交流星火大模型来完成对知识问题的回答。长文本知识库长文本是为了对比RAG模式的知识库,知识问答上传之后不再进行切片,直接将问题放置在整个文档上进行语义的匹配获取回答的知识,文档长度可达10W字。为支持长文本知识库需要单独配置一张A100的GPU,获取的知识准确快速。标准问答不管是RAG知识库还是长文本知识库,模型都会对获取的知识进行总结后回答,但是在某些严肃的场合或回答一些严肃的问题,答案是不允许更改的。标准问答的功能提供了问题可泛化理解,答案固定输出的配置。技能和接口接口管理功能允许用户将外部接口与星火快答平台连接,实现数据和服务的无缝对接。用户需要提供接口的相关信息,包括接口名称、路径、服务地址、请求头部和请求参数等,以确保系统能够正确地与接口进行通信。接口创建用户可以通过单击【新建接口】按钮来创建新的接口。在创建过程中,用户需要填写接口的基础配置信息,包括接口名称、接口路径、服务地址等。此外,用户还需要定义请求头部和请求参数,以确保接口的正确调用。接口测试为了验证接口的功能和稳定性,用户可以通过【测试接口】功能对接口进行测试。这有助于在正式使用前确保接口的可靠性。接口删除用户可以通过单击【删除】按钮来删除不再需要的接口。这有助于维护接口列表的清晰性和减少潜在的安全风险。接口环境变量管理接口环境变量管理功能允许用户为接口设置环境变量,这些变量可以在接口调用时使用。用户可以通过【新建环境变量】按钮来添加新的环境变量,或通过【编辑】和【移除】按钮来管理现有的环境变量。监控播放通过将接口技能的功能在海康威视综合安防平台上进行落地,用户可以通过填写地址、账号、密码的方式快速将自己的监控信息接入到快答平台,接入之后用户只需要通过自然语言说出监控名称即可在大屏上展示对应的监控画面。专有词库日志管理租户和用户管理能力底座系统意图管理通过大模型自动理解用户的自然语言在当前页面下的意图,对平台进行操作;避免了前期通过固定话术去配置意图的方式中存在的需要配置大量的话术的问题,同时也让意图更加的灵活。实体管理:支持实体的新增、删除、编辑、查询及及批量处理,支持实体词条的批量导入及同义拓展,并具备实体模糊功能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 模拟手术中小组动力学与团队配合优化
- 自愈合水凝胶的长期抗菌生物活性长效维持策略
- 2026年妊娠慢性肾炎调理诊疗试题及答案(肾内科版)
- 2026届四川省眉山一中办学共同体中学高三第三次教学质量检测试题化学试题含解析
- 2026届湖南省永州市宁远县一中高三4月高考模拟(二模)化学试题含解析
- 2026年上海市实验学校高三一模检测试题化学试题含解析
- 采购合同范本
- 26年急性白血病精准医疗路径精讲
- 2025~2026学年湖北省孝感市汉川市八年级上学期期末英语试卷
- 2025~2026学年江苏宿迁市泗阳县第一学期七年级期末学业水平监测英语试卷
- T/CECS 10169-2021埋地用聚乙烯(PE)高筋缠绕增强结构壁管材
- 七夕情人节介绍公开课课件
- 企业数据资产保护的法律法规及合规性要求
- 配送车辆卫生管理制度
- 2025-2030磁流变液行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 超星尔雅学习通《科学计算与MATLAB语言(中南大学)》2025章节测试附答案
- 《颈椎病的针灸治疗》课件
- 《一套汽车升降专用的液压升降平台的结构设计》14000字(论文)
- 西藏拉萨市2020-2021学年八年级下学期期中物理试题【含答案、解析】
- 《黄疸的诊断和治疗》课件
- 《桥梁敷设高压电缆工程技术规范》
评论
0/150
提交评论