




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、附件 2Autonomy 与同类产品功能对比优势Autonomy 作为非结构化信息处理软件的全球领导厂商,先进的概念分析、模式匹配技术能够使大量的信息之间产生关联,使用户更快地获取信息及其相关信息。Autonomy 的信息处理技术向下兼容,支持所有关键字词、布尔语言的传统搜索技术,独有的算法能够从信息的内容概念上去把握、理解、运用和处理信息,弥补了关键字词技术的不足与大量冗余的缺点。从国际市场上看, Autonomy 已经收购老牌厂商Verity ,成为市场占有率第一, 并且不断的在扩大市场份额。众多国际评测机构一致认为,Autonomy 的技术已经成为信息处理领域中的领导方向, Autono
2、my 所应用的概念匹配技术也将使信息处理技术产生质的飞跃。从功能上看, Autonomy 相对其他产品的优势包括:? 扩展关键词搜索的不足,支持句子、段落搜索,同时完全支持关键字词搜索? 相关文档自动关联,与关键词技术的关联不同,采用1 / 8概念匹配的技术使关联结果更为准确? 自动摘要技术,与其他自动摘要技术不同的是(静态抽取段落,不准确) ,采用概念凝聚分析的技术产生动态摘要,长度可调整,从内容上更具可读性? 数据自动采集,支持市面上几乎所有的数据源格式,自动同步数据,自动分类技术,概念分析、模式匹配使得分类更为准确,从内容上去把握分类的结果,而关键字词的技术不能够准确描述分类的定义及分类
3、结果文档的内容? 自动聚类技术,同样,使用关键字词不能够产生对文档内容的理解与把握,而 Autonomy 所擅长的正是理解文档的内容,从内容上实现聚类的目的? 自动化信息推送,与关键词定义不同, Autonomy 更能通过概念分析得出用户的真正需要,进行个性化的信息推送? 社区与协作,通过概念分析出的用户兴趣与爱好,能够在社区中进行交流,这些自动分析功能是关键字词技术所不能够实现的? 个人聚焦,自动保存并记忆用户每次搜索获取信息的结果,并可通过训练来分析用户的目的、兴趣与爱好? XML 完全支持,开发集成极其简单而高效,使得二次2 / 8开发周期极短,同时提供市面所有开发工具接口API 支持A
4、utonomy 与同类产品的企业级功能对比优势作为国际厂商, Autonomy 在企业级功能上的竞争优势包括:? 成熟的连接器使 Autonomy 能够支持市面上最多的数据源和文档格式,包括 200 多种数据源支持和 300 多种文档格式支持;? 语言无关性,支持多语言不需要重新构架新系统,更改 license和语言设定即可,内核使用Unicode ;? 海量文档量支持, 单引擎支持高达 2000 万份文档,文档量的海量扩展只需增加引擎作分布式部署即可,使得Autonomy 的文档处理量没有上限;? 安全权限集成, Autonomy 广泛的国际合作,使得Autonomy 成为通过国际厂商接口认
5、证(安全)最多的厂商,同时在安全权限集成方面拥有大量的实施经验。Autonomy 同时也是全球唯一能够完美解决Lotus Notes数据和权限同时集成的厂商;? 系统维护量极低, Autonomy 成熟的设计理念使得所有的功能模块都能够自动运行(数据采集/ 分类 / 关联 / 推3 / 8送 / 词库维护等),基本上不需要人力的维护,从后期维护的费用上看, Autonomy 具有极高的企业应用价值。? 跨平台部署与操作,使企业能够节省硬件投资,尽功能Autonomy其他厂商量采用已有的硬件环境。? 容灾备份方案,使得企业能够实现 7*24 小时的高可用软件环境。? 负载均衡方案,使得企业具有高
6、速的响应速度,根据应用的需求灵活部署负载均衡,合理利用硬件环境。? 高性能支持,可分布式的模块部署使得海量数据的响应速度达到秒级。测试数据表明, Autonomy 在大数据量环境下的性能指标远远超出同类产品。Autonomy 与同类产品技术差异的基本比较4 / 8多信息源的Autonomy 支持几乎所有企业使用的信息源。支持1.Autonomy 利用分布式信息获取技术,实现对互联网信息、多媒体以及其它数据信息(各种关系型数据库系统, 如:Oracle 、SQLServer 、Sybase、DB2等, FTP、FileNet 、 NNTP等常见文本型存储源;其他厂商目前仅支持部分数据源和数据格式
7、。1. 其他厂商不能全面或者完全不支持 Notes、Documentum、 FileNet 、Interwoven 等内容管理系统。2.支持各种文本格式(如: Html 、 Txt 、 Doc、Xls 、 2.其他厂商 信息采 集操 作比较 复PDF、PPT 电子邮件等)的自动实时监控和采集,杂,需要先将信息通过网关等导入并采用人工智能处理技术, 对采集到的信息进行过到其他厂商自带的数据库系统中,滤、自动分类和排重, 存储到统一的信息操作处理此操作不稳定,极易出错。平台。采集后的信息存储在其他厂商自3.带的数据库中。 其他厂商自带数据库结构落后,性能较差。全文搜索1.Autonomy 搜索功能
8、包括概念搜索、优化检索、关仅支持关键词搜索。键词搜索等功能。2.Autonomy 可以为每个用户提供个性化检索服务等功能。3.Autonomy 检索不仅仅局限于对普通文本信息的检索、还包括对图片和多媒体数据的检索Autonomy 采用国内最佳的中文切分词方案海量科技以“砌词”为突破口,巧妙地解决困扰分词最大的问题未登录词的识别问题,在其他问题上博采众长各个击破,采用复方概念平衡各算法,使海量分词在大规模语料测试中的准确率达到了99.5%,分词效率2000万字 /分钟。正因如此,海量科技承担了2000 年度国家863 计划课题 “智能信息内容分析方法研究” ,并为微软、 Autonomy 等国际
9、厂商提供全球范围内的中文分中文切分词词技术。海量中文智能分词算法特点:采用了独特的“砌词”算法,变“切”为“砌”有效提高了分词精度和效率, 对各种歧义的处理能力大幅度提高。自有中文分词技术, 准确率 90以下。发展了受限的隐马尔科夫过程, 使知识库的冗余大幅降低。信息自动摘1.Autonomy 具有基于数据内容中的主要概念进行概1.对单篇文章只能生成固定的自动要括内容摘要的功能摘要。无法根据用户的不同专业2.根据用户的浏览内容或检索条件,产生变化的动态和兴趣生成特定的摘要。摘要,使用户能够通过摘要来判断是否打开进行察2.其他厂商自动摘要功能不智能,看,并且能够动态摘要了解信息条目之间的关系。摘
10、要信息不连贯,甚至无法阅读。信息自动关Autonomy 提供信息的自动关联服务。1.基于矩阵模型的相关文件分析,联1.Autonomy 的架构可以通过识别文档的主要概念,处理效率和文章大小、文章数量5 / 8进而分析信息间的主要关系, 从而实现内容间的交有重大影响。基本上文章超过10叉索引对照。万级别时效率就会很低,对服务2.Autonomy 可以实时生成超链接,保证立即更新,器性能和 搜索响 应都 有很大 影完全不需要手工将链接插入到内容里面。当文档被响。查阅时,这些链接可以自动一次性插入到文档中,因此可以将以前写的文档和文章作为当前文档的2.相关文件关联性较差,基本处于参考,档案资料也可以
11、链接到最新的新闻或相关资概念阶段,少有客户正式使用此料。功能。信息自动分1.Autonomy 能自动对信息进行分类,而且不需要任1.使用传统 SVM 和 KNN 算法自动类何手工维护,可以精确地根据文本中的概念进行分分类。因为算法的先天缺陷,分类,保证依据内容对所有的数据进行最准确的分类效率和效果都不好。类。2.当分类树有变更时,如:增加/修2.Autonomy 平台的分类技术是一个可完全扩展的改/删除 某个分类节点后, 整棵分解决方案,它能最大限度的处理大量信息并且使其类树必须重新学习。保持一致。自动聚类分1.Autonomy 自动聚类分析能够自动地分析文本信息无聚类分析功能。析内容,根据内
12、容概念来把相似的文档聚类到一起(相关性算法),方便用户分析。2.完全自动化的生成类别的标题,并支持二维岛图、二维趋势图以及三维立体图的图形化结果展示。个性化信息1.Autonomy 可实现个性化的信息获取,用户可以利无个性化功能。服务用“个人聚焦” 的功能来建立自己感兴趣的内容频道。2.每个用户的 “个人聚焦” 都维护着自己的相关性列表,这就实现了不同用户的信息获取需求,而且也能够通过训练机制来提高 “个人聚焦” 频道中信息的准确度。知识社区与Autonomy 通过对用户档案的内容分析和总结, 能够无知识社区和协作功能。协作自动发现兴趣相同或接近的其他用户,方便用户之间的协作和交流,用户能够快
13、速参考他人训练好的Agent/代理,实现知识经验的便捷传递。信息自动推Autonomy 用户服务器存储所有的注册用户个性档无主动推送功能。送案信息,用户服务器可以通过用户浏览的信息内容,分析并总结用户的兴趣爱好, 然后进行有目的个性化信息推送服务,支持邮件、 网页、短消息等方式的信息推送。多语言支持Autonomy 特别针对 80 种以上的语言提供优化支持其他厂商底层数据库不是 Unicode(包括中文),实现在一套系统之上的多语言检索能力。设计,不能直接支持多语言多编码。目前只支持中英文。高性能Autonomy 系统的性能变化是线性的,不会像其他其他厂商的业务中心在于内容管系统那样呈现明显下
14、降或不稳定的情况。在性能要求特理,其全文检索部分的索引库架构已有别高的环境下, Autonomy 支持分布式的部署,可以增多年没有更新,性能一般。6 / 8加核心引擎 IDOL ,来做负载均衡,从而提高性能。高可用性Autonomy 高可用性主要是通过Autonomy DAH(分其他厂商系统不能保证服务7*24布式请求服务器)来实现。 DAH能够把来自用户端的小时不间断运行。 不支持负载均衡和容检索请求 ,根据加权预测算法来分布到多个IDOL 之上,灾备份。DAH 能够运行在两种模式下: mirror mode (需要 IDOL的多份 copy)和 non-mirror mode (IDOL
15、中的内容可以相同,也可以不同) 。在这两种模式下, DAH 以两种方式来提供系统的高可用性。自动化Autonomy 系统的所有服务器部件经由配置之后都通过操作系统的任务计划,来实现可以完全自动化的运行,完全不需要人工的任何操作。程序自动化运行。Autonomy 系统的自动化程度非常高, 通常由大量人工处理的工作现在都由计算机来完成,从后台的信息抓取、核心功能的实现,到前端用户个性化信息的推送,都实现了完全的自动化。扩展能力Autonomy 通过分布式的部署来响应对高扩展性方大数据量或大并发用户等企业应面的需求。 Autonomy 系统扩展性非常强, 可以在任何有用场景下,其他厂商无法直接支持,
16、需网络连接的地方来部署Autonomy 的功能模块。所有功要专案定制。能模块都支持分布式的配置,相互之间通过Http/XML来进行通讯。多平台支持Autonomy 支持跨平台的交互操作,可以分布式的对多 CPU 和 64bit 平台不能充分利部署 Autonomy 的各个模块在不同的平台之上,例如部用服务器的性能优势。署核心引擎在 Linux/Unix/Solaris,部署网站连接器在Windows 平台上来增加可操作性,部署前端的Portal 界面在 IBM的服务器上以提高服务质量等等,各个模块之间可以非常紧密地工作在一起。多元性Autonomy 可以处理几乎所有的非结构化信息格式,支持处理
17、部分数据源和数据格式。可以连接多种应用系统。 如微软 Office文档、Adobe PDF文档、各种文本文档、网站系统,支持认证的网站连接抓取、各种数据库系统,例如ORACLE,SYBASE, SQL,ACCESS, DB2等等;邮件系统,例如EXCHANGE,POP3,NNTP等等;媒体文件,例如MPEG,AVI,DAT,WAV,RA,ASF, WMA, MP3 等等;办公系统,例如LOTUS NOTESOPENTEXT, LIVELINK ; HTTP SERVER, FTP SERVER,MOREOVER;各种文件系统, 例如 NT/UNIX/LINUX/NOVELL文件系统;其他大型应用系统,例如 SAP,PEOPLE-SOFT,CRM,ERP,DOCUMENTUM,SIBEL,MICROSOFTSHAREPOINT等等;安全集成Autonomy IDOL 支持和第三方的安全认证系统的权安全性支持差, 一般建议客户使用限无缝集成。 Au
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 草原草原生态补偿金分配与使用考核试卷
- 林业防火机械装备与应用考核试卷
- 探秘六年级模板
- 四年级学生成长解析
- 南京中医药大学《JAVA面向对象编程》2023-2024学年第二学期期末试卷
- 南京旅游职业学院《俄罗斯历史》2023-2024学年第二学期期末试卷
- 江苏省泰兴市济川中学2024-2025学年初三下学期5月练习数学试题含解析
- 吉林省长春市三中2025届4月高三学业水平考试生物试题试卷含解析
- 山东省诸城市龙源学校2024-2025学年中考化学试题冲刺试卷含解析
- 洛阳理工学院《生物材料研究的基础、前沿与应用》2023-2024学年第二学期期末试卷
- GB/T 32960.3-2025电动汽车远程服务与管理系统技术规范第3部分:通信协议及数据格式
- 2024年四川省公安厅招聘警务辅助人员真题
- 全套教学课件《工程伦理学》
- 江苏省建筑与装饰工程计价定额(2014)电子表格版
- 老年人烫伤的预防与护理课件
- 部编版小学道德与法治六年级下册《各不相同的生活环境》课件
- 国内外经济形势和宏观经济政策展望课件
- 国家文化安全
- 我的家乡临海课品课件
- 基础会计教材电子版
- 临床科室医院感染风险评估检查表
评论
0/150
提交评论