2026年从数据困境到AI就绪型数据网格白皮书_第1页
2026年从数据困境到AI就绪型数据网格白皮书_第2页
2026年从数据困境到AI就绪型数据网格白皮书_第3页
2026年从数据困境到AI就绪型数据网格白皮书_第4页
2026年从数据困境到AI就绪型数据网格白皮书_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从数据混乱到AI从数据混乱到人工智能就绪的数据网介绍3背景信息行业趋势技术趋势55数据管理演变6目标商业目标北极星愿景结论从数据混乱到AI准备好的数据网格介在接下来的十年中,电信领域将通过解锁和利用数据的全部潜力。除了数据量的扩大,跨领域、平台和模式的数域元素、服务保证引擎、客戶体验代理以及其他类似系统产生了特定在数据管理层中,挑战在于管理来自不同来源的高容量数据流的集成缩放、支持无缝数据集成、可以以混合方式部署,并专为AI原生智能和自主网络及操作从数据杂乱到人工智能准备好的数据本章捕捉了各种行业、技术和商业趋势,这些趋势正在影响从数据混乱到人工智能准备的数据网行业趋势电信运营商已有数据管理架构,但成本较高,因为大型数据集通常在不必要的数据传输和存储中操作。技术趋势在技术趋势方面,最明显的推动力是人工智能的使用增加,包工智能相关的自动化。人工智能的使用要求更高的数据质量和数量,这成的数据集以及关系的表达。人工智能还进一步推动了使数据更易于访问的需求,商业趋势化努力,以精简运营并最大化收入,绝大多数企业将专注于利用人工智能在这将更加重视数据及其时效性、可用性和在人工智能流程中使用的准数据的可用性和准备情况在数据管理领域至关重要,这在许多其他相从数据混乱到人工智能准备的数据网变实时网络数据数据管道联合数据湖产品数据数据精炼数据摄取最终用戶数据数据存数据精炼数据摄取最终用戶数据储储网络数据网络数据数据管理系统负责处理来自各种来源的数据一旦获取,这些系统就需要负责对数据进行编目,应用去标识数据集精炼为可处理和可靠的数据集。这使得数据准备好供各类消费现代数据管理系统与常见的数据湖提供无缝集成,具有利用数据湖作平台的上坡和下坡功能。此外,这些系统正在从单体架构转向分系统中,计算资源可以更靠近数据。这种方法利用数据联合确保⽤这些系统必须覆盖多种用例,以安全地管理数据并有效治理确保从数据混乱到人工智能就绪的数据网•数据目录管理•数据质量报告•数据血缘报告•数据安全和审计日志•数据摄取框架•数据与数据湖屋的集成•数据联合数据生产者数据消费者数据生产者数据收集与联合数据领域管理数据消费数据赋能数据收集与联合数据领域管理数据消费数据动力学与转型部分数据动力学与转型部分数据管理基础设施部分-解耦存储和计算数据管理基础设施部分-解耦存储和计算数据管理-安全部分数据管理-治理部分从数据混乱到AI准备好的数据网数据•数据管理架构采用联邦方法:数据接入架构可以轻松上下扩展,支持批量和流数据,并•数据只收集一次,允许多个消费者:联邦系统具有一个数据接入架构,只收集数据集一•数据以透明、合规和道德的方式使用,考虑到最终用戶的价值:数据被民主化,这意味着它可供相关消费者使用,而不妨碍适用的安全政策和法规数据岛可以被视为数据的所谓着陆区域,数据在这里到达、被处理使用案例。数据还需要为长期使用案例存储,例如趋势分析和历本章节涵盖了与数据架构现代化相关的挑战,以满足在IT、网络和运营中的自主网络5级自主状态的需求随着网络朝着完全的5级自主性发展,其中自主AI系统以最小或可能没有人类提⽰的方式进行感知、推理和端到端行动,数据管理未来状态架构必须从批量导向存储转变为实时、丰富上下文的AI原生结构。以下是与集成生成AI和自主AI相关的关键挑战的简明、结构化视图数据碎片化和联邦化:•异构领域孤岛和多供应商需求,例如RAN、核心、边缘、基础设施运营支持实时,低延迟处理:•通过动态策划推理时刻的上下文来避免所谓的令牌过载在大型语言模型(LLM•通过仅向代理提供它们所需的精确简报包来平衡宽度与深度•防止自我推理循环中的幻觉和陈旧数据漂移从数据混乱到人工智能准备的数据网治理、合规和安全:•将自动化政策检查、个人身份信息编辑和伦理约束嵌入每个管道阶段.•确保每个代理行为的可审计决策轨迹,跨多个数据共享方.可观察性和代理操作复杂性:•对数百个协作代理进行遥测、日志和反馈信号的监测.•协调大型语言模型(LLMs),小型语言模型(SLMs)和特殊神经模型,跨不同数据格式和服务水平协议(SLAs)进•通过可发现的应用程序接口(APIs)实现面向领域的数据产品,以促进去中心化和所有权。北极星愿景数据管理的北极星愿景是开发一个演变的和AI准备好的数据管理套件,包含安全的组件,基于基本的数据管理原则构建。它也支持数据统一、联合数据服务,以及与数据源的可扩展无缝集成.所有数据都是以均匀的方式消耗的,无论来源如何,利用复合的数据管道为AI准备好的数据提供支持,支持语义建模。这一愿景特别强调了以下图⽰中显⽰的不同元素.数据集成和数据数据集成和数据数据统一和联合数据赋能和准备数据产品和货币化管道效率用于AI集成AI数据治理数据安全灰色列表⽰数据的自然流动。叠加其上的则是数据管理方面,数据统一与联合联合系统在适当扩展以应对不断增加的数据量时解决了许多问题。离数据更近的地方可以优化处理时间,并提供一种有效的的计算资源。对于联合系统,确保一个全面且高效的数据这些系统还需要一个共同框架来支持健壮且无缝集成的数据孤岛的岛可能由共同的数据处理资产和差异化资产组成。此外,它们实施一个共享的共同规范。将数据孤岛结合成一个网格是一种现代化模式,用于数据联合可以分解为五个主要方面:3一个安全的远程数据访问,其中消费者经过验证以确保信任,系统配置为仅显⽰必要的数据元素为AI提供数据准备在自主AI和数字双胞胎生态系统中,自主的智能代理进行推理、行动,并从输入中持续学习,数据的使能和AI就绪不仅成为分析的前奏,还成为一种战略能力。AI应用需要可靠和及时地访问可信的数据,以支持接近实时的决策制定、学习循环和安全通过高效、可扩展的AI就绪数据管道提供当组织加速采用AI就绪数据时,需要语义和上下文上使能和管理这些输入变得极为重在自主AI中,数据被自主消费和作用,特征工程和特征存储必须超越战术的AI或机器学习(ML)工具,演变为语义丰富的组件,与语义模型、本体和知识图紧密集成。这将使AI代这些特征放置在特征存储中,使其可以用于AI模型训练和推理。语义一致性对于确保代理在上下文中解释数据至关重要,防止他们做出错误的假设、进行错误推作。语义感知的特征工程,通过利用具有领域知识图的本体驱动架构和语据领域创建上下文感知特征,使其在某一领域本体或知识图中从数据杂乱到AI准备好的数据网格北采用AI驱动的自动化来实现数据赋能和为AI的准备,允许自适应的数据准备循环。随着AI模型的演变和智能体的学习,数据准备也必须演变,解决新的、相关特征的自动发现和与机器学习操作(MLOps)平台的集成,以触发重新训练以实现持续改进。这确保了数据和智能体AI智能的共同演进。数据集成和数据管道效率数据集成在今天的电信生态系统中,数据来自碎片化的来源,无论是传统系统、边缘设备、云原生服务、物联网(IoT)传感器,还是合作伙伴API。传统的僵化集成模型无法容纳AI驱动的实时和语义丰富的应用。明天的集成必须是智能的、自适应的和自主的,超越数据管道,以协调跨完整电信堆栈的多源、多格式、多速率流。南北集成,重新构想:现代架构将北向系统,如AI/ML、分析和数字应用,和南向系统,如网络、OSS/BSS和边缘,视为在持续学习的生态系统中不断演进的智能实体。能够自适应于模式、元数据变化和上下文变化的语义感知连接器将是必不可少的。AI增强的可组合管道:集成必须变得动态,由AI代理根据数据需求和上下文组成。使用声明式元数据和策略,作为代码的集成使新领域、集成模式和外部数据产品的快速上手成为可能,且手动工作量最小。例如,一个上下文感知的AI代理可以发现一个5G网络事件流,推断其在预测性维护用例中的相关性,并以最小的人为干预自动集成该流。语义互操作性:未来数据集成框架嵌入语义智能,利用本体和知识图谱确保数据在语法上连接,并在语境上对齐。这使得跨领域的推理能够在RAN、核心、OSS/BSS和客戶体验系统中进行。语义中介引擎将把来自不同领域的数据映射到统一的知识模型中,使AI模型能够以清晰的方式解释和行动,即使在动态环境中也是如此自主集成服务:AI原生集成框架配备了自愈、自优化的能力,观察集成管道的遥测以执行以下操作:•触发模式协调工作流•优化数据流路径以降低延迟或成本•通过元数据收集和使用分析自动发现新来源边缘到云的集成:数据集成应支。这允许从边缘设备快速而有效地共享数据,同时确保数据在中央分析中保持一致。使用分布式微服务和流式架构,数据可以在生成地点附近进行处理和清理,然后将数据的有用部分发送到云系统。这个设置还允许边缘的人工智能与本地数据一起工作,同时仍然为更大、更连接的智能系统做出贡献从数据混乱到人工智能准备好的数据者简单地定义他们需要什么,而系统智能地安排如何获取、转换和交安全和实时的方式进行。这与数据网格哲学无缝对接,其中集成是去,语义上丰富,并针对灵活性、可扩展性和信任进行了优化。数据管道效率数据管道是为了传输和处理大型、不同的数据集而构建的,通常、转换、加载(ETL)过程。然而,这只是一个简化;更常见的是,管道被定义为一行业标准围绕度量、日志和跟踪的收集而演变,许多可观测性框架,例如try,允许进行遥测数据收集的通用框架,并为遥测语法提供新兴标准。电信行业通常在故障指⽰中增加第四个遥测信号,通常被称为警报。警报基本上是预先创建的明应用程序运行中可能存在的问题。但是在云原生的可观测性事后分析以检测故障,因为这简化了应用程序软件的责任,从自我分析转为仅数据管理系统中的每个数据收集器、数据处理器、消息总线、一个集中式的可观测性功能观察来自数据管道所有组件的遥测该功能可能决定为管道中的某些类型的数据创建优先级流,或修改用存储。该功能还可以观察到延迟的增加,并决定是否道的遥测中创建见解,一个代理处理见解并映射到行动,而另一数据治理随着电信运营商努力实现数据货币化、改善客的数据治理已成为基础能力。这需要一种综合的治理方法,包括数共享和分析。这意味着必须在数据管理架构中考虑各项能力,以确从数据混乱到AI准备好的数据网格北数据安全隐私意识的数据去标识化和统一通过适当的隐私保护技术进行匿名化、伪匿名化和从孤岛中统和数据敏感性,可能会导致重新识别风险,违反数据主权规在向智能AI生态系统的转变中,数据安全不再仅仅是围栏防御;它变得更加语义化、动态、嵌入、以本体和代数据安全需要与数据一起传播,可以被代理解释,并能实时适应环境这需要与数据结构、语义模型、政策引擎和身份框架进行深度集成,以确保自治和安全能够协同增长确保数据安全的重要部分是理解数据的性质并遵守定义如何处理不同数据类型的原则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论