Informatica通过AI技术革新解决企业数据碎片化难题

Informatica通过AI技术革新解决企业数据碎片化难题

数据管理平台供应商Informatica正在扩展其AI能力,以满足生成式AI时代日益增长的企业需求。这家公司早在2018年就推出了首款面向数据的AI工具Claire,在当今生成式AI时代,Informatica进一步增强了Claire GPT的自然语言能力,作为其2023年推出的智能数据管理云(IDMC)的一部分。2025年夏季发布的最新版本展示了公司七年来AI技术演进如何解决企业数据需求,将原本需要七天完成的数据映射工作缩短至不到五分钟。

企业数据碎片化问题持续存在且规模不断扩大,Informatica云集成高级副总裁兼总经理Pratik Parekh指出:”数据在企业中仍然呈现碎片化状态,这种碎片化仍在快速扩大,丝毫没有收敛迹象。”这意味着企业需要将所有数据整合在一起。Informatica的解决方案建立在其所谓的”元数据智能系统”基础上,该系统包含40PB的企业数据模式,不是抽象研究,而是针对数据集成工作流中特定瓶颈的应用机器学习。

2025年夏季版本引入了多项创新功能:能够从简单英语命令构建复杂数据管道的自然语言界面;自动追踪数据谱系至机器学习模型的AI驱动治理功能;以及将长达一周的模式映射项目压缩至几分钟的自动映射能力。自动映射功能使用基于数百万现有数据集成模式训练的机器学习算法,自动在不同企业系统间映射字段,特别适用于从SAP等源系统获取数据并创建主数据管理(MDN)记录的场景。Parekh表示:”我们的专业服务团队过去需要七天完成的映射工作,现在可以在不到五分钟内完成。”

在自然语言交互方面,2025年5月结束早期访问正式发布的Claire Copilot for Data Integration在夏季版本中获得升级。用户现在可以输入如”将所有Salesforce数据导入Snowflake”的请求,系统将自动编排必要的管道组件。技术实现关键在于开发了专门针对数据管理任务进行微调的语言模型,使用Informatica特有的语法体系。Parekh解释:”自然语言翻译成Informatica语法是我们的核心技术所在。我们整个平台是元数据驱动的平台,底层有自己独特的语法来描述映射、数据质量规则和MDM资产等内容。”

随着生成式AI的兴起,企业消费数据的方式发生了根本性变化。Informatica云数据治理和云运营高级副总裁Brett Roscoe指出,过去几年企业数据格局的最大区别在于规模——现在比以往任何时候都有更多人需要更多数据访问。Roscoe表示:”突然之间,在生成式AI的世界里,你的营销团队和财务团队都在要求数据来推动他们的生成式AI项目。”

2025年夏季版本的AI治理清单和工作流功能直接应对这一挑战。平台现在自动编目AI模型,跟踪其数据源,并维护从源系统到AI应用的谱系。该版本还引入了作为API的数据质量规则,支持在AI应用内进行实时数据验证,而非数据移动后的批处理。这种架构转变允许AI应用在消费时验证数据质量,解决了非技术团队启动AI项目时出现的治理挑战。

从技术演进角度看,2025年夏季发布展示了Informatica的AI能力如何从简单自动化发展为复杂编排。增强的Claire copilot系统可以将复杂的自然语言请求分解为多个协调步骤,同时保持人工监督。系统还提供现有数据工作流的摘要功能,用户可以让copilot解释以前开发人员构建的复杂集成流,减少对机构知识的依赖。该版本对模型上下文协议(MCP)的支持,以及对Nvidia NIM、Databricks Mosaic AI和Snowflake Cortex AI的新生成式AI连接器,展示了公司的AI基础设施如何适应新兴技术同时保持企业治理标准。

Informatica七年AI旅程的战略意义在于验证了一个基本事实:在企业AI领域,成熟度和专业性比新颖性更重要。Roscoe指出:”如果在生成式AI出现之前你没有数据管理实践,你会很痛苦;如果在生成式AI出现时你已有数据管理实践,你仍然需要努力适应。”随着企业从AI实验转向生产部署,Informatica的方法验证了企业AI的关键原则:理解并解决企业数据管理复杂现实的AI能力,比单纯的新功能更有价值。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/informatica-tong-guo-ai-ji-shu-ge-xin-jie-jue-qi-ye-shu-ju

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年8月6日
Next 2025年8月7日

相关推荐

发表回复

Please Login to Comment