华为携手景联文科技发布面向AI数据湖的数据工程联合解决方案
迪丽瓦拉
2025-03-25 19:45:32
0

近日,在2025年华为中国合作伙伴大会上,华为携手景联文科技发布面向AI数据湖的数据工程联合解决方案。该方案基于端到端高效、可靠、共享、易管理的AI数据湖,旨在将海量多模态数据资源高效转化成高质量AI算料,为行业智能升级注入充沛的数据动能。

景联文科技CEO刘云涛

“AI-ready的前提是Data-ready,大模型的好坏取决于数据的好坏。高质量数据集的供给是AI行业化落地的关键要素,也是促进数据要素繁荣交易的根基。”景联文科技CEO刘云涛强调,“精准全面的数据治理能力,结合可靠高效的数据基础设施,在智能化升级中不可或缺。”

普遍来说,面向AI的数据需要经历三大环节,即:从海量原始数据提炼为结构化数据集,然后经标注成为语料集,最终构成知识库、支撑模型训练及业务应用。在这个过程中,当下正面临多重挑战:

● 首先,数据拥有方动力不足:大部分数据持有者缺少便捷安全的数据汇聚托管系统,普遍陷入“不愿、不敢、不会”的困境,数据共享壁垒高筑。

● 其次,语料开发难:原始数据种类多、格式杂、时效高,如文本、图像、音视频等多模态原始数据,增加了语料处理的复杂性。同时,行业专用语料往往包含大量特有的垂类知识、表达方式,加剧了精准标注的难度。

● 最后,数据可信流动难:数据作为风险资源,如果在流通中缺少端到端安全管控,则易遭受被篡改、被扩散的风险。此外,区域间数据基础设施发展程度不均,且兼容性和互操作性不足,导致数据跨域流通效率低下。

景联文科技与华为强强联合,依托景联文科技深耕多年的数据工程能力、以及华为数据存储行业领先的技术优势,推出面向AI数据湖的数据工程联合解决方案:

● 全流程数据工程:景联文科技Solar Data平台采用AI Agent理念,与全闪数据湖存储紧密协同,支持异构数据的高效加工,实现对30+格式的自动或半自动化清洗、解析、预处理、特征提取与初步分析,并基于AI预标注与专业手工标注结合,最终整合为高质量的数据产品,全流程效率提升70%。

● 数据流通与资源调度:通过华为DME(Omni-Dataverse)全局文件系统,结合可信数据空间,实现多源数据无缝归集,让全局数据可视、可管、可流,保障数据交换过程的可信、可证、可控。基于华为DCS的统一资源调度,实现Solar Data平台计算、存储、网络等资源的弹性服务与统一管理。并通过ModelEngine AI使能工具链框架,实现高效模型编排与应用对接,加速数据集开发进程。

● 先进数据底座:基于华为OceanStor Pacific分布式存储底座建设统一数据底座,在先进介质、协议互通、负载优化、分布式并行客户端等领域软硬协同创新,打造业界领先的高密绿色数据基础设施,助力海量数据更持久地存储、更高效地访问。

华为数据存储将持续深化与业界伙伴的合作,携手促进AI时代应用生态的蓬勃壮大,秉持“以数据为中心”的产业理念,发挥数据在数字经济的核心驱动力作用。

相关内容

热门资讯

神宇股份涨3.85%,成交额2... 5月6日,神宇股份涨3.85%,成交额2.29亿元,换手率5.11%,总市值65.05亿元。 异动分...
广发基金宣布增加瑞银证券为云计... 广发基金管理有限公司近日发布公告,宣布增加瑞银证券为旗下部分ETF的一级交易商。此次新增的一级交易商...
湖北国资:一年收了4家上市公司... 你好,我是涛哥,专注于并购重组投资。这是涛哥的第69篇原创文章。 2024年,湖北国资收了4家上市公...
特斯拉一季度净利锐减71%!马... 当地时间4月22日,特斯拉首席执行官埃隆·马斯克表示,他计划在5月“大幅”减少为特朗普政府工作,以专...
紫燕食品发布2024年年报:创... 4月17日晚,上海紫燕食品股份有限公司(简称:紫燕食品,603057.SH)发布2024年年度报告。...
红利策略进化论:从防御盾牌到现... 当前市场对贸易摩擦的敏感度明显降低,近期各类关税消息虽然层出不穷,但A股基本走出脱敏行情,相关板块波...
原创 腾... 海内外大厂大模型研发正在进入新升级周期,为了加速补齐技术短板,腾讯混元近日进行了大幅架构调整,重构研...
钧达股份通过港股IPO聆讯:光... 瑞财经 吴文婷 4月21日,海南钧达新能源科技股份有限公司(以下简称“钧达股份”)通过港交所聆讯,华...
鲁东红:提振消费政策落到实处,... 编者按:提振消费、扩大内需是促进经济持续回升向好的关键之举。近日,中国人民大学重阳金融研究院 宏观研...
我市加快建设水利基础设施持续增... 我市加快建设水利基础设施持续增强水利支撑能力 ■ 截至目前,全市136个项目已开工建设,累计完成投资...