deepseek大模型生态报告(赛迪智库电子信息研究所)
迪丽瓦拉
2025-03-04 21:57:13
0

今天分享的是:deepseek大模型生态报告(赛迪智库电子信息研究所)

报告共计:150页

《deepseek大模型生态报告》由赛迪研究院电子信息研究所发布,深度剖析了DeepSeek大模型。该模型由杭州深度求索人工智能基础技术研究有限公司于2023年创立,团队年轻且成员多来自国内顶尖高校。其技术创新显著,通过MLA架构和FP8混合精度训练框架进行压缩,采用DualPipe跨节点通信等技术实现并行计算,大幅降低训练成本,仅用557.6万美元预算,在2048个H800 GPU集群上花费3.7天/万亿tokens的训练时间,就达到与其他高价模型比肩的性能。DeepSeek大模型应用广泛,在国内与华为、三大运营商等众多企业合作,国外也获得微软、英伟达等巨头支持,在文学、编程等领域表现出色。它对产业生态影响深远,开源模式推动企业参与开源生态,虽未完全绕开CUDA,但改变了智算中心的建设和发展模式。在国际竞争方面,冲击了全球科技供应链,降低了AI创业门槛,引发资本市场震荡。同时,该模型也带来诸多经验启示,如中科院与DeepSeek在创新模式上存在差异,中国具身智能发展可借鉴其开源等经验;不同国家和地区对DeepSeek态度不一,反映出全球AI领域的竞争格局。

以下为报告节选内容

相关内容