deepseek大模型生态报告(赛迪智库电子信息研究所)
迪丽瓦拉
2025-03-04 21:57:13
0

今天分享的是:deepseek大模型生态报告(赛迪智库电子信息研究所)

报告共计:150页

《deepseek大模型生态报告》由赛迪研究院电子信息研究所发布,深度剖析了DeepSeek大模型。该模型由杭州深度求索人工智能基础技术研究有限公司于2023年创立,团队年轻且成员多来自国内顶尖高校。其技术创新显著,通过MLA架构和FP8混合精度训练框架进行压缩,采用DualPipe跨节点通信等技术实现并行计算,大幅降低训练成本,仅用557.6万美元预算,在2048个H800 GPU集群上花费3.7天/万亿tokens的训练时间,就达到与其他高价模型比肩的性能。DeepSeek大模型应用广泛,在国内与华为、三大运营商等众多企业合作,国外也获得微软、英伟达等巨头支持,在文学、编程等领域表现出色。它对产业生态影响深远,开源模式推动企业参与开源生态,虽未完全绕开CUDA,但改变了智算中心的建设和发展模式。在国际竞争方面,冲击了全球科技供应链,降低了AI创业门槛,引发资本市场震荡。同时,该模型也带来诸多经验启示,如中科院与DeepSeek在创新模式上存在差异,中国具身智能发展可借鉴其开源等经验;不同国家和地区对DeepSeek态度不一,反映出全球AI领域的竞争格局。

以下为报告节选内容

相关内容

热门资讯

神宇股份涨3.85%,成交额2... 5月6日,神宇股份涨3.85%,成交额2.29亿元,换手率5.11%,总市值65.05亿元。 异动分...
广发基金宣布增加瑞银证券为云计... 广发基金管理有限公司近日发布公告,宣布增加瑞银证券为旗下部分ETF的一级交易商。此次新增的一级交易商...
特斯拉一季度净利锐减71%!马... 当地时间4月22日,特斯拉首席执行官埃隆·马斯克表示,他计划在5月“大幅”减少为特朗普政府工作,以专...
湖北国资:一年收了4家上市公司... 你好,我是涛哥,专注于并购重组投资。这是涛哥的第69篇原创文章。 2024年,湖北国资收了4家上市公...
红利策略进化论:从防御盾牌到现... 当前市场对贸易摩擦的敏感度明显降低,近期各类关税消息虽然层出不穷,但A股基本走出脱敏行情,相关板块波...
原创 腾... 海内外大厂大模型研发正在进入新升级周期,为了加速补齐技术短板,腾讯混元近日进行了大幅架构调整,重构研...
紫燕食品发布2024年年报:创... 4月17日晚,上海紫燕食品股份有限公司(简称:紫燕食品,603057.SH)发布2024年年度报告。...
影响市场大事件:央行副行长陆磊... 每经记者:杨建 每经编辑:肖芮冬 |2025年4月24日 星期四| NO.1央行副行长:人民币已成为...
钧达股份通过港股IPO聆讯:光... 瑞财经 吴文婷 4月21日,海南钧达新能源科技股份有限公司(以下简称“钧达股份”)通过港交所聆讯,华...
我市加快建设水利基础设施持续增... 我市加快建设水利基础设施持续增强水利支撑能力 ■ 截至目前,全市136个项目已开工建设,累计完成投资...