DeepSeek开源第三弹,300行DeepGEMM代码开源!仅支持英伟达Hopper架构运算,代码库设计非常简洁
迪丽瓦拉
2025-02-26 16:13:05
0

新浪讯 2月26日上午消息,DeepSeek开源周(OpenSourceWeek)第三日,在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek今日再次宣布开放了DeepGEMM代码库。

据DeepSeek方面介绍,DeepGEMM是专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计,它同时支持普通的和专家混合(MoE)分组的GEMM运算。该库使用CUDA编写,在安装过程中无需编译,通过在运行时使用轻量级即时编译模块来编译所有内核。

目前,DeepGEMM仅支持英伟达Hopper架构运算,为解决FP8张量核心累加不精确的问题,它采用了CUDA核心的两级累加(提升)方法。该代码库设计非常简洁,只有一个核心内核函数,代码量约为300行。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

IPO受益概念26日主力净...
3月26日,IPO受益概念上涨0.78%,今日主力资金流入4518...
2025-03-26 16:20:03
挂钩美元!特朗普家族支持的...
当地时间3月25日,World Liberty Financial...
2025-03-26 15:48:21
人工智能核心综合指数上行,...
截至午盘,上证科创板人工智能指数上涨1.1%,中证人工智能主题指数...
2025-03-26 13:59:09
大盘小幅反弹,A500ET...
市场早盘震荡反弹,个股涨多跌少,盘面上,养殖业、机器人、光伏、化工...
2025-03-26 13:32:56
特朗普家族旗下加密企业宣布...
特朗普家族旗下企业World Liberty Financial在...
2025-03-26 12:58:51
它石智航完成1.2亿美元融...
《科创板日报》3月26日讯(记者 李煜)前华为自动驾驶CTO陈亦伦...
2025-03-26 12:43:30