星驰编程网

免费编程资源分享平台_编程教程_代码示例_开发技术文章

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。

编辑 姜樊

校对 刘军

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言