最让人惊艳的算法之一——矩阵算法
对于图像处理来说,矩阵运行是其中必不可少的重要数学方法。当然,除图像处理外,矩阵运算在神经网络、模式识别等领域也有着广泛的用途。在这里,我将向大家介绍矩阵运算的典型代表—矩阵乘法的并行化实现。
在矩阵乘法中,第一个矩阵的列数和第二个矩阵的行数必须是相同的。矩阵A
2025年06月20日
最让人惊艳的算法之一——矩阵算法
对于图像处理来说,矩阵运行是其中必不可少的重要数学方法。当然,除图像处理外,矩阵运算在神经网络、模式识别等领域也有着广泛的用途。在这里,我将向大家介绍矩阵运算的典型代表—矩阵乘法的并行化实现。
在矩阵乘法中,第一个矩阵的列数和第二个矩阵的行数必须是相同的。矩阵A
2025年06月20日
新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。
据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。
DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。
2025年06月20日
import torch
# 创建两个2x2矩阵
matrix1 = torch.tensor([[1, 2], [3, 4]])
matrix2 = torch.tensor([[5, 6], [7, 8]])
# 计算矩阵乘积
result = torch.matmul(matrix1, matrix2) # 或者使用 matrix1 @ matrix2
print("矩阵1:")
print(matrix1)
print("\n矩阵2:")
print(matrix2)
print("\n矩阵乘积:")
print(result)
2025年06月20日
图:pixabay
原文来源:medium
作者:Matt Ross
「机器人圈」编译:嗯~阿童木呀、多啦A亮
介绍
我为什么要写这篇文章呢?主要是因为我在构建神经网络的过程中遇到了一个令人沮丧的bug,最终迫使我进入该系统,并且真正了解了神经网络的核心的线性代数。我发现我已经做得很好了,而这只需要确保两个相乘矩阵的内部维度相匹配,而当发生bug时,我只是将各自将矩阵转置于不同的位置,直到事情解决。但是其中有一个隐藏的事实,那就是我并没有真正了解矩阵乘法运算的每一步。
2025年06月20日
前两回,我们认识了向量(数字列表或箭头)和矩阵(数字表格)。我们还吊了个胃口,说矩阵能“指挥”向量。今天,咱们就揭秘这个“指挥”动作是怎么完成的,那就是通过矩阵乘法
2025年06月20日
各位Excel天天学的小伙伴们大家好,欢迎收看Excel天天学出品的excel2019函数公式大全课程。今天我们依旧要学习的是Excel函数中的数学函数MMULT函数,计算两个数组的矩阵乘积。今天这个例子也是非常的简单,就是利用MMULT函数计算两个不等数组的矩阵乘积。
下面我们一起来认识一下MMULT函数,了解MMULT函数的功能、语法及参数解释。
2025年06月20日
机器之心发布
作者:XiaoyuWang
九大章节,一万余字,这篇文章可能是目前为止Maxas汇编器工作原理最全面、最细致的解析。
在从事深度学习框架的实现工作时,了解到 Nervana 有一个称为 Maxas 的汇编代码生成器项目,可以生成性能超过 nVidia 官方版本的矩阵相乘的 GPU 机器码,由此对其工作原理产生兴趣。
2025年06月20日
大学中有一门数学课程,叫线性代数,是最重要的课程之一。线性代数主要涉及矩阵和向量空间的理论,这是数学的一个基础领域,在数学的各个领域都有广泛应用,从概率论到微分方程,再到群论和解析数论等等!
它几乎适用于任何事物,但有些学科特别与矩阵相关,比如图论。
图论是数学的一个分支,主要研究图的性质和图中各种结构之间的关系。在图论中,一个“图”是由一组顶点(或节点)和连接这些顶点的边组成的结构。图可以用来模拟和研究现实世界中的许多类型的网络,如社交网络、交通网络、通信网络,以及任何可以表示为实体之间关系的系统。