pytorch中permute()函数用法实例详解

前言

本文只讨论二维三维中的permute用法

最近的Attention学习中的一个permute函数让我不理解

这个光说太抽象

我就结合代码与图片解释一下

首先创建一个三维数组小实例

import torch

x = torch.linspace(1, 30, steps=30).view(3,2,5)     # 设置一个三维数组
print(x)
print(x.size())				# 查看数组的维数

这里为了防止出现维数数值相同的巧合局面（例如三维数组（3,3,3）或者（2,4,4）等）

输出结果如下图

一般的把（3,2,5）解释为3维2行5列这里很容易让人迷迷糊糊

那么我们按照块，行，列理解起来会更容易一些

比如(3,2,5),表示3块 2*5的数组

以下我简单用3块3*3图偷懒举例

然后堆起来就是我们熟知的三维矩阵

接下来先简单介绍下permute（）函数

permute（dims）
参数dims用矩阵的维数代入，一般默认从0开始。即第0维，第1维等等
也可以理解为，第0块，第1块等等。当然矩阵最少是两维才能使用permute
如是两维，dims分别为是0和1
可以写成permute（0,1）这里不做任何变化，维数与之前相同
如果写成permute（1,0）得到的就是矩阵的转置
如果三维是permute(0,1,2)
0代表共有几块维度：本例中0对应着3块矩阵
1代表每一块中有多少行：本例中1对应着每块有2行
2代表每一块中有多少列：本例中2对应着每块有5列
所以是3块2行5列的三维矩阵
这些0,1,2并没有任何实际的意义，也不是数值，只是用来标识区别。有点类似于x，y，z来区分三个坐标维度，是人为规定好的
三维情况直接用下面的代码来给大家讲解

三维情况

变化一：不改变任何参数

b = x.permute(0,1,2)            # 不改变维度
print(b)
print(b.size())

发现此时矩阵没有变化，依然是按照之前的方式排列

变化二：1与2交换

b = x.permute(0,2,1)             # 每一块的行与列进行交换，即每一块做转置行为
print(b)
print(b.size())

两张图片可以比较

在不改变每一块（即）的前提下，对每一块的行列进行对调（即二维矩阵的转置）

变化三：0与1交换

b = x.permute(1,0,2)            # 交换块和行
print(b)
print(b.size())

两者比较可以看出块数和每块的行数发生了变化

即参数0对应的数值3块变成2块

参数1对应的2行变成3行

这个变化刚好是0与1 的位置交换，导致参数进行对调

此时变成了2块 * 3行 * 5列（初始为3块 * 2行 *5列）

变化四：0与2交换

b = x.permute(2,1,0)            # 交换块和列
print(b)
print(b.size())

此时参数0对应的3块经过permute已经变成了5块

参数2对应的5列已经变成了3列

变化五：0与1交换，1与2交换

b = x.permute(2,0,1)            # 交换块和行和列
print(b)
print(b.size())

此时参数0对应的3块变成了5块

参数1对应的2行变成了3行

参数2对应的5列变成了2列

变化六：0与1交换，0与2交换

b = x.permute(1,2,0)            # 交换块和行和列
print(b)
print(b.size())

此时参数0对应的3块变成了2块

参数1对应的2行变成了5行

参数2对应的5列变成了3列

总结

根据以上举得二维和三维例子可以知道permute()函数其实是对矩阵的块行列进行交换

里面的参数并不是具体数值

而是块行列的代指

写在最后

没想随手写的一篇居然这么多读者关注

我又在此篇文章的基础上，详细的解释了维度变化过程

能够更好的帮助大家理解permute函数的用法

进阶文章请戳我

频道导航