python如何处理matlab的mat数据

时间：2022-08-16 12:37:33|栏目：Python代码|点击：次

处理matlab的mat数据

python 和matlab是2个常用的实验室平台工具，在一些应用下，这2个不同平台下的数据会打交道，因此如何读取和保存显得尤为重要，这里需要用到python的第三方平台下的scipy模块。

先用下面这个命令检查是否下载好scipy

import scipy

如果报错，用python install scipy 或者 conda install scipy 下载安装

需要用到scipy中的输入输出类中的loadmat 和savemat方法：

import scipy.io as sio
 
sio.loadmat(file_name, mdict=None, appendmat=True, **kwargs)
sio.savemat(file_name, mdict, appendmat=True, format='5', long_field_names=False, do_compression=False, oned_as='row'

下面介绍一个简单的错误例子：（需要传字典格式的参数）

import scipy.io as sio
import numpy as np
 
x = np.ones((3,3))
 
x
Out[86]: 
array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])
 
sio.savemat('f.mat',x)
Traceback (most recent call last):
 
  File "<ipython-input-87-d739bc03c885>", line 1, in <module>
    sio.savemat('f.mat',x)

下面介绍一个简单的保存导入例子：

import scipy.io as sio
import numpy as np
 
x = np.ones((3,3))
 
x
Out[86]: 
array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])
 
sio.savemat('f.mat',{"x":x})
 
 
 
myMat =sio.loadmat('f.mat')
 
print(myMat) #输出为字典
{'__header__': b'MATLAB 5.0 MAT-file Platform: nt, Created on: Fri Aug 21 16:29:37 2020', '__version__': '1.0', '__globals__': [], 'x': array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])}
 
#以保存名为key，输出list value
print(myMat['x'])
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]

如果想把python数据保存为mat数据，则需要cell格式数据，而python没有实现cell，因此需要用到numpy模块，可以看这篇博客。

处理matlab的*.mat格式数据及常见错误汇总

由于matlab和python两种语言的编程方式不同，有时候在进行程序混编时，需要利用python调用matlab下的格式数据，下面介绍如何调用mat格式数据及常见错误解决方法，仅供参考！

一、数据读取错误

＃　最初用loadmat读取数据
import numpy as np
from scipy.io mport loadmat
img = loadmat('im.mat')['im']   #im.mat为mat数据的名称，['im'] 中的im表示该文件下im的数据

使用如上代码读取数据时，会出现如下错误：

在这里插入图片描述

如果出现以上错误，改用下面方式读取，

import h5py
img = h5py.File('im.mat')['im']
img = h5py.File('im.mat'，'r')['im']    # 无警告

二、数据类型错误

（用Python处理图像时，若涉及加减运算，溢出差值被重新赋值255-0）

# python代码
import h5py
import numpy as np
img = h5py.File('im.mat')['im']
# python中的M，N刚刚好与matlab中的M，N取值相反，此处进行转置与matlab相同矩阵格式进行处理
x = np.array(img).T  
[M, N] = x.shape
if M < 16 and N < 16:
    score = -2
# Feature Extraction:
# 1. horizontal features
d_h = x[:, 1:N] - x[:, 0:N - 1]   # 该步操作图像产生满溢，溢出后差值可能都被赋为255，依次递减

此种情况下，d_h数据会出现满溢情况，下面就是相同数据在python和matlab下面进行运算的差异性。

在这里插入图片描述

% Matlab 代码
img = laod('im.mat')
[M, N] = size(x)
if M < 16 | N < 16
    score = -2;
end   
x = double(img);  % 将无符号类型uint8数据类型转换为double类型
% Feature Extraction:
% 1. horizontal features
d_h = x(:, 2:N) - x(:, 1:(N-1));

在这里插入图片描述

原因： 导入数据类型为 uint8 数据格式，该种格式下是没有负数的，在matlab中进行运算时，先将uint8数据类型转化为了double类型，然后进行了减法运算，所以会出现如上结果，但是在python中，由于没有double类型，所以需要自己手动设置数据格式类型，只需要改成不是uint8格式即可（具体格式需要根据需求，此处改成了int8格式类型）。解决方法非常简单，只需在上面的一行代码中加入数据类型即可：

x = np.array(img,dtype = 'int8').T   # 对读取的uint8格式数据进行重新定义一下格式即可
x = np.array(img,dtype = 'float').T   # 下面这种格式虽然是浮点型，但是计算过程不容易出错，如果是上面的int8会出现部分错误，需要注意

现在看一下结果，就跟matlab处理结果一样了。

在这里插入图片描述

虽然下面是浮点型，但是能够保证数据转化的精度和准确性，img的影像数据转化成数值时不出错误，非必要情况下，不要使用int8数据格式，因为使用int8格式数据类型，会在某些部分出错，这一定要注意。（改组数据中（0，80）数值在int8格式转化时出错，原始数值为129，转化之后变成127，而使用float格式则不会出现错误）

在这里插入图片描述