时间:2021-01-16 12:30:26 | 栏目:Python代码 | 点击:次
最近使用Python调用百度的REST API实现语音识别,但是百度要求音频文件的压缩方式只能是pcm(不压缩)、wav、opus、speex、amr,这里面也就wav还常见一点,但是一般设备录音得到的文件都是mp3,这就要把mp3转换为wav,由于python的效率并不高,很多实现都是使用C++或者Java,不过GitHub上有一个项目pydub(https://github.com/jiaaro/pydub/tree/master/pydub)可以暂时解决问题。
安装pydub
直接执行以下命令即可
pip install pydub
环境依赖
sudo apt-get install ffmpeg
mp3转换为wav
from pydub import AudioSegment sound = AudioSegment.from_mp3("/path/to/file.mp3") sound.export("/output/path", format="wav")