文章目录
torchaudio
install
API实例
torchaudio
是pytorch在音频领域的包。
实现的函数有:
音频输入与输出
加载允许使用sox来转化为torch tensor,支持以下格式
mp3, wav, aac, ogg, flac, avr, cdda, cvs/vms,
aiff, au, amr, mp2, mp4, ac3, avi, wmv,
mpeg, ircam
加载常见的音频数据集 VCTK 或YesNo
常见的音频转换
Spectrogram, AmplitudeToDB, MelScale, MelSpectrogram, MFCC, MuLawEncoding, MuLawDecoding, Resample
install
依赖环境
The following is the corresponding torchaudio versions and supported Python versions.
torch
torchaudio
py
科技之禅
认证博客专家
算法
数据分析
PyTorch
1.职位:高级算法研究员;2.主要的研究领域:语音合成、语音识别、歌声合成、强化学习;3.历史项目经历: A.ML:AI平台算子开发,B.DNN:歌声合成系统开发,C.DNN:中英语音合成算法研究以及文本正则处理,D.强化学习:AlphaGo复现象棋开发,E.知识图谱:运维机器人开发,F.工程化:AI微服务。