2018 年度 GtiHub 开源项目 TOP 25:数据科学 & 机器学习(15)

英伟达的 WaveGlow

开源地址:https://github.com/NVIDIA/waveglow

2018 年度 GtiHub 开源项目 TOP 25:数据科学 & 机器学习

音频处理是深度学习开始做出成绩的另一领域。不局限于生成音乐,你也可以完成音频分类、指纹识别、分割、标注等任务。现在该领域还有很多可以探索的空间,谁知道呢,也许你可以使用这些开源项目来走上人生巅峰。

这里有两篇非常直观的文章,可以帮助你熟悉这项开源工作:

《使用深度学习开始进行音频数据分析(附案例研究)》,Getting Started with Audio Data Analysis using Deep Learning (with case study):https://www.analyticsvidhya.com/blog/2017/08/audio-voice-processing-deep-learning/《10 个音频处理任务让你开始深度学习应用(附案例研究)》,10 Audio Processing Tasks to get you started with Deep Learning Applications (with Case Studies):https://www.analyticsvidhya.com/blog/2018/01/10-audio-processing-projects-applications/重新回到英伟达这里。WaveGlow 是一个基于流的网络,能够生成高质量的音频。本质上,它是一个面向语音合成的单网络。

推荐阅读