谷歌开源语音引擎:分享9大语音功能,为长篇对话提供字幕

科技频道提示您本文原始标题是:谷歌开源语音引擎:分享9大语音功能,为长篇对话提供字幕 来源:智东西

谷歌开源语音引擎:分享9大语音功能,为长篇对话提供字幕

智东西(公众号:zhidxcom)编 | 韦世玮

导语:在各类语音转录工具百花齐放的当下,谷歌开源的Live Transcribe将给人们带来更便捷和新颖的语音体验。

智东西8月19日消息,近日,谷歌开源了Android语音识别转录工具——Live Transcribe的语音引擎,源代码现在可以在GitHub上获得。

谷歌希望通过这一方式,能够让任何开发者为长篇对话提供字幕,进一步为安卓语音识别转录工具的实时转录功能提供动力。

一、两种转录方式,覆盖所有安卓设备

今年二月,谷歌发布了Live Transcribe,该工具通过使用机器学习算法,能将音频转换为实时字幕。

与谷歌即将为安卓推出的Live Caption(实时字幕)功能不同,Live Transcribe是一种全屏体验,它依赖于谷歌云Speech API(语音应用编程接口),能让用户通过智能手机的麦克风或外接麦克风使用。

推荐阅读