DeepSpeech
语音识别
DeepSpeech

Project DeepSearch是Mozilla的一个开源语音转文本引擎。此语音转文本命令和库在Mozilla公共许可证(MPL)下发布。它的模型参考的是百度深度语音研究论文,具有端到端的可训练性,并支持多种语言音频转录。它使用Google的TensorFlow进行训练和实现。

从GitHub下载源代码,并将其安装到您的Python中以使用它。该工具已经在英语模型上进行了预训练。但是,您仍然可以使用您的数据训练模型。或者,您可以获得一个预先训练的模型,并使用自定义数据对其进行改进。

优点:

  • DeepSpeech很容易定制,因为它是一个原生代码解决方案。
  • 它为Python、C、.Net Framework和JavaScript提供了开发包,不管哪一个开发语言,都可以使用该工具。
  • 它可以在各种小设备上运行,包括Raspberry Pi设备。
  • 它的每字错误率非常低,为7.5%。
  • Mozilla对隐私问题采取了严肃的态度。

相关导航