关于录音转文本
- 开发技术
- 2023-08-17
- 488
- 0
如果是通话录音需要使用ffmpeg进行左右声道拆分
VAD负责分割录音去除无声音段落,下面两个选其一
https://github.com/wiseman/py-webrtcvad
https://github.com/Baidu-AIP/speech-vad-demo
搭建录音转文本ASR服务,下面三个选其一,PaddleSpeech支持音频转文本,文本加标点符号
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/README_cn.md
https://github.com/nl8590687/ASRT_SpeechRecognition/tree/v1.3.0
https://github.com/openai/whisper
服务流程