关于录音转文本

Linux  

如果是通话录音需要使用ffmpeg进行左右声道拆分

VAD负责分割录音去除无声音段落,下面两个选其一
https://github.com/wiseman/py-webrtcvad
https://github.com/Baidu-AIP/speech-vad-demo

搭建录音转文本ASR服务,下面三个选其一,PaddleSpeech支持音频转文本,文本加标点符号
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/README_cn.md
https://github.com/nl8590687/ASRT_SpeechRecognition/tree/v1.3.0
https://github.com/openai/whisper

服务流程



评论 0

发表评论

Top