RealtimeSTT

一款实时语音转文字工具:RealtimeSTT,可以实时显示转录结果

工具功能特点
实时语音转文字(Speech-to-Text, STT)

通过实时语音识别技术,将说话内容即时转录为文本,并在界面上实时显示输出结果。
语音活动检测(Voice Activity Detection, VAD):

自动检测语音的开始与结束,无需手动操作。
精确分离静音部分,从而优化转录效果并节省资源。
唤醒词激活(Wake Word Detection):

支持自定义唤醒词,例如“你好助手”或“开始识别”等。
唤醒后自动启动语音转文字服务,无需手动触发。
录音控制(Automatic/Manual Recording Control):

提供录音启动和停止的手动按钮;
同时支持智能触发录音,根据用户声音动态调整录音状态(比如静音时自动暂停)。
多语种支持:

可适配不同语言的语音输入,支持中英切换及其他主流语言识别。
低延迟处理:

实现毫秒级处理速度,确保实时性,适合会议、直播等场景。
https://github.com/KoljaB/RealtimeSTT

我一般都用听悟