编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

Vosk开源语音识别引擎kaldi的开发套件支持Asterisk

wxchong 2024-10-11 19:04:04 开源技术 34 ℃ 0 评论

语音识别引擎结合媒体服务器实现智能客服集成是很多企业用户的需求之一。如果API或者MRCP接口调用商业语音识别引擎平台的接口费用比较高昂,很多多离线识别和小型终端的支持也不太友好。Vosk是开源的语音识别开发套件,可以支持多种语言,并且可以和开源媒体服务器Asterisk,FreeSWITCH,unimrcp和Jigasi集成(开源jitsi 视频会议服务器的SIP接口)实现离线识别。其语音识别引擎使用的是基于开源语音识别引擎kaldi实现。其应用场景包括轻量级的离线语音识别,支持安卓,树莓派等终端设备。

关于MRCP的语音识别详解,搜索历史文档MRCP协议,笔者发布了完整MRCP的完整规范。


参考文档:

https://alphacephei.com/vosk/server

https://github.com/alphacep/vosk-server

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表