网站首页 > 开源技术 正文
语音识别引擎结合媒体服务器实现智能客服集成是很多企业用户的需求之一。如果API或者MRCP接口调用商业语音识别引擎平台的接口费用比较高昂,很多多离线识别和小型终端的支持也不太友好。Vosk是开源的语音识别开发套件,可以支持多种语言,并且可以和开源媒体服务器Asterisk,FreeSWITCH,unimrcp和Jigasi集成(开源jitsi 视频会议服务器的SIP接口)实现离线识别。其语音识别引擎使用的是基于开源语音识别引擎kaldi实现。其应用场景包括轻量级的离线语音识别,支持安卓,树莓派等终端设备。
关于MRCP的语音识别详解,搜索历史文档MRCP协议,笔者发布了完整MRCP的完整规范。
参考文档:
https://alphacephei.com/vosk/server
https://github.com/alphacep/vosk-server
猜你喜欢
- 2024-10-11 kaldi合并HI-MIA唤醒recipe(pdf合并在线免费)
- 2024-10-11 kaldi三音素GMM学习笔记(kaldi三音素GMM学习笔记2023年)
- 2024-10-11 萌妹的最爱,又可爱又好喝的KALDI 限定低酒精水果味鸡尾酒
- 2024-10-11 kaldi语音识别工具集(kaldi中文语音识别)
- 2024-07-05 语音识别工具包Kaldi的学习和使用(二):安装前的准备
- 2024-07-05 kaldi合并出门问问唤醒recipe(hello和hi的区别)
- 2024-07-05 纯PyTorch语音工具包开源,Kaldi:我压力有点大
- 2024-07-05 日本零食分享第二弹:KALDI(日本,零食)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)