网站首页 > 开源技术 正文
kaldi官方正式合并了基于HI-MIA数据集的唤醒recipe方案。此唤醒的recipe方案由北京希尔贝壳科技,西北工业大学音频语音与语言处理研究组,AISHELL Foundation合作完成。
此recipe方案基于北京希尔贝壳科技在openslr上开源的HI-MIA多通道固定词唤醒数据(https://www.openslr.org/85/)。
提供了2个不同的模型应用方法,第一个是借鉴snip、MobvoiHotwords的chain方案,chain方案由@freewym在arxiv上提出了论文(https://arxiv.org/pdf/2005.08347.pdf),参考论文可以获取更多的信息。效果很好的,大家多去学习。
第二个是唤醒的通用做法,即分别基于deep-KWS和keyword-filler的方案。本次HI-MIA的recipe方案中数据的对齐模型采用开源数据库AISHELL-1,并重新训练一个含唤醒词的声学模型,最后基于后验概率平滑或基于keyword-filler的fst图(可选择)方法。
对语音唤醒有兴趣的可以了解下。
地址:https://github.com/kaldi-asr/kaldi/tree/master/egs/hi_mia/v1
猜你喜欢
- 2024-10-11 kaldi三音素GMM学习笔记(kaldi三音素GMM学习笔记2023年)
- 2024-10-11 萌妹的最爱,又可爱又好喝的KALDI 限定低酒精水果味鸡尾酒
- 2024-10-11 kaldi语音识别工具集(kaldi中文语音识别)
- 2024-10-11 Vosk开源语音识别引擎kaldi的开发套件支持Asterisk
- 2024-07-05 语音识别工具包Kaldi的学习和使用(二):安装前的准备
- 2024-07-05 kaldi合并出门问问唤醒recipe(hello和hi的区别)
- 2024-07-05 纯PyTorch语音工具包开源,Kaldi:我压力有点大
- 2024-07-05 日本零食分享第二弹:KALDI(日本,零食)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)