编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

kaldi合并出门问问唤醒recipe(hello和hi的区别)

wxchong 2024-07-05 02:17:17 开源技术 11 ℃ 0 评论

freewym(Yiming Wang)在kaldi的master分支合并了Wake-word detection #3467。

此前,出门问问团队在openslr上上传了数据,地址:https://www.openslr.org/87/。此数据含有:“hi,小问”和“你好,问问”,还包含一些非唤醒的数据。可以说这个数据基本包含工业界做唤醒的一些数据。数据开源了,当然脚本就开出来。其实脚本还早是ready,可能是等数据出来后才一起开放出来。

脚本提供了chain的方案跟e2e的两套方案。此外,在kaldi/src/online2下也提供在线的程序(online-nnet3-wake-word-faster-decoder),主要根据唤醒的一些特性改了一些。

其中当时这个recipe并没有用SLR87的数据,而是内部数据。@freewym把SLR87合并进去了。至此,在kaldi用chain这套做唤醒的框架有三个recipe:mobvio,mobviohotwords,snip。基于chain的这套方案,可能大家自己在论文或者其他地方都没怎么看到过此方案的具体介绍,但目前效果还是挺好的。在recipes里面提供了一套基于chain的方案,还提供了一套E2E的方案,有兴趣的同学可以自行去研究下。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表