编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

语音识别工具包Kaldi的学习和使用(二):安装前的准备

wxchong 2024-07-05 02:17:21 开源技术 12 ℃ 0 评论

有关kaldi的下载请直接出门左拐就行了。

kaldi的安装概述

关于kaldi工具包的构建,linux系需要参考文档的是 `./INSTALL`,window系需要参考的文档是`windows/INSTALL`,而具体的例子使用需要参考的是文档 `egs/README.txt`。

我使用的系统是Ubuntu 18.04,window系统的观众请出门右拐就好了。

先查看下当前的kaldi版本

kaldi的第一个版本号是5.0.0(2017年1月发布),但通常你只需要下载最新的master就好了,这也是kaldi开发者唯一继续支持的版本。

kaldi需要的安装包

因为kaldi的开发理念,如果你使用linux进行测试和安装,则并不需要额外的安装包,除了git和wget。

但是文档上也说了,如果非要安装的话,你的系统上最好拥有ATLAS linear-algebra包。这是一个自动调优线性代数软件。但是你可以先尝试安装kaldi之后再决定安不安装。

kaldi的脚本会自动安装的工具和库

  • OpenFst :我们对此进行编译并大量使用它。
  • IRSTLM:这是一个语言建模工具包。一些示例脚本需要它,但是它没有与Kaldi紧密集成;我们可以将任何Arpa格式的语言模型转换成FST。

IRSTLM构建过程需要 automake和libtool 。

注意:一些示例脚本现在需要使用SRILM;你需要在线注册才能下载它。

  • SRILM :一些示例脚本使用了这个。它通常是比IRSTLM更好、更完整的语言建模工具包;唯一的缺点是许可证不能免费用于商业用途。你必须在下载页面上输入你的名字来下载它,所以安装脚本需要一些人工交互。
  • sph2pipe :用于将SPH格式文件转换为其他格式,如wav。这是使用LDC数据的示例脚本所需要的。
  • sclite :这是为了评分,不是必须的,因为我们有自己简单的评分程序。
  • ATLAS,线性代数库。只需要它的头文件;在典型的设置中,我们期望ATLAS会出现在你的系统中。但是,如果它还没有在你的系统上,只要你的机器没有启用CPU throttling enabled,你就可以编译ATLAS。
  • CLAPACK,线性代数库(我们下载了头文件)。当没有ATLAS时才会启用。
  • OpenBLAS:这是ATLAS和CLAPACK的替代品。默认情况下,脚本不使用它,但是我们提供了安装脚本,所以如果你想将它与ATLAS进行比较,你可以安装它(它比ATLAS更活跃)。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表