专栏算法工具链x3 派 实时语音识别 分享

x3 派 实时语音识别 分享

fangjun2023-09-01
56
2
给大家分享一个基于 新一代 Kaldi 的子项目 sherpa-onnx 在 x3 派上进行语音识别的例子. (完全开源、完全免费

1. 安装

下面这个截图演示了如何安装 sherpa-onnx

可以去 https://pypi.org/project/sherpa-onnx/1.7.11/#files 下载需要的 whl

如果你的板子可以联网,那么你只需要 运行

pip install sherpa-onnx

2. 下载模型

可以去

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/index.html

下载一个适合你的模型。

下面截图显示了 streaming zipformernon-streaming paraformer 模型在 x3 排上的 RTF.

3. 实时识别

如果你想进行实时的语音识别,比如,读去麦克风,边说话边识别,请参考

https://k2-fsa.github.io/sherpa/onnx/install/index.html

从源码编译 sherpa-onnx, 你会得到一个 binary: sherpa-onnx-alsa, 它支持读取麦克风,进行实时的识别.

4. 文档及帮助

文档: https://k2-fsa.github.io/sherpa/onnx/index.html

帮助: 请在 github 对应的 repo 提 issue, 或者从文档中找到我们的联系方式,联系我们.

算法工具链
+1
评论2
0/1000
  • fangjun
    Lv.1

    注: 我们还有一个类似的项目,是基于 ncnn 的,叫做

    https://github.com/k2-fsa/sherpa-ncnn

    可以使用 ncnn 进行实时的语音识别,特别适合嵌入式系统.

    文档在

    https://k2-fsa.github.io/sherpa/ncnn/index.html

    2023-09-01
    1
    0
  • hunterkan
    Lv.1

    2023-09-04
    0
    0