x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别

作者

猴君

首页»
业界新闻»
新闻资讯»
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别

发布时间:2024-07-29 03:59

阅读量:0

介绍

Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。

INFO:
whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库，是基于 OpenAI 的 Whisper 模型的移植版本，旨在通过深度学习模型实现音频转文字功能。

由于 whisper.cpp 目前只支持 16 khz 的 wav 文件格式的音频文件，因此该模块默认会先使用 ffmpeg 将音频文件转成语音识别所需的格式，生成的 wav 文件以 <file name>.whisper.tmp.x-cmd.16khz.wav 的格式命名，以便用户使用通配符批量删除。

首次用户

在终端运行 eval "$(curl https://get.x-cmd.com)" 即可完成 x 命令安装, 详情参考 x-cmd 官网
x-cmd 提供 mod 教程，其中包含了 whisper 模块常用功能的 demo 示例，可以帮你快速上手 whisper 模块。
使用案例:

x whisper [OPTIONS] [SUB_COMMAND]

# 交互式选择模型，并将音频文件识别成文字 x whisper <audio file>  # 使用 medium 模型进行音频识别 x whisper -m medium -f <audio file>  # 将结果保存到 test.srt 字幕文件 x whisper dictate --srt -o test <audio file>  # 将 srt 字幕嵌入到视频中 x whisper merge <srt file> <video file>