auto-caption

Auto Caption 是一个跨平台的实时字幕显示软件。

| 简体中文 | English |

📥 下载

GitHub Releases

📚 用户手册

Auto Caption 用户手册

字幕引擎说明文档

基本使用

目前仅提供了 Windows 平台的可安装版本。如果使用默认的 Gummy 字幕引擎，需要获取阿里云百炼平台的 API KEY 并配置到环境变量中才能正常使用该模型。相关教程：获取 API KEY、将 API Key 配置到环境变量。

对于开发者，可以自己开发新的字幕引擎，自定义字幕引擎的开发请参考字幕引擎说明文档。

✨ 特性

丰富的字幕样式设置
灵活的字幕引擎选择
多语言识别与翻译
字幕记录展示与导出
生成音频输出和麦克风输入的字幕

说明：Windows 平台支持生成音频输出和麦克风输入的字幕，Linux 平台仅支持生成麦克风输入的字幕。

🚀 项目运行

安装依赖

npm install

构建字幕引擎

背景介绍

如果你是开发者，想开发自定义字幕引擎，请查看字幕引擎说明文档。

所谓的字幕引擎实际上是一个子程序，它会实时获取系统音频输入（录音）或输出（播放声音）的流式数据，并调用音频转文字的模型生成对应音频的字幕。生成的字幕通过 IPC 输出为转换为字符串的 JSON 数据，并返回给主程序。主程序读取字幕数据，处理后显示在窗口上。

目前项目默认使用阿里云 Gummy 模型，需要获取阿里云百炼平台的 API KEY 并配置到环境变量中才能正常使用该模型。

本项目的 gummy 字幕引擎是一个 python 子程序，通过 pyinstaller 打包为可执行文件。运行字幕引擎子程序的代码在 src\main\utils\engine.ts 文件中。

首先进入 python-subprocess 文件夹，执行如下指令创建虚拟环境：

python -m venv subenv

然后激活虚拟环境：

# Windows
subenv/Scripts/activate
# Linux
source subenv/bin/activate

然后安装依赖（注意如果是 Linux 环境，需要注释调 requirements.txt 中的 PyAudioWPatch，该模块仅适用于 Windows 环境）：

pip install -r requirements.txt

然后使用 pyinstaller 构建项目：

pyinstaller --onefile main-gummy.py

此时项目构建完成，在进入 python-subprocess/dist 文件夹可见对应的可执行文件。即可进行后续操作。

运行项目

npm run dev

构建项目

注意目前软件没有适配 macOS 平台，请使用 Windows 或 Linux 系统进行构建，更建议使用实现了完整功能的 Windows 平台。

# For windows
npm run build:win
# For macOS
npm run build:mac
# For Linux
npm run build:linux

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.vscode		.vscode
assets		assets
python-prototype		python-prototype
python-subprocess		python-subprocess
resources		resources
src		src
.editorconfig		.editorconfig
.gitignore		.gitignore
.npmrc		.npmrc
.prettierignore		.prettierignore
.prettierrc.yaml		.prettierrc.yaml
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
electron-builder.yml		electron-builder.yml
electron.vite.config.ts		electron.vite.config.ts
eslint.config.mjs		eslint.config.mjs
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
tsconfig.web.json		tsconfig.web.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

auto-caption

📥 下载

📚 用户手册

基本使用

✨ 特性

🚀 项目运行

安装依赖

构建字幕引擎

背景介绍

运行项目

构建项目

About

Uh oh!

Releases

Packages

Languages

License

SpiritMark/auto-caption

Folders and files

Latest commit

History

Repository files navigation

auto-caption

📥 下载

📚 用户手册

基本使用

✨ 特性

🚀 项目运行

安装依赖

构建字幕引擎

背景介绍

运行项目

构建项目

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages