BaoxiaoOCR

BaoxiaoOCR 是一款用于识别发票内容以及提取发票信息的小工具

本项目使用 PaddlePaddleOCR 以及 LLM 对发票图片的内容进行识别并提取出关键信息。

本项目基于 pywebview 构建。前端使用React19 + vite构建页面，并通过 WSGI 进行访问。后端使用 Javascript–Python bridge 进行通信(这相当于直接用 JS/TS 调用 python 函数，而不是通过 http 协议访问后端 api server)。

开发

webview

由于 pywebview 默认使用edgechromium作为引擎，在 windows 平台你可能需要安装Microsoft Edge WebView2作为其依赖。

配置

PaddleOCR.yaml文件为 PaddleX 管道配置，详情参见PaddleX 文档。

config.yaml文件为大模型配置，默认的配置是调用本地 ollama。你可以在 ollama 使用以下指令快速安装运行。

ollama pull qwen2.5:0.5b
ollama pull zyw0605688/gte-large-zh:latest
ollama pull qwen2.5vl:7b

# 允许任意源
set OLLAMA_ORIGINS=*

# 启动ollama服务器
ollama serve

若本地不便部署大模型，也可以选用第三方的 api 服务。

构建

本项目使用uv作为 Python 的包管理器，你可以使用如下命令快速配置 Python 依赖。

# 如果你还没有uv，可以通过pip安装他
pip install uv

# 创建虚拟环境并安装依赖
uv sync

# 开始运行
uv run python main.py

编译前端

cd front-end
pnpm install && pnpm build

编译后端

pip install uv
uv sync
uv run pyinstall main.spec
cp -r front-end/* dist/main/front-end

或者你也可以参考附带的build.bat脚本。

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
docs		docs
front-end		front-end
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
PaddleOCR.yaml		PaddleOCR.yaml
README.md		README.md
api.py		api.py
classes.py		classes.py
config.py		config.py
config.yaml		config.yaml
log.py		log.py
main.py		main.py
model.py		model.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
utils.py		utils.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

BaoxiaoOCR

开发

webview

配置

构建

编译前端

编译后端

About

Uh oh!

Releases

Packages

Languages

License

NtskwK/BxOCRui

Folders and files

Latest commit

History

Repository files navigation

BaoxiaoOCR

开发

webview

配置

构建

编译前端

编译后端

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages