Skip to content

xhioer/EzYOLO

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

EzYOLO

EzYOLO 是一个面向本地部署的 YOLO 训练、标注、推理和工业视觉检测工具。项目包含 PyQt6 桌面端、FastAPI 后端、Vue3 工具箱前端,并集成海康相机取流、目标检测、OCR 识别和缺失检测流程,适合在产线或离线环境中完成从数据采集到模型验证的闭环。

功能特性

  • 本地 YOLO 数据集管理、图像导入、视频抽帧、手动标注和自动标注。
  • 支持训练、测试、结果可视化、权重导出和项目式管理。
  • 支持海康工业相机/网络相机取流,包含实时预览、抓拍和 OCR 识别流程。
  • 提供工具箱缺失检测 Web 页面,后端负责检测、OCR、规则评估和运行结果输出。
  • 前端使用 Vue3 + Vite,后端使用 FastAPI,桌面端使用 PyQt6。

目录结构

.
├── backend/              # FastAPI 后端与检测工作流
├── config/               # SAM、LLM、工具箱工作流配置
├── core/                 # 自动标注、模型管理、导入管理等核心逻辑
├── frontend/legacy/      # Web 工具箱旧版静态页面
├── gui/                  # PyQt6 桌面端页面与组件
├── models/               # 本地数据库模型
├── toolbox-frontend/     # Vue3 + Vite 工具箱前端
├── utils/                # 通用工具
├── main.py               # 桌面端入口
├── backend/app/main.py   # Web 后端入口
└── requirements.txt      # Python 依赖

环境要求

  • Python 3.8 或更高版本
  • Windows 环境推荐,用于海康 MVS SDK、PyQt6 桌面端和相机相关能力
  • Node.js 18 或更高版本,用于工具箱前端开发
  • 如需 GPU 训练,请按设备环境安装匹配 CUDA 的 PyTorch

安装依赖

pip install -r requirements.txt

如果需要 GPU 版本 PyTorch,请参考 PyTorch 官网选择对应 CUDA 版本后单独安装。若使用新版 YOLO 能力,建议升级 Ultralytics:

pip install --upgrade ultralytics

启动桌面端

python main.py

也可以在 Windows 下运行:

.\start_desktop.ps1

启动 Web 工具箱

启动后端:

python backend/app/main.py --host 127.0.0.1 --port 8000

打开页面:

http://127.0.0.1:8000

前端开发模式:

cd toolbox-frontend
npm install
npm run dev

构建前端并交由后端托管:

cd toolbox-frontend
npm install
npm run build

构建产物位于 toolbox-frontend/dist。后端会优先托管该目录;如果不存在,则回退到 frontend/legacy/index.html

海康相机 OCR 示例

使用 RTSP 地址进行实时 OCR:

python hikvision_ocr.py --ip 192.168.1.64 --username admin --password your_password --channel-id 101 --lang ch

也可以直接传入完整 RTSP 地址:

python hikvision_ocr.py --rtsp-url "rtsp://user:pass@ip:554/Streaming/Channels/101"

常用参数:

  • --channel-id 101 通常为主码流,102 通常为子码流。
  • --roi x,y,w,h 可限制识别区域,提高速度和稳定性。
  • q 退出预览窗口。

配置说明

  • config/toolbox_workflow.json:工具箱缺失检测、OCR、模型路径和运行目录配置。
  • config/sam_config.json:SAM 辅助标注相关配置。
  • config/llm_config.json:多模态大模型辅助标注配置。

运行过程中产生的数据、权重、截图、日志和缓存默认不提交到 Git,可根据实际部署环境自行管理。

许可证

本项目使用 MIT License,详见 LICENSE

About

本地 YOLO 标注训练、海康相机 OCR 与工具箱缺失检测平台

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors