一个面向 Agent 的本地 LoRA autoresearch 工具。
这个项目的目标不是提供一组零散训练脚本,而是把 LoRA 微调做成一个“用户协作启动 + Agent 自主研究闭环”的工具。
本项目为独立实现,设计思路受 karpathy/autoresearch 启发。
用户负责确认:
- 训练目标
- 基础模型
- 数据来源
- Smoke Test 结论
- 时间预算等高层偏好
Agent 负责完成:
- 环境检测与建议
- 模型/数据推荐
- baseline 与 confirm
- 单变量参数探索
- mini smoke test 风险控制
- 定量与定性评估
- best 配置沉淀
- 训练目标驱动整个流程,而不是默认套用某个任务。
- 定性评估必须和训练领域匹配。
- 搜索方向必须覆盖,或明确记录跳过原因。
min_experiments是下限,不是完成条件。- 报告不能把浅层实验包装成“完整研究完成”。
git clone https://github.com/bzjiang401/autoresearch-lora-buzhou.git
cd autoresearch-lora-buzhou
uv sync然后让 Agent 进入项目目录,先阅读:
START_HERE.mdAGENTS.md
再告诉它:
我下载了这个项目,想用它训练一个 [你的目标]
- START_HERE.md
- AGENTS.md
- QUICKSTART.md
playbook/
check_env.py:环境检测download_model.py:模型下载download_data.py:数据准备smoke_test.py:冒烟测试preflight_check.py:训练前 / 每轮 / 收尾检查finetune.py:单轮 LoRA 训练执行器generate.py:按领域做定性评估
这个仓库应保留:
- 协议文档
- 脚本
- 配置模板
- 经验规则
这个仓库不应默认携带:
- 个人测试数据
- 个人 session 配置
- checkpoints
- 本地日志
- 旧实验结果