把学习材料转化为可溯源、可审核的 Anki 卡片。项目实现的是设计书 v3.0 的首个可运行产品内核:解析文档、全文/分卷路由、DeepSeek Pro/Flash 流水线、程序强制溯源、质量分级、人工审核与 .apkg 导出。
- 模型输出的
span_id只被视为声明;程序会使用逐字source_quote在解析文本中重新定位。 core_answer参与溯源评分;analogy被明确标注为教学辅助,不伪装成源文事实。synthesis和inference无法自动发布,必须进入深度审核。- 离线模式用于本地验证流程,最高只进入
Tier B,不能冒充真实三重模型验证。 - Prompt 要求短的可审计决策摘要,不保存或暴露模型内部推理链。
有关设计书中已核验和已修正的技术假设,见 docs/architecture-review.md。
uv sync --extra dev
uv run anki-star gui桌面窗口中可以在同一个入口完成以下步骤:
- 选择 PDF、Markdown、TXT、HTML 或 EPUB 学习材料。
- 选择
offline本地预览或deepseek真实模型生成卡片。 - 浏览来源证据并接受或拒绝候选卡片。
- 将已接受的卡片导出为
.apkg文件。
长教材会自动拆为适合知识抽取的分析块,遇到输出饱和的高密度章节会继续细化后统一审核;运行摘要会显示分析块数量与成功溯源的知识原子数量。模型成功响应会缓存在本地 artifacts/model_cache,中断后重新运行可复用已完成请求。
窗口中选择 deepseek 前,先配置 API Key;也可在启动时加载配置文件:
$env:DEEPSEEK_API_KEY="..."
Copy-Item config.example.yaml config.yaml
uv run anki-star gui --config config.yaml原命令行和 Web 审核台仍可用于自动化或远程操作:
uv run anki-star run examples/tcp_handshake.md --provider offline
uv run anki-star serve
uv run anki-star export runs/<run_id> --output tcp.apkg --deck-name "TCP Foundations"| 模块 | 能力 |
|---|---|
| 输入 | Markdown、TXT、HTML、PDF、EPUB;SHA-256;段落/页面行级 SpanID |
| 路由 | 小于输入预算时全文分析;超预算时按语义段落构造分卷 |
| 模型 | deepseek-v4-flash 扫描/验证/标准卡;deepseek-v4-pro 原子化/高价值卡 |
| 质量 | APT 门槛、答案溯源覆盖、反模式、V1/V2/V3 结果融合、Tier A-D |
| 覆盖 | 概念覆盖率与重要性加权覆盖率报告 |
| 审计 | 每次运行保存文档索引、原子、卡片、验证、拒绝/冲突和模型 token 使用量 |
| 交付 | 集成式桌面窗口与 Web 审核台;仅发布或接受卡片导出 .apkg |
runs/run_YYYYMMDD_HHMMSS/
audit.json
document.json
concept_index.json
atoms.json
cards.json
validation.json
reviews.json
audit.jsonl
uv run pytest
uv run ruff check .