Agent 工具使用笔记——skills
skills 用来给 agent 增加可复用能力。AGENTS.md 放常驻项目事实,skill 放按需执行的专业知识、流程、脚本和模板。 我理解一个 skill 至少要回答三个问题: 什么情况下使用它? 使用时按什么步骤做? 需要读取哪些额外参考材料、脚本或模板? Agent Skills 的核心思想是 progressive disclosure:启动时只暴露 name 和 description;任务命中后再读完整 SKILL.md;更长的参考资料、脚本和模板等到真的需要时再加载。 适合做成 skill Hexo 新文章流程 LaTeX 编译和排错流程 发布前检查流程 code review checklist changelog 生成 数据处理报告流程 不适合做成 skill 项目简介 构建命令 禁止修改目录 API key 一次性提示词 基本结构一个 skill 是一个目录,最少包含 SKILL.md: 1SKILL.md 推荐目录结构: 12345678<skill-name>/ SKILL.md references/ example...
Agent 工具使用笔记——AGENTS.md
AGENTS.md 是给 coding agent 看的项目说明文件,可以理解成 “README for agents”。它要解决的问题很朴素:这个仓库是什么、哪些命令可用、哪些地方能改、改完怎么验证。 它不适合写成教程,也不适合塞一堆个人偏好。越是常驻上下文,越应该短、准、稳定。 AGENTS.md 本质上就是普通 Markdown,没有固定 schema,也没有必填字段。标题叫什么不重要,关键是让 agent 少猜。 推荐结构123456789101112131415161718192021222324252627282930313233# AGENTS.md## Project overviewThis is a Hexo blog source repository using the Butterfly theme.## Setup commands- Build: `npm run build`- Preview: `npm run server`## Structure- Posts: `source/_posts/`- Theme config: `_config...
Agent 工具使用笔记——Codex
Codex CLI 是 OpenAI 官方的本地终端 coding agent。它可以在选定目录中读代码、改文件、跑命令。Codex app、IDE extension、CLI、Web/Cloud 是不同入口,这篇只记我主要用的 CLI。 安装和启动官方推荐的 standalone 安装方式是: 1curl -fsSL https://chatgpt.com/codex/install.sh | sh 启动: 1codex 第一次运行会提示登录,可以用 ChatGPT 账号,也可以用 API key。不同 ChatGPT 计划里的 Codex 权益以官方 pricing 页面为准。 Windows 可以直接在 PowerShell 里跑;需要 Linux 原生环境时再用 WSL2。 常用命令123456codexcodex --versioncodex logincodex exec "summarize this repository"codex exec --cd . "run the relevant tests"cod...
Agent 工具使用笔记——Claude Code
Claude Code 是 Anthropic 官方的终端型 coding agent。它在本地项目目录里运行,可以读代码、改文件、执行命令,也能通过 CLAUDE.md、settings、slash commands、MCP、hooks 这些机制适配项目工作流。 这里先只记官方 Claude Code 的基本用法。第三方 Anthropic-compatible API 的接入放到 API 那篇里。 安装和启动官方快速开始要求 Node.js 18 或更新版本,登录用 Claude.ai 账号或 Anthropic Console 账号。 123npm install -g @anthropic-ai/claude-codecd your-projectclaude 第一次运行 claude 按提示登录即可。我一般在 Git 仓库根目录启动,省得上下文和可写范围混乱。 常用命令123456claudeclaude --versionclaude config listclaude config get <key>claude config set <key&...
Agent 工具使用笔记——API 接入
这篇记一下大模型 API 接入。目标不复杂:知道一次请求由哪些东西组成,然后能把 DeepSeek、OpenRouter 这类服务填到各种 AI 软件、编辑器插件、agent 工具或自己的脚本里。 主要参考 DeepSeek 和 OpenRouter 官方文档。示例只保留最小字段,高级参数先不展开。 调用原理最小调用一般绕不开这几项: 1234API format: OpenAI-compatible / Anthropic-compatible / ...Base URL: https://api.example.comAPI key: sk-...Model: provider/model-name 真正发 HTTP 请求时,还会多出这些东西: 123Endpoint: /chat/completionsHeaders: Authorization + Content-TypeBody: model + messages 最常见的是 OpenAI-compatible Chat Completions 格式: 123POST <base_url>/chat/c...
Agent 工具使用笔记——选择偏好
记录一下自己现在使用 AI agent 工具时的判断。这里说的 agent 主要是能读写项目文件、调用终端、使用 MCP / skills / rules 的那类工具,不是普通聊天机器人。 工具形态现在常见形态大概有这么几种: 编辑器插件:比如 GitHub Copilot。侵入小,但上限受插件形态限制。 AI 集成编辑器:比如 Cursor。体验做得完整,但要迁移编辑器和配置体系。 CLI agent:比如 Claude Code、Codex CLI。更贴近真实开发环境,也方便和现有编辑器配合。 GUI / App agent:比如 Codex app。上手简单,但能不能融入本地工作流要看产品设计。 我现在还是更偏向 CLI。主要原因是已经重度使用 VSCode,不想为了 AI 功能迁移整个编辑器;而 CLI 本来就适合配合 Git、终端、项目脚本和现有编辑器。 模型选择在可选范围内,我倾向于直接用最好的大模型。贵一点可以接受,差模型带来的返工和误改更麻烦。 写代码类 agent 会放大模型差距。普通聊天里看着还行的模型,进真实仓库以后经常会出...
LLM 学习笔记——AI agent 工具调研
这份笔记偏向 AI 工具、Agent、项目约束与实际使用问题,尽量把“工具怎么用”单独整理出来,不和模型价格、套餐、网站信息混在一起,主要回答几个问题:“有哪些 AI 工具、Agent 是怎么工作的、项目里如何给 agent 加约束和扩展”。 这篇笔记的内容具有明显的时效性,当前原始信息时间是 2026 年 3 月,我并没有精力去持续更新。 一、AI 工具的主要类型目前常见的大模型工具大致包括: Web 对话(Web Chat) IDE 插件(Plugin-Based) AI 原生 IDE CLI 桌面版应用 典型代表包括: Web:ChatGPT、Google Gemini IDE 插件:GitHub Copilot、Cline、通义灵码 Lingma AI 原生 IDE:Cursor、Windsurf、Google Antigravity、Trae / Trae CN、AWS Kiro,通义灵码也有 IDE 产品 CLI:Claude Code、Codex、Gemini CLI、OpenCode(可视作 Claude Code 的开源替代之一) 桌面应用:...
LLM 学习笔记——大模型调研
这份笔记偏向大模型本身的分类、选型、价格与常用信息来源,尽量把“模型怎么选、钱怎么算、去哪里查”单独整理出来,主要回答几个问题:“该选什么模型、成本大概怎样、去哪里查资料”。 这篇笔记的内容具有明显的时效性,当前原始信息时间是 2026 年 3 月,我并没有精力去持续更新。 主要基于 OpenRouter 排行榜,表中的数据只是作为大致参考,不保证准确性,同一个表格中的顺序也没有意义,个人觉得差不多都属于同一梯队或者同一类型。 一、大模型的基本分类大模型可以按照是否开源进行分类: 第一类,闭源模型,只能通过自家提供的产品或 API 访问。 第二类,开放权重模型(open-weights model),公开模型权重以及主要架构信息,但训练过程和训练源码并没有公开。 第三类,完全开源模型,其他用户可以尝试复现。 目前能力最强的大模型大多属于闭源模型,其完整架构和训练细节通常不会公开。市场上较为主流的开源模型多属于开放权重模型,例如 DeepSeek、Qwen 等,公开模型权重并允许第三方部署,但训练数据和训练过程通常不会完全公开。完全开源、可以复现训练过程的大模型主要来自...
microgpt.py 源码学习
microgpt.py 是 Andrej Karpathy (@karpathy) 写的一个教学项目,约 260 行纯 Python(不依赖 PyTorch,甚至不依赖 numpy)实现完整的 GPT 训练和推理。 我对原始代码进行了一些微调——封装了 AdamOptimizer、补了类型标注、给 Value 加了 _op 字段和 print_value_tree() 方便观察计算图。 下面是学习整理的源码级逐段拆解。 准备:自动求导实现由于不依赖 PyTorch 和 Numpy,首先需要一个 Value 类来实现自动求导,为后续的训练和推理提供基础。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263import mathclass Value: __slots__ = ("data", "grad", "_children", &...
LLM 代码练习——使用大模型绘图
从 K-Dense-AI/scientific-agent-skills 的科技论文绘图 skill 中抄来的绘图提示词。 调用源码 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717...