Fenglielie

Created2026-04-02|agent|Agent

skills 用来给 agent 增加可复用能力。AGENTS.md 放常驻项目事实，skill 放按需执行的专业知识、流程、脚本和模板。我理解一个 skill 至少要回答三个问题：什么情况下使用它？使用时按什么步骤做？需要读取哪些额外参考材料、脚本或模板？ Agent Skills 的核心思想是 progressive disclosure：启动时只暴露 name 和 description；任务命中后再读完整 SKILL.md；更长的参考资料、脚本和模板等到真的需要时再加载。适合做成 skill Hexo 新文章流程 LaTeX 编译和排错流程发布前检查流程 code review checklist changelog 生成数据处理报告流程不适合做成 skill 项目简介构建命令禁止修改目录 API key 一次性提示词基本结构一个 skill 是一个目录，最少包含 SKILL.md： 1SKILL.md 推荐目录结构： 12345678<skill-name>/ SKILL.md references/ example...

Agent 工具使用笔记——AGENTS.md

Created2026-04-02|agent|Agent

AGENTS.md 是给 coding agent 看的项目说明文件，可以理解成 “README for agents”。它要解决的问题很朴素：这个仓库是什么、哪些命令可用、哪些地方能改、改完怎么验证。它不适合写成教程，也不适合塞一堆个人偏好。越是常驻上下文，越应该短、准、稳定。 AGENTS.md 本质上就是普通 Markdown，没有固定 schema，也没有必填字段。标题叫什么不重要，关键是让 agent 少猜。推荐结构123456789101112131415161718192021222324252627282930313233# AGENTS.md## Project overviewThis is a Hexo blog source repository using the Butterfly theme.## Setup commands- Build: `npm run build`- Preview: `npm run server`## Structure- Posts: `source/_posts/`- Theme config: `_config...

Agent 工具使用笔记——Codex

Created2026-04-02|agent|Agent•Codex

Codex CLI 是 OpenAI 官方的本地终端 coding agent。它可以在选定目录中读代码、改文件、跑命令。Codex app、IDE extension、CLI、Web/Cloud 是不同入口，这篇只记我主要用的 CLI。安装和启动官方推荐的 standalone 安装方式是： 1curl -fsSL https://chatgpt.com/codex/install.sh | sh 启动： 1codex 第一次运行会提示登录，可以用 ChatGPT 账号，也可以用 API key。不同 ChatGPT 计划里的 Codex 权益以官方 pricing 页面为准。 Windows 可以直接在 PowerShell 里跑；需要 Linux 原生环境时再用 WSL2。常用命令123456codexcodex --versioncodex logincodex exec "summarize this repository"codex exec --cd . "run the relevant tests"cod...

Agent 工具使用笔记——Claude Code

Created2026-04-02|agent|Agent•Claude Code

Claude Code 是 Anthropic 官方的终端型 coding agent。它在本地项目目录里运行，可以读代码、改文件、执行命令，也能通过 CLAUDE.md、settings、slash commands、MCP、hooks 这些机制适配项目工作流。这里先只记官方 Claude Code 的基本用法。第三方 Anthropic-compatible API 的接入放到 API 那篇里。安装和启动官方快速开始要求 Node.js 18 或更新版本，登录用 Claude.ai 账号或 Anthropic Console 账号。 123npm install -g @anthropic-ai/claude-codecd your-projectclaude 第一次运行 claude 按提示登录即可。我一般在 Git 仓库根目录启动，省得上下文和可写范围混乱。常用命令123456claudeclaude --versionclaude config listclaude config get <key>claude config set <key&...

Agent 工具使用笔记——API 接入

Created2026-04-02|agent|Agent

这篇记一下大模型 API 接入。目标不复杂：知道一次请求由哪些东西组成，然后能把 DeepSeek、OpenRouter 这类服务填到各种 AI 软件、编辑器插件、agent 工具或自己的脚本里。主要参考 DeepSeek 和 OpenRouter 官方文档。示例只保留最小字段，高级参数先不展开。调用原理最小调用一般绕不开这几项： 1234API format: OpenAI-compatible / Anthropic-compatible / ...Base URL: https://api.example.comAPI key: sk-...Model: provider/model-name 真正发 HTTP 请求时，还会多出这些东西： 123Endpoint: /chat/completionsHeaders: Authorization + Content-TypeBody: model + messages 最常见的是 OpenAI-compatible Chat Completions 格式： 123POST <base_url>/chat/c...

Agent 工具使用笔记——选择偏好

Created2026-04-02|agent|Agent

记录一下自己现在使用 AI agent 工具时的判断。这里说的 agent 主要是能读写项目文件、调用终端、使用 MCP / skills / rules 的那类工具，不是普通聊天机器人。工具形态现在常见形态大概有这么几种：编辑器插件：比如 GitHub Copilot。侵入小，但上限受插件形态限制。 AI 集成编辑器：比如 Cursor。体验做得完整，但要迁移编辑器和配置体系。 CLI agent：比如 Claude Code、Codex CLI。更贴近真实开发环境，也方便和现有编辑器配合。 GUI / App agent：比如 Codex app。上手简单，但能不能融入本地工作流要看产品设计。我现在还是更偏向 CLI。主要原因是已经重度使用 VSCode，不想为了 AI 功能迁移整个编辑器；而 CLI 本来就适合配合 Git、终端、项目脚本和现有编辑器。模型选择在可选范围内，我倾向于直接用最好的大模型。贵一点可以接受，差模型带来的返工和误改更麻烦。写代码类 agent 会放大模型差距。普通聊天里看着还行的模型，进真实仓库以后经常会出...

LLM 学习笔记——AI agent 工具调研

Created2026-03-02|llm|LLM

这份笔记偏向 AI 工具、Agent、项目约束与实际使用问题，尽量把“工具怎么用”单独整理出来，不和模型价格、套餐、网站信息混在一起，主要回答几个问题：“有哪些 AI 工具、Agent 是怎么工作的、项目里如何给 agent 加约束和扩展”。这篇笔记的内容具有明显的时效性，当前原始信息时间是 2026 年 3 月，我并没有精力去持续更新。一、AI 工具的主要类型目前常见的大模型工具大致包括： Web 对话（Web Chat） IDE 插件（Plugin-Based） AI 原生 IDE CLI 桌面版应用典型代表包括： Web：ChatGPT、Google Gemini IDE 插件：GitHub Copilot、Cline、通义灵码 Lingma AI 原生 IDE：Cursor、Windsurf、Google Antigravity、Trae / Trae CN、AWS Kiro，通义灵码也有 IDE 产品 CLI：Claude Code、Codex、Gemini CLI、OpenCode（可视作 Claude Code 的开源替代之一）桌面应用：...

LLM 学习笔记——大模型调研

Created2026-03-02|llm|LLM

这份笔记偏向大模型本身的分类、选型、价格与常用信息来源，尽量把“模型怎么选、钱怎么算、去哪里查”单独整理出来，主要回答几个问题：“该选什么模型、成本大概怎样、去哪里查资料”。这篇笔记的内容具有明显的时效性，当前原始信息时间是 2026 年 3 月，我并没有精力去持续更新。主要基于 OpenRouter 排行榜，表中的数据只是作为大致参考，不保证准确性，同一个表格中的顺序也没有意义，个人觉得差不多都属于同一梯队或者同一类型。一、大模型的基本分类大模型可以按照是否开源进行分类：第一类，闭源模型，只能通过自家提供的产品或 API 访问。第二类，开放权重模型（open-weights model），公开模型权重以及主要架构信息，但训练过程和训练源码并没有公开。第三类，完全开源模型，其他用户可以尝试复现。目前能力最强的大模型大多属于闭源模型，其完整架构和训练细节通常不会公开。市场上较为主流的开源模型多属于开放权重模型，例如 DeepSeek、Qwen 等，公开模型权重并允许第三方部署，但训练数据和训练过程通常不会完全公开。完全开源、可以复现训练过程的大模型主要来自...

microgpt.py 源码学习

Created2026-03-01|code|Python•LLM

microgpt.py 是 Andrej Karpathy (@karpathy) 写的一个教学项目，约 260 行纯 Python（不依赖 PyTorch，甚至不依赖 numpy）实现完整的 GPT 训练和推理。我对原始代码进行了一些微调——封装了 AdamOptimizer、补了类型标注、给 Value 加了 _op 字段和 print_value_tree() 方便观察计算图。下面是学习整理的源码级逐段拆解。准备：自动求导实现由于不依赖 PyTorch 和 Numpy，首先需要一个 Value 类来实现自动求导，为后续的训练和推理提供基础。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263import mathclass Value: __slots__ = ("data", "grad", "_children", &...

LLM 代码练习——使用大模型绘图

Created2026-02-17|code|Python•LLM

从 K-Dense-AI/scientific-agent-skills 的科技论文绘图 skill 中抄来的绘图提示词。调用源码 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717...