AI - 网站分类 - 博客园

为什么Analytics Agent 总答错？来自 Anthropic 的数据分析最佳实践

数据分析 Agent 的核心瓶颈，不是 SQL 生成能力，而是业务上下文。不要指望 Agent 在混乱的数据体系里自动找出标准答案。你需要先把数据环境整理成 Agent 能导航、能理解、能验证的结构。 ...

复杂任务不能只靠一个上下文一路做到底。任务需要拆分，上下文需要隔离，验证需要独立，流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算，避免所有事情都挤在同一个执行路径里。这些设计放在 Claude Code 里，是 Dynamic Workflows；放到更大的 Agent 系统里，其实就... ...

本地模型为什么能跑起来？从 llama.cpp 量化说起

大模型不再只存在于云端，也开始进入普通电脑。你打开 Ollama、LM Studio，或者直接用 llama.cpp，下载一个量化版本，就有机会在本地跑起一个还不错的大模型。 ...

Antigravity Agent Skills

Antigravity Agent Skills（智能体技能）技能是一种开放标准，用于扩展智能体的能力。一个技能是一个包含 SKILL.md 文件的文件夹，其中包含智能体在处理特定任务时可以遵循的指令。什么是技能？技能是可复用的知识包，用于扩展智能体能够执行的操作。每个技能包含：如何处理特定类型任务 ...

学会这 5 个 Hermes 插件开发技巧，让 Agent 能力扩展 10 倍

Hermes Agent 插件使用教程项目需求总在变，Agent 功能却”锁死”在框架里，改源码又怕升级时被覆盖？Hermes Agent 的插件系统正是为此而生——它是模块化扩展核心能力的关键机制，无需修改框架源码，即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

深度学习进阶（二十九）现代 LLM 的核心架构设计其四：GQA

上一篇我们介绍了 KV Cache：它把每一步重复的 K、V 计算存进缓存，让自回归推理的计算量骤降。但这个加速不是没有代价的。KV Cache 的大小正比于多项参数，因此又反过来推动了注意力结构本身的改进。这便是本篇内容：分组查询注意力（Grouped-Query Attention，GQA） ...

5 分钟上手！Hermes Agent 插件开发保姆级教程，扩展能力从此开挂

Hermes Agent 插件使用教程项目需求总在变，Agent 功能却”锁死”在框架里，改源码又怕升级时被覆盖？Hermes Agent 的插件系统正是为此而生——它是模块化扩展核心能力的关键机制，无需修改框架源码，即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

Hermes Agent 核心必学：SubAgent 子代理的 5 个实战技巧，多任务处理效率翻倍

Hermes Agent SubAgent 子代理使用教程一个大型项目同时遇到代码 bug、文档错误和性能瓶颈，难道要逐一排队处理？如果能把不同任务同时交给多个 "AI 助手" 并行处理就好了。SubAgent（子代理）就是 Hermes Agent 为此提供的核心能力——通过 delegate_ ...

Antigravity 2.0智能体

Antigravity 2.0智能体 Antigravity 现已支持子智能体，不再仅限于单一的专用浏览器子智能体。子智能体现在可以是模块化的、专门化的，或由主智能体以编程方式生成的空白助手智能体。它们可以是内置角色、通用克隆体（继承与主智能体相同的提示词和环境），或在需要时动态注册（即主智能体根 ...

在 AI 的流畅回答里，守住自己的判断

AI Agent 的价值不在于替人知道未知领域的真相，而在于把未知变成可提问、可比较、可验证、可追责的结构。真正可靠的 Agent 不只需要 intelligence，更需要 epistemology 与 accountability。 ...

专访 Mainline 作者们：聊聊从代码协作到意图协作

在 AI Coding 越来越普遍之后，代码生成会变得更快，也更多。团队成员如果还只靠逐行看代码、看 diff 来理解彼此，成本会越来越高。 Mainline 的做法是让 Agent 在开发过程中自动总结 Intent（意图），并把它和 commit 关联起来。这样团队在 Review 时，可以先看... ...

深度学习进阶（二十八）现代 LLM 的核心架构设计其三：Decoder-Only 下的 KV Cache

上一篇我们介绍了 SwiGLU，通过引入门控机制让 FFN 能够根据输入动态筛选信息，取代了标准 Transformer 沿用多年的单通路结构。前两篇的内容都关于结构上的优化，本篇则关于一个核心工程优化。我们知道，即使是现在的多数大模型，其生成回答的逻辑仍然是自回归生成，即逐个字往外蹦。因此， ...

找了一个Token渠道，全球顶级模型，在vscode的配置及应用。

连接全球顶级AI大模型：GPT、Claude Opus、Claude Sonnet、Gemini、DeepSeek V4 Pro、Qwen3-Max、Kimi、K2.6、Grok、Minimax、GLM、Doubao、Mistral。为全球开发者与团队而生 ——无限制可直连、无封号风险、余额永不过... ...

Cloud Agent 开发笔记(4)：Skill 与 MCP 集成、项目后记

Cloud Agent 开发笔记(4)：Skill 与 MCP 集成、项目后记上一篇讲了 Agent 事件如何推到浏览器、数据如何持久化、多会话和中断如何处理。这一篇讲能力扩展层：Skill 系统和 MCP 集成。 V1 验证的是产品形态：由管理员角色集中创建和维护 Skill、配置 MCP 连接 ...

DeepAgents - 使用Postgres作为Checkpoint

前言在用 deepagents 做 Chatbot 的时候，有个最基本的需求：Agent 得记住上一轮聊了什么。你不能每轮对话都让用户重新自我介绍一遍。 LangGraph / DeepAgents 内置了一个叫 checkpoint 的机制来处理这个事。开发阶段用 MemorySaver 跑跑 ...

张高兴的 Hailo-10 开发指南：（二）使用 LangChain 搭建本地大模型 RAG 问答应用

目录环境配置安装 HailoRT安装 Hailo-OllamaPython 环境启动 Hailo-Ollama 服务实现 RAG 应用1. 引用相关包2. PDF 文档处理3. 文本切分4. 向量化和存储5. 自定义 HailoChatOllama 类6. RAG 链的组装LoRA 微调1. 微调2 ...

15天学会AI应用开发（五）使用AI摘要来压缩上下文消息

前面两篇文章分别介绍了根据消息数量截断历史对话和根据Token长度截断历史对话，可是这两种方式有两个共同的问题： 1、被删去的早期记录可能包含关键信息，直接截断会导致信息丢失。 2、原始的对话记录可能存在重复、冗余、拖沓的文字内容。一、为什么要对原始记录做摘要要知道，重复、冗余、拖沓的文字内容 ...

一篇标题只有5个单词的论文，改变了整个AI世界，并打开了AI大语言模型时代

从GPT-1的诞生到ChatGPT的横空出世，AI从专家的实验室走进了每个人的日常，这背后是数据、算力与算法长达七十年的厚积薄发。 ...

喜报！天谋科技工业时间序列数智化系统全项完成中国信通院基于AI大模型的时序数据管理平台产品测试

近日，在中国信通院组织开展的 2026 上半年批次“可信数据库”测试中，天谋科技（北京）有限公司（以下简称：天谋科技）的工业时间序列数智化系统完成了基于 AI 大模型的时序数据管理平台基础能力测试。经检验，该产品符合《基于 AI 大模型的时序数据管理平台技术要求》标准的全部能力要求。这标志着天谋科技 ...

15天学会AI应用开发（四）根据Token长度截断历史对话

上一篇文章说到按照消息数量来截断历史对话，这种方式有个问题，就是每次对话的内容可长可短，导致固定消息数量的对话内容忽长忽短。历史对话内容不光要存入数据库，还要作为初始提示词发给下次新会话的大模型。太长的提示词不仅冗余，还会消耗大量Token，让用户钱包快速缩水。太短的提示词容纳的信息量不足，难以 ...