数据分析 Agent 的核心瓶颈,不是 SQL 生成能力,而是业务上下文。不要指望 Agent 在混乱的数据体系里自动找出标准答案。你需要先把数据环境整理成 Agent 能导航、能理解、能验证的结构。 ...
复杂任务不能只靠一个上下文一路做到底。任务需要拆分,上下文需要隔离,验证需要独立,流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算,避免所有事情都挤在同一个执行路径里。
这些设计放在 Claude Code 里,是 Dynamic Workflows;放到更大的 Agent 系统里,其实就... ...
大模型不再只存在于云端,也开始进入普通电脑。你打开 Ollama、LM Studio,或者直接用 llama.cpp,下载一个量化版本,就有机会在本地跑起一个还不错的大模型。 ...
Antigravity Agent Skills(智能体技能)技能是一种开放标准,用于扩展智能体的能力。一个技能是一个包含 SKILL.md 文件的文件夹,其中包含智能体在处理特定任务时可以遵循的指令。什么是技能?技能是可复用的知识包,用于扩展智能体能够执行的操作。每个技能包含:如何处理特定类型任务 ...
Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...
上一篇我们介绍了 KV Cache:它把每一步重复的 K、V 计算存进缓存,让自回归推理的计算量骤降。 但这个加速不是没有代价的。KV Cache 的大小正比于多项参数,因此又反过来推动了注意力结构本身的改进。 这便是本篇内容:分组查询注意力(Grouped-Query Attention,GQA) ...
Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...
Hermes Agent SubAgent 子代理使用教程 一个大型项目同时遇到代码 bug、文档错误和性能瓶颈,难道要逐一排队处理?如果能把不同任务同时交给多个 "AI 助手" 并行处理就好了。SubAgent(子代理)就是 Hermes Agent 为此提供的核心能力——通过 delegate_ ...
Antigravity 2.0智能体 Antigravity 现已支持子智能体,不再仅限于单一的专用浏览器子智能体。 子智能体现在可以是模块化的、专门化的,或由主智能体以编程方式生成的空白助手智能体。它们可以是内置角色、通用克隆体(继承与主智能体相同的提示词和环境),或在需要时动态注册(即主智能体根 ...
AI Agent 的价值不在于替人知道未知领域的真相,而在于把未知变成可提问、可比较、可验证、可追责的结构。真正可靠的 Agent 不只需要 intelligence,更需要 epistemology 与 accountability。 ...
在 AI Coding 越来越普遍之后,代码生成会变得更快,也更多。团队成员如果还只靠逐行看代码、看 diff 来理解彼此,成本会越来越高。
Mainline 的做法是让 Agent 在开发过程中自动总结 Intent(意图),并把它和 commit 关联起来。这样团队在 Review 时,可以先看... ...
上一篇我们介绍了 SwiGLU,通过引入门控机制让 FFN 能够根据输入动态筛选信息,取代了标准 Transformer 沿用多年的单通路结构。 前两篇的内容都关于结构上的优化,本篇则关于一个核心工程优化。 我们知道,即使是现在的多数大模型,其生成回答的逻辑仍然是自回归生成,即逐个字往外蹦。 因此, ...
连接全球顶级AI大模型:GPT、Claude Opus、Claude Sonnet、Gemini、DeepSeek V4 Pro、Qwen3-Max、Kimi、K2.6、Grok、Minimax、GLM、Doubao、Mistral。
为全球开发者与团队而生 ——无限制可直连、无封号风险、余额永不过... ...
Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记 上一篇讲了 Agent 事件如何推到浏览器、数据如何持久化、多会话和中断如何处理。这一篇讲能力扩展层:Skill 系统和 MCP 集成。 V1 验证的是产品形态:由管理员角色集中创建和维护 Skill、配置 MCP 连接 ...
前言 在用 deepagents 做 Chatbot 的时候,有个最基本的需求:Agent 得记住上一轮聊了什么。你不能每轮对话都让用户重新自我介绍一遍。 LangGraph / DeepAgents 内置了一个叫 checkpoint 的机制来处理这个事。开发阶段用 MemorySaver 跑跑 ...
目录环境配置安装 HailoRT安装 Hailo-OllamaPython 环境启动 Hailo-Ollama 服务实现 RAG 应用1. 引用相关包2. PDF 文档处理3. 文本切分4. 向量化和存储5. 自定义 HailoChatOllama 类6. RAG 链的组装LoRA 微调1. 微调2 ...
前面两篇文章分别介绍了根据消息数量截断历史对话和根据Token长度截断历史对话,可是这两种方式有两个共同的问题: 1、被删去的早期记录可能包含关键信息,直接截断会导致信息丢失。 2、原始的对话记录可能存在重复、冗余、拖沓的文字内容。 一、为什么要对原始记录做摘要 要知道,重复、冗余、拖沓的文字内容 ...
从GPT-1的诞生到ChatGPT的横空出世,AI从专家的实验室走进了每个人的日常,这背后是数据、算力与算法长达七十年的厚积薄发。 ...
近日,在中国信通院组织开展的 2026 上半年批次“可信数据库”测试中,天谋科技(北京)有限公司(以下简称:天谋科技)的工业时间序列数智化系统完成了基于 AI 大模型的时序数据管理平台基础能力测试。经检验,该产品符合《基于 AI 大模型的时序数据管理平台技术要求》标准的全部能力要求。这标志着天谋科技 ...
上一篇文章说到按照消息数量来截断历史对话,这种方式有个问题,就是每次对话的内容可长可短,导致固定消息数量的对话内容忽长忽短。 历史对话内容不光要存入数据库,还要作为初始提示词发给下次新会话的大模型。太长的提示词不仅冗余,还会消耗大量Token,让用户钱包快速缩水。太短的提示词容纳的信息量不足,难以 ...