自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 Agent Harness 概念详解

摘要: Agent Harness 是为解决大模型在长线任务中的上下文限制问题而设计的外骨骼系统。随着模型上下文窗口扩展至1M,仍面临失焦和记忆衰退问题。文章提出从"提示词工程"转向"上下文工程",通过压缩技术、结构化笔记和子代理架构优化token效用。Agent Harness包含初始化Agent和执行Agent,前者搭建任务基础环境,后者采用增量式Ralph Wiggum循环确保目标达成。该系统可支持Agent在复杂场景下24/7持续工作,避免一次性过度承诺或过早

2026-03-29 17:36:30 425

原创 Claude Code 核心团队血泪复盘:后悔使用/构建 Agent 时没早点刷到

AI工程师构建Agent的常见误区与优化策略 摘要:AI工程师在构建智能Agent时容易陷入过度设计、工具滥用等误区,导致Agent性能下降。本文总结了三个关键优化原则:1)采用渐进式信息披露,让Agent自主探索而非被动接受信息;2)工具设计应顺应模型直觉,通过实验迭代保持时效性;3)面向缓存命中率优化系统设计,避免破坏对话上下文。文章还介绍了Skills机制作为Agent的行为规范,通过预设工具调用模式提升稳定性。这些经验来自Claude团队实践,揭示了构建高效Agent需要突破传统编程思维,更注重认知

2026-03-29 17:16:49 439

原创 从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解

阶段二标志着我们从“数据数字化”迈向了“数据智能化”。通过 PaddleOCR 布局检测,我们把文档切分成了语义块;通过 LayoutLM,我们重建了人类的阅读逻辑;通过 VLM 工具链,我们让 Agent 拥有了“看懂”图表的能力。

2026-01-29 21:01:42 1192

原创 Skills 元年,一人公司的时代要来了:速通 Anthropic 通识课

然而,每一位开发者可能都经历过这样的痛苦:为不同的项目重复编写相似的提示词(Prompt),在有限的 Context Window(上下文窗口)中艰难地平衡工具定义与业务规则,或者看着自己精心调试的 Agent 无法迁移到新的运行环境。知识就是产品:Skills Marketplace 的出现是必然,Skill 不受模型迭代和运行环境的干扰,它是可交易的标准化的商品/产品,由标配 Skills 的智能体提供规模化服务,这将是一个巨大的商业蓝海。它们提供的是能力,比如能“终端运行代码”、“批量修改文件”。

2026-01-29 15:04:16 518

原创 机器学习基础(二):注意力机制——Attention in Transformers

原始 Transformer 结构采用 Encoder-Decoder,Encoder 负责上下文建模,Decoder 通过自回归生成输出,二者通过 Cross-Attention 相连。文章重点拆解 Self-Attention 的 Q、K、V 机制:用点积计算相关性并经缩放与 Softmax 得到权重,再对 V 加权求和得到上下文化表示;解释了为何需要独立的 Q/K/V 投影以打破对称、解耦语义并做信息过滤。

2025-11-23 12:52:00 1360

原创 LLM基础(五):微调与强化学习——后训练

本文介绍LLM“后训练”技术,用于实现模型对齐。核心包括:1) 依赖标准答案的“监督微调”(SFT);2) 依赖奖励函数的“强化微调”(RFT)。文章强调了成功的关键是“评估驱动”的迭代闭环(评估-分析-靶向-微调),并证明数据质量远胜于数量。最后简要介绍了生产环境中的监控、告警与干预。

2025-11-06 23:53:37 1457 1

原创 写长寿代码之设计模式:控制反转(IoC)到底反了谁的控制?

我们常说的设计哲学听起来玄之又玄,但核心目标其实很现实:让代码生命周期更长、易于修改、能承受规模扩展和需求变化。有些编程设计模式起名字特别直白,字面就能看出意图;但是,控制反转这个名字就显得没那么通俗直白了,实际上,这里的“控制”指的是对象创建、依赖注入、生命周期、调度策略等本应全由开发者显式控制的行为。

2025-07-27 21:24:18 752

原创 Go Context 深入浅出:根本哲学、源码解读与代码实践

本文探讨了上下文(Context)包的设计思路与实现。Context可用于跨进程信息透传和任务级联取消,确保资源及时回收。Done()用于状态查询、Cause()/Err()用于取消原因识别、Value()用于键值存储、Deadline()用于超时控制。通过Go代码示例展示了级联任务取消的实现,当父任务取消时,所有子任务会同步终止并输出取消原因。

2025-07-09 23:25:54 974 2

原创 Mac一直加载硬盘加载不出来

磁盘修复检查进程fsck导致硬盘不显示。

2024-12-05 02:34:49 3177

原创 【理论背后的直觉】MAB多臂老虎机与UCB算法

在强化学习中,多臂赌博机问题(Stochastic Bandits)是经典的探索与利用(Exploration vs. Exploitation)权衡问题。本文将介绍多臂赌博机的基本概念,探讨$\varepsilon$-贪婪策略和上置信界算法(UCB)的理论与实践表现,并总结其核心要点。

2024-10-11 00:00:15 2280 1

原创 【学习笔记】3Blue1Brown 线性代数导引

线性代数的精华-3Blue1Brown

2024-01-16 15:06:23 1755 3

原创 【论文汇报】满足差分隐私性质的跨平台在线匹配

BIT: Privacy-preserving cooperative online matching over spatial crowdsourcing platforms

2024-01-09 15:54:50 1127 1

原创 【声纹基础】TDNN怎么用的一维卷积?

时延神经网络常用于声纹识别领域,它可以视作一维卷积神经网络(1-d CNNs)。二维卷积我们并不陌生,可是,一维卷积到底如何理解?它和二维卷积又有什么联系?不妨通过实验,一探究竟。

2023-01-03 11:58:50 2618 1

原创 Project Euler in Java [001-040]

无脑而暴力·打怪且升级

2021-11-15 16:55:33 2023 1

原创 LOOP——循环结构

循环,令人头大。

2020-11-12 17:56:00 9595 5

原创 SWITCH——选择结构

①case后面的“常量表达式”相当于入口,break则相当于出口;②我们可以将将9.9近似看作9,那么需要列举的情况将被进一步简化。

2020-10-21 22:13:03 481 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除