Versun
这两天基本上把 Pi 的整体框架搭起来了,同时还实现了几个对我来说非常重要的功能:1. 提供商自动切换模型有时候因为网络问题或者额度用完直接罢工,现在 Pi 会在重试 3 次后自动切到下一个提供商,并通知我一声。不用手动去改配置,如图。2. 多主题并行会话… pic.twitter.com/KrbtXzv4Ho
分享下 Pi 的相关机制哈,你可以发给 pi 或者 openclaw 去实现
1. 提供商切换
注意:我没有使用pi内置的模型接口,而是通过自定义扩展来接入模型接口
2. 并行会话和插话功能
3./new前自动保存会话
感觉 Perplexity 要成为 2026 年第一个倒下的 AI 独角兽了。
之前在 PayPal 薅了一年 Pro 羊毛,结果用了几个月就吃灰。
这几天上去瞅了眼,还是那些功能,界面都没怎么动。
AI 时代这么卷,原地踏步就是在等死啊。。。

挑战用AI做50个应用#2 代码剪贴板Clip

上次发了 LKS 之后,居然真的有人在用——这种"我做的轮子居然还有人用"的感觉还挺奇妙的😂 趁热打铁,第二个应用也上线了:Clip,一个极简代码分享工具。 网址:https://clip.versun.me/ 动机:...

并行处理应该是 AI Agent 的基础能力,这么聊天太爽了!不用等上一个任务完成,尽管发

定制小龙虾 Pi 近况 #1

这两天基本上把 Pi 的整体框架搭起来了,同时还实现了几个对我来说非常重要的功能: 1. 提供商自动切换 模型有时候因为网络问题或者额度用完直接罢工,现在 Pi 会在重试 3 次后自动切到下一个提供商,并通知我一声。不用手动去改配置,如图。 2. 多主题并行会话...

同志们,别再折腾 OpenClaw 全家桶了,直接用它的核心 Pi,从零捏一只专属小龙虾🦞

开局稍微费点功夫,模型配置和 API 密钥那部分得手动填,别的都还好。一旦跑起来,后续所有功能开发全在聊天框里闭环完成。让 AI 自己写扩展自己的功能,这种自举的感觉确实有点不真实。

关键是轻量,要啥装啥,绝不给你硬塞臃肿模块。相比 OpenClaw 那坨黑盒,这种从 0 到 1 的全盘掌控感爽多了。

现在就一个感受:工具链还是要捏在自己手里才踏实。😎

有想折腾的同志不?人多我后续出个踩坑实录,帮你们省点摸黑时间。

试了一天 GPT-5.3 Codex 和 Opus-4.6,结论:GPT-5.3 这啥玩意儿,还不如 5.2 靠谱。 Opus-4.6倒真不错,速度和 debug 能力明显提升。 日常 Kimi + Opus 够用了
Versun
简单分析下凌晨刚发布的 Opus 4.6 在编码方面的能力:1. Agentic terminal coding 是终端交互能力,提升明显,编写脚本、操作文件更顺畅2. Agentic coding 是核心编程能力,降低了0.1,也就是说代码能力和 Opus 4.5 基本一致3. Scaled tool use 是工具调用能力,降低了2.8,不会更积极的调用 MCP… pic.twitter.com/6XNrewGx88

再简单对比下 Opus 4.6 和 GPT 5.3 Codex
我只根据官方的发布文档进行比较,由于双方的基准测试版本不同,所以没法完全对比,其中只有一个指标是同一个版本的:

1. Terminal-Bench 2.0

  • Opus 4.6: 65.4%
  • GPT 5.3: 77.3%

GPT 5.3 Codex 在终端命令行的交互上更好,效率更高

其余的编程指标:

 

2. SWE-Bench(代码库级工程能力)

  • Opus 4.6: 80.8%(Verified 版本,只测 Python)
  • GPT 5.3: 56.8%(Pro 版本,4 种语言,防污染更严格)
这俩不是同一个测试集。Verified 是 Anthropic 常用的 Python 专项测试;Pro 是 OpenAI 新推的多语言版本,难度和评估标准都不同。不过可以确认的是,两家在各自的测试上都刷新了 SOTA

 

3. OSWorld(计算机操作/Agent 能力)

  • Opus 4.6: 72.7%(原版 OSWorld)
  • GPT 5.3: 64.7%(OSWorld-Verified)
看起来 Opus 高,但 Verified 版本修复了原版很多问题,评测更严格可信。人类基线约 72%,所以 GPT 5.3 的 64.7% 实际上更可信,更接近人类水平的表现
 

总结

复杂问题 / Debug / 做计划 / 超长上下文 / 重构 / Python ===> Opus 4.6

OpenClaw / 个人助理 / 依赖终端交互 / 多语言编程 ===> GPT 5.3

简单分析下凌晨刚发布的 Opus 4.6 在编码方面的能力:
1. Agentic terminal coding 是终端交互能力,提升明显,编写脚本、操作文件更顺畅

2. Agentic coding 是核心编程能力,降低了0.1,也就是说代码能力和 Opus 4.5 基本一致

3. Scaled tool use 是工具调用能力,降低了2.8,不会更积极的调用 MCP

4. Novel problem-solving 是算法/逻辑能力,由于上下文的巨大提升,可以解决更复杂的 bug

总结

Opus 4.6 = Opus 4.5编码能力 + Sonnet 4.5上下文能力 + GPT 5.2 codex 的Debug能力Plus

分享下近段时间,我新订阅的两个很满意的服务:

第一个:InsForge(@InsForge_dev)

这是专门为 AI Agent 开发的后端 Supabase,通过 MCP 和 SKill 让各种 Agent 直接帮你部署数据库、配置后端,省去了大量的运维工作。同时还集成了模型网关(中转 OpenRouter ),一站式解决 Agent 开发的基础设施问题,非常方便,后台功能如图:

我个人更习惯在终端直接命令 Agent 操作,所以后台界面用得不多,但功能挺全的。特别适合不想在后端架构上花费太多时间的开发者。
目前产品迭代速度很快,之前反馈的几个 bug 隔天就修复了,响应很及时。价格如下图

第二个:ZenMux(@ZenMuxAI) (推广链接首充享75折)

LLM API 聚合平台,类似 OpenRouter,但它有个独特优势——订阅制。

提供 20/100/200 刀三档套餐,订阅金额一般能兑换 10 倍左右的 API 用量额度。因为我已经订阅了 Kimi 官方套餐,继续用中转站的 CLI 套餐不仅贵,额度还经常用不完。ZenMux 的 20 刀订阅就很合适:既能灵活中轻度使用各家主流模型,也能用 NanoBananaPro 这类特色模型。
用了半个月,稳定性比我之前用的中转站还要好。
价格如下图,具体的订阅套餐计费方法可以查看官网

https://insforge.dev/
https://zenmux.ai/invite/6EP3MY