Versun

2026-02-10

Versun

这两天基本上把 Pi 的整体框架搭起来了，同时还实现了几个对我来说非常重要的功能：1. 提供商自动切换模型有时候因为网络问题或者额度用完直接罢工，现在 Pi 会在重试 3 次后自动切到下一个提供商，并通知我一声。不用手动去改配置，如图。2. 多主题并行会话… pic.twitter.com/KrbtXzv4Ho
Original

分享下 Pi 的相关机制哈，你可以发给 pi 或者 openclaw 去实现

1. 提供商切换
注意：我没有使用pi内置的模型接口，而是通过自定义扩展来接入模型接口

clip.versun.me/p/3hLbCC0B

2. 并行会话和插话功能

clip.versun.me/p/2Ax9wE4O

3./new前自动保存会话

clip.versun.me/p/Ep5p64KF

2026-02-09

感觉 Perplexity 要成为 2026 年第一个倒下的 AI 独角兽了。

之前在 PayPal 薅了一年 Pro 羊毛，结果用了几个月就吃灰。

这几天上去瞅了眼，还是那些功能，界面都没怎么动。

AI 时代这么卷，原地踏步就是在等死啊。。。

2026-02-09

挑战用AI做50个应用#2 代码剪贴板Clip

上次发了 LKS 之后，居然真的有人在用——这种"我做的轮子居然还有人用"的感觉还挺奇妙的😂 趁热打铁，第二个应用也上线了：Clip，一个极简代码分享工具。网址：https://clip.versun.me/ 动机：...

2026-02-08

并行处理应该是 AI Agent 的基础能力，这么聊天太爽了！不用等上一个任务完成，尽管发

2026-02-08

定制小龙虾 Pi 近况 #1

这两天基本上把 Pi 的整体框架搭起来了，同时还实现了几个对我来说非常重要的功能： 1. 提供商自动切换模型有时候因为网络问题或者额度用完直接罢工，现在 Pi 会在重试 3 次后自动切到下一个提供商，并通知我一声。不用手动去改配置，如图。 2. 多主题并行会话...

2026-02-07

同志们，别再折腾 OpenClaw 全家桶了，直接用它的核心 Pi，从零捏一只专属小龙虾🦞

开局稍微费点功夫，模型配置和 API 密钥那部分得手动填，别的都还好。一旦跑起来，后续所有功能开发全在聊天框里闭环完成。让 AI 自己写扩展自己的功能，这种自举的感觉确实有点不真实。

关键是轻量，要啥装啥，绝不给你硬塞臃肿模块。相比 OpenClaw 那坨黑盒，这种从 0 到 1 的全盘掌控感爽多了。

现在就一个感受：工具链还是要捏在自己手里才踏实。😎

有想折腾的同志不？人多我后续出个踩坑实录，帮你们省点摸黑时间。

2026-02-06

试了一天 GPT-5.3 Codex 和 Opus-4.6，结论：GPT-5.3 这啥玩意儿，还不如 5.2 靠谱。 Opus-4.6倒真不错，速度和 debug 能力明显提升。日常 Kimi + Opus 够用了

2026-02-06

Versun

简单分析下凌晨刚发布的 Opus 4.6 在编码方面的能力：1. Agentic terminal coding 是终端交互能力，提升明显，编写脚本、操作文件更顺畅2. Agentic coding 是核心编程能力，降低了0.1，也就是说代码能力和 Opus 4.5 基本一致3. Scaled tool use 是工具调用能力，降低了2.8，不会更积极的调用 MCP… pic.twitter.com/6XNrewGx88
Original

再简单对比下 Opus 4.6 和 GPT 5.3 Codex
我只根据官方的发布文档进行比较，由于双方的基准测试版本不同，所以没法完全对比，其中只有一个指标是同一个版本的：

1. Terminal-Bench 2.0

Opus 4.6: 65.4%
GPT 5.3: 77.3%

GPT 5.3 Codex 在终端命令行的交互上更好，效率更高

其余的编程指标：

2. SWE-Bench（代码库级工程能力）

Opus 4.6: 80.8%（Verified 版本，只测 Python）
GPT 5.3: 56.8%（Pro 版本，4 种语言，防污染更严格）

这俩不是同一个测试集。Verified 是 Anthropic 常用的 Python 专项测试；Pro 是 OpenAI 新推的多语言版本，难度和评估标准都不同。不过可以确认的是，两家在各自的测试上都刷新了 SOTA

3. OSWorld（计算机操作/Agent 能力）

Opus 4.6: 72.7%（原版 OSWorld）
GPT 5.3: 64.7%（OSWorld-Verified）

看起来 Opus 高，但 Verified 版本修复了原版很多问题，评测更严格可信。人类基线约 72%，所以 GPT 5.3 的 64.7% 实际上更可信，更接近人类水平的表现

总结

复杂问题 / Debug / 做计划 / 超长上下文 / 重构 / Python ===> Opus 4.6

OpenClaw / 个人助理 / 依赖终端交互 / 多语言编程 ===> GPT 5.3

2026-02-06

简单分析下凌晨刚发布的 Opus 4.6 在编码方面的能力：
1. Agentic terminal coding 是终端交互能力，提升明显，编写脚本、操作文件更顺畅

2. Agentic coding 是核心编程能力，降低了0.1，也就是说代码能力和 Opus 4.5 基本一致

3. Scaled tool use 是工具调用能力，降低了2.8，不会更积极的调用 MCP

4. Novel problem-solving 是算法/逻辑能力，由于上下文的巨大提升，可以解决更复杂的 bug

总结

Opus 4.6 = Opus 4.5编码能力 + Sonnet 4.5上下文能力 + GPT 5.2 codex 的Debug能力Plus

2026-02-05

分享下近段时间，我新订阅的两个很满意的服务：

第一个：InsForge(@InsForge_dev)

这是专门为 AI Agent 开发的后端 Supabase，通过 MCP 和 SKill 让各种 Agent 直接帮你部署数据库、配置后端，省去了大量的运维工作。同时还集成了模型网关（中转 OpenRouter ），一站式解决 Agent 开发的基础设施问题，非常方便，后台功能如图：

我个人更习惯在终端直接命令 Agent 操作，所以后台界面用得不多，但功能挺全的。特别适合不想在后端架构上花费太多时间的开发者。

目前产品迭代速度很快，之前反馈的几个 bug 隔天就修复了，响应很及时。价格如下图

第二个：ZenMux(@ZenMuxAI) (推广链接首充享75折)

LLM API 聚合平台，类似 OpenRouter，但它有个独特优势——订阅制。

提供 20/100/200 刀三档套餐，订阅金额一般能兑换 10 倍左右的 API 用量额度。因为我已经订阅了 Kimi 官方套餐，继续用中转站的 CLI 套餐不仅贵，额度还经常用不完。ZenMux 的 20 刀订阅就很合适：既能灵活中轻度使用各家主流模型，也能用 NanoBananaPro 这类特色模型。

用了半个月，稳定性比我之前用的中转站还要好。

价格如下图，具体的订阅套餐计费方法可以查看官网

https://insforge.dev/
https://zenmux.ai/invite/6EP3MY