最近在 X 上看到一个大佬开发的 DeepSeek-GUI(Kun),界面吸引了我,下载尝试后发现它最让我上瘾的功能不是代码补全,而是一个看起来不太起眼的东西——需求→计划→Todo 的链路。
聊代码的工具太多了,但能把「我突然有个想法」到「拆成可执行步骤」这条链路做顺的,说实话没几个。多数工具是你想好了再让它干活,DeepSeek-GUI 往前迈了一步:它可以帮你把还没想清楚的事,先想清楚。
下载地址:deepseek-gui.com/#downloads
从想法到计划,一条路走到底
在 Code 模式里点「新建需求」,会帮你新建一个需求草稿的 md 文件,包含标题、背景、目标、验收标准。当光标停在文档上时,AI 会自动帮你构思规划大概的内容,你只需要按下 Tab 键即可,在它的基础上进行二次修改。
提交需求后,需求 AI 会跳出来帮你澄清模糊点:你是要前端生成还是后端渲染?模板里的表格要不要支持跨页?中文要不要单独处理字体?这步很关键——很多时候我们以为自己想清楚了,实际一问才发现到处是窟窿。
输出完,一键构建。/plan 会先产出一个可编辑的计划文件,右侧面板同步列出 Todo 列表,每个 Todo 可以标记状态、绑定工具调用,当前任务结束后自动推进。
然后用 /goal 给整个会话设一个长期目标,Agent 就会持续围绕这件事推进,不会聊着聊着忘了在干嘛。中途可以暂停、继续、清除,什么时候想回来接着做都行。
这一套下来,它不像一个聊天工具,更像一个挺克制的小型项目管理器。不重、不乱,就把「想法 → 需求 → 计划 → 执行 → 追踪」五件事钉在一起了。
代码审查和旁支对话
还有个实用但容易被忽略的细节:/review。改完代码,不用切到 GitHub 去看 diff,在 DeepSeek-GUI 里直接 /review,它会把当前工作区的未提交改动扫一遍,生成 findings 卡片。也可以指定 base branch、某个 commit,甚至自定义审查范围。
配合内联 diff 视图和变更审查面板,改了什么、新增了什么、哪里可能有风险,一眼就能看到。更重要的是,你对每个改动可以直接确认或回退——不是事后审查,是边改边审。
另一个常用功能是 /btw。比如你在做一个大功能,中间突然需要验证一个边缘 case 能不能跑通,正常流程是开新会话 → 描述上下文 → 验证 → 切回来,来来回回断思路。/btw 就是直接从当前会话继承上下文,开一个旁支对话。验证完关掉,回到主线程继续干活。
这两个功能结合起来,DeepSeek-GUI 在认真做一件事:把会话当成资产来管理,而不是用完就扔的聊天记录。它甚至支持会话压缩、分叉、归档和恢复——你可以把一段长会话压缩成摘要存档,以后需要复盘或者继续,随时恢复。
写作模式才是最大的惊喜
写代码是预期内的事,写作模式的深度超出了预期。现在大多数的 Agent 都是面向代码编程,很少有 Agent 工具把写作模式单拎出来。
它不是「把 ChatGPT 的聊天框搬到 Markdown 编辑器里」。它做了几件很工程师思维的事:
FIM 短补全:直接在编辑器里出补全文本,跟 IDE 的补全差不多。不走 Kun serve,直接调 DeepSeek FIM Completion API,延迟很低,debounce 设得短,不会打字打到一半被卡住。
灵感长补全:停笔时间长一点的时候触发,token 预算更大,只在行尾或段落边界工作。但它做了一件我没想到的事:补全之前会对你写作空间里的所有 Markdown 文件建一个短 TTL 轻量索引,用 BM25 + 关键词匹配召回相关的跨文本片段,作为隐藏 Markdown comment 注入到 prompt 里。
什么意思呢?你在写稿子的时候,它会先去你的写作空间里翻之前写过的文章,找到相关的段落,然后帮你保持术语、事实和风格上的一致性。这个对长期写作的人来说太重要了——不用每次补全都从零开始,而是有记忆的补全。
Live 编辑模式:当前行保留 Markdown 源码,其余行实时渲染。不用在源码和预览之间来回切。选中一段文字,唤出 inline agent,原地改写,不用切窗口。
对比一下 ChatGPT 网页版的写作体验:写一段、复制、粘贴到 ChatGPT、等回复、复制回来、再贴回去。写作模式把这个流程砍掉了。还支持把当前文档导出为 HTML、PDF、DOC 或 DOCX,标题、列表、代码块、表格和本地图片都会尽可能保留。
Kun 到底省了多少 token
它的设计逻辑很简单:能不动的东西别动。系统提示词和工具定义这类不变内容,会话一开始就锁死,后续每次请求复用,让 DeepSeek 的原生前缀缓存更容易命中。
MCP 工具多了也不慌——它不是每次请求都把所有工具定义塞进 prompt,而是先用 mcp_search 找相关工具,再描述和调用,这个叫「渐进工具发现」,本质上就是把工具目录从「一次全塞」变成「用到才拿」。
界面底部会实时显示 token 消耗和缓存命中率,长会话跑个几十分钟,你就能直观看到 cache hit 把成本砍了多少。
还有一个细节是做「上下文卫生」:超长的工具结果、base64 payload、重复的工具调用循环,都会被压缩或抑制,保留代码路径、错误、决策和未解决事项,不是简单截断,是有策略地清理。
支持飞书、微信一键接入
除了写代码、写文章外,很多人应该更关心能不能手机远程控制。支持飞书、Lark、微信一键接入,绑好之后手机发消息就能让电脑后台执行任务,加上定时任务,可以做到一些很实用的自动化。
谁该装,谁可以等等
- 如果你已经在用终端 Agent,而且用得很顺,DeepSeek-GUI 不会替代它,但它补上了终端不太擅长的几件事:结构化写作、可视化需求管理、代码 diff 审查、会话资产管理。可以两者并存,各干各的。
- 如果你是 DeepSeek 的重度用户,但一直嫌终端门槛高,这个工具几乎没什么上手成本。下个安装包,填个 API Key,选个目录,就能开始,MCP 和 Skill 都可以在图形界面里配,不用手写 json。
- 如果你有写作需求,不只是写代码,写作模式是真的强烈推荐。不只是一个聊天的附赠功能,是花了不少心思做的一个独立工作台。
- 如果你想把 Agent 接入日常通讯,飞书、Lark、微信都支持。绑好之后手机发消息就能让电脑后台执行任务。
苏米注:DeepSeek-GUI 上线两周,3000 多 star,发了十几个版本,更新节奏很快。给我的感觉是作者很清楚自己要做什么:不是再造一个聊天壳,而是让 DeepSeek 变成一个能稳定参与真实项目工作的桌面伙伴。从「写完就扔」的聊天工具,到「能持续管理上下文」的工作台——这一步迈得不错。
提醒:DeepSeek API 是付费的,Kun 虽然做了大量 token 优化,但长时间、长会话的任务还是会花钱。用之前心里要有数。