GLM-5 – 智谱开源的新一代旗舰AI模型，媲美 Opus 4.5

0 3

GLM-5是什么

GLM-5是智谱开源的新一代旗舰AI模型，参数规模从GLM-4.5的355B扩展至744B（40B激活），预训练数据达28.5T tokens。模型为此前OpenRouter登顶热度榜首的神秘模型“Pony Alpha”。模型专为复杂系统工程和长程Agent任务设计，集成DeepSeek Sparse Attention降低部署成本，自研slime异步RL基础设施提升训练效率。在Artificial Analysis 榜单中，GLM-5 位居全球第四、开源第一。模型支持生成Office文档、兼容Claude Code等工具，同时支持华为昇腾、摩尔线程、寒武纪等国产芯片部署。模型可在z.ai官网、BigModel.cn平台提供体验，API现已同步开放。

GLM-5的主要功能

复杂系统工程：模型能处理前端开发、后端架构设计等多层级技术任务，支持从需求分析到代码实现的全流程工程交付。
长程Agent任务：具备长期规划与资源管理能力，可在Vending Bench 2等需持续运营一年的模拟商业场景中自主决策并达成目标。
文档智能生成：支持将文本或原始材料直接转换为.docx、.pdf、.xlsx等格式，输出PRD、财报、教案等可直接使用的专业文档。
多工具协同：兼容Claude Code、OpenClaw等主流开发工具链，实现跨应用的自动化操作与协作。

GLM-5的技术原理

大规模预训练扩展：模型参数从355B（激活32B）扩展至744B（激活40B），预训练数据从23T提升至28.5T，用更多算力提升通用智能基座。
异步强化学习基础设施”Slime”：自研的异步RL训练框架解决大规模语言模型强化学习的效率瓶颈。该基础设施支持并行化奖励计算与策略更新，实现更细粒度的后训练迭代，有效缩小预训练能力与实际表现之间的差距。
稀疏注意力机制 ：首次集成DeepSeek Sparse Attention，在维持长文本效果无损的同时，大幅降低Agent场景的Token消耗与部署成本。
国产算力深度适配：完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、平头哥、沐曦等国产芯片的底层算子优化与硬件加速，实现高吞吐、低延迟推理。

GLM-5的性能表现

推理能力
- Humanity’s Last Exam得分30.5%，接近Kimi K2.5的31.5%，显著优于GLM-4.7。
- AIME 2026 I达92.7%，与DeepSeek-V3.2持平，HMMT Nov. 2025以96.9%领先多数竞品。
- GPQA-Diamond专家级推理测试获86.0%，IMOAnswerBench达82.5%。
编程能力
- SWE-bench Verified真实软件工程测试获77.8%，多语言版本73.3%，均较GLM-4.7提升约4个百分点。
- Terminal-Bench 2.0终端操作基准达56.2%，Claude Code环境下更提升至61.1%，远超GLM-4.7。
- CyberGym网络安全测试43.2%，较GLM-4.7的23.5%近乎翻倍，展现复杂系统攻防能力。
Agent与工具使用
- Vending Bench 2一年期商业模拟以$4,432余额排名开源模型第一，接近Claude Opus 4.5。
- BrowseComp网页浏览任务62.0%，结合上下文管理策略可提升至75.9%，超越Kimi K2.5。
- τ²-Bench多领域工具调用达89.7%，MCP-Atlas公共集67.8%，Tool-Decathlon 38.0%。

综合排名：Artificial Analysis 权威榜单：全球第四、开源第一。

如何使用GLM-5

在线体验：访问z.ai官网，手动选择GLM-5模型可免费试用Chat模式或Agent模式，后者支持多工具协同与文档生成。通过BigModel.cn平台或Z.ai API服务接入，兼容OpenAI格式接口。
本地部署
- 从HuggingFace下载BF16/FP8权重，使用vLLM、SGLang或xLLM框架运行，支持8卡并行推理。
- 非NVIDIA环境可通过华为昇腾、摩尔线程等国产芯片部署，官方提供针对性优化方案。
开发工具集成
- 在Claude Code、OpenCode、Kilo Code、Roo Code等工具中配置模型名称为”GLM-5″即可调用。
- 订阅GLM Coding Plan的用户可直接启用，或通过Z Code可视化环境远程控制多Agent协作。