GLM-5是什么
GLM-5是智谱开源的新一代旗舰AI模型,参数规模从GLM-4.5的355B扩展至744B(40B激活),预训练数据达28.5T tokens。模型为此前OpenRouter登顶热度榜首的神秘模型“Pony Alpha”。模型专为复杂系统工程和长程Agent任务设计,集成DeepSeek Sparse Attention降低部署成本,自研slime异步RL基础设施提升训练效率。在Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。模型支持生成Office文档、兼容Claude Code等工具,同时支持华为昇腾、摩尔线程、寒武纪等国产芯片部署。模型可在z.ai官网、BigModel.cn平台提供体验,API现已同步开放。
GLM-5的主要功能
-
复杂系统工程:模型能处理前端开发、后端架构设计等多层级技术任务,支持从需求分析到代码实现的全流程工程交付。
-
长程Agent任务:具备长期规划与资源管理能力,可在Vending Bench 2等需持续运营一年的模拟商业场景中自主决策并达成目标。
-
文档智能生成:支持将文本或原始材料直接转换为.docx、.pdf、.xlsx等格式,输出PRD、财报、教案等可直接使用的专业文档。
-
多工具协同:兼容Claude Code、OpenClaw等主流开发工具链,实现跨应用的自动化操作与协作。
GLM-5的技术原理
- 大规模预训练扩展:模型参数从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,用更多算力提升通用智能基座。
- 异步强化学习基础设施”Slime”:自研的异步RL训练框架解决大规模语言模型强化学习的效率瓶颈。该基础设施支持并行化奖励计算与策略更新,实现更细粒度的后训练迭代,有效缩小预训练能力与实际表现之间的差距。
- 稀疏注意力机制 :首次集成DeepSeek Sparse Attention,在维持长文本效果无损的同时,大幅降低Agent场景的Token消耗与部署成本。
- 国产算力深度适配:完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、平头哥、沐曦等国产芯片的底层算子优化与硬件加速,实现高吞吐、低延迟推理。
GLM-5的性能表现
- 推理能力
-
AIME 2026 I达92.7%,与DeepSeek-V3.2持平,HMMT Nov. 2025以96.9%领先多数竞品。
-
GPQA-Diamond专家级推理测试获86.0%,IMOAnswerBench达82.5%。
- 编程能力
-
SWE-bench Verified真实软件工程测试获77.8%,多语言版本73.3%,均较GLM-4.7提升约4个百分点。
-
Terminal-Bench 2.0终端操作基准达56.2%,Claude Code环境下更提升至61.1%,远超GLM-4.7。
-
CyberGym网络安全测试43.2%,较GLM-4.7的23.5%近乎翻倍,展现复杂系统攻防能力。
-
- Agent与工具使用
-
Vending Bench 2一年期商业模拟以$4,432余额排名开源模型第一,接近Claude Opus 4.5。
-
BrowseComp网页浏览任务62.0%,结合上下文管理策略可提升至75.9%,超越Kimi K2.5。
-
τ²-Bench多领域工具调用达89.7%,MCP-Atlas公共集67.8%,Tool-Decathlon 38.0%。
-
- 综合排名:Artificial Analysis 权威榜单:全球第四、开源第一。
如何使用GLM-5
- 在线体验:访问z.ai官网,手动选择GLM-5模型可免费试用Chat模式或Agent模式,后者支持多工具协同与文档生成。通过BigModel.cn平台或Z.ai API服务接入,兼容OpenAI格式接口。
- 本地部署
-
从HuggingFace下载BF16/FP8权重,使用vLLM、SGLang或xLLM框架运行,支持8卡并行推理。
-
非NVIDIA环境可通过华为昇腾、摩尔线程等国产芯片部署,官方提供针对性优化方案。
-
- 开发工具集成
-
订阅GLM Coding Plan的用户可直接启用,或通过Z Code可视化环境远程控制多Agent协作。
GLM-5的项目地址
- 项目官网:https://z.ai/blog/glm-5
- GitHub仓库:https://github.com/zai-org/GLM-5
- HuggingFace模型库:https://huggingface.co/zai-org/GLM-5
GLM-5的应用场景
-
复杂系统工程:支持端到端交付大型项目,自主完成需求拆解、架构设计、代码实现与部署全流程。
-
遗留系统重构:模型能深度理解现有代码库,执行后端架构优化与现代化改造。
-
深度调试修复:模型能分析日志、定位根因,迭代修复顽固Bug直至系统稳定运行。
-
智能体助手:模型能实现7×24小时自动执行搜索、整理、发布等定时任务,成为用户的数字实习生。
-
经营决策优化:在模拟商业场景中展现长期规划与资源管理能力,实现智能策略制定。
© 版权声明
本站文章版权归 AI工具集 所有,未经允许禁止任何形式的转载。
相关文章
暂无评论...