MiniMax-M3

MiniMax-M3

MiniMax全新一代万亿参数全模态旗舰大模型
2026-06-01
语言大模型
Model capability: audioModel capability: imageModel capability: videoModel capability: thinkingModel capability: function_call
输入:
$0.6/1M tokens
输出:
$2.4/1M tokens
大额采购联系客户经理享专属优惠

API介绍

MiniMax-M3 是全新一代万亿参数 MoE(混合专家架构)全模态旗舰大模型。模型在复杂工具调用、海量长文本以及高并发生产落地等指标上实现跨越式升级。作为原生全模态的集大成者,M3 不仅在多语言文本、长程逻辑推理上媲美全球顶尖前沿模型,更在原生多模态流式交互(语音、视频、文本端到端融合)领域展现出卓越性能,专为下一代超拟真智能体和企业级核心业务而生。

───────────────────────────────────────────────────────────────────

核心能力


大海捞针级百万上下文: 默认支持高达 100 万 token 的超长上下文窗口,在行业公认的 Needle In A Haystack(大海捞针)测试中保持 100% 的无损信息召回率。能轻松吃下整本技术大部头、数万行企业级跨文件代码库、或长达数小时的会议录音转译,并进行精准的逻辑提炼与漏洞审计。

原生全模态端到端交互: 采用真正意义上的全模态(Omni)融合架构,并非传统“文本+语音插件”的拼接。支持文本、超高拟真语音(含情感、呼吸声、方言隐喻控制)、视觉图像的端到端流式输入输出。在实时语音对练、音视频双向交互及多模态内容生产场景中提供毫秒级的极低延迟。

万量级工具操纵与复杂规划: 针对大模型“幻觉”及复杂任务断层的痛点,M3 深度强化了工具调用和长期任务规划能力。支持在单次 workflow 中精准编排并调用成百上千个企业级私有 API,完美胜任高复杂度的自动化财务审计、多平台跨境供应链协同等深度生产任务。

极致并发的企业级落地: 得益于高度优化的 MoE 动态路由算法与自研的高性能推理算子,M3 在保证旗舰级输出质量的同时,首字延迟(TTFT)相比前代降低 40%,整体吞吐量大幅提升。完美支持超高并发的高频业务线接入,以极高的输出稳定性与极致性价比为企业生产就绪护航。

───────────────────────────────────────────────────────────────────

相关测评

MiniMax M3 实测:首个集齐 Frontier 三件套的开源模型,能否成为平替天花板


Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(Minimax)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

MiniMax-M3

≤512K
1000000

输入$0.6 / 1M tokens
输出$2.4 / 1M tokens

输入$0.6/ 1M tokens
输出$2.4/ 1M tokens
原价

MiniMax-M3

512K-1M
1000000

输入$1.2 / 1M tokens
输出$4.8 / 1M tokens

输入$1.2/ 1M tokens
输出$4.8/ 1M tokens
原价