MaaMCP 是一个 MCP 服务器,将 MaaFramework 的强大自动化能力通过标准化的 MCP 接口暴露给 AI 助手(如 Claude)。通过本服务器,AI 助手可以:
- 🤖 Android 自动化 - 通过 ADB 连接并控制 Android 设备/模拟器
- 🖥️ Windows 自动化 - 控制 Windows 桌面应用程序
- 🎯 后台操作 - Windows 上的截图与控制均在后台运行,不占用鼠标键盘,您可以继续使用电脑做其他事情
- 🔗 多设备协同 - 同时控制多个设备/窗口,实现跨设备自动化
- 👁️ 智能识别 - 使用 OCR 识别屏幕文字内容
- 🎯 精准操作 - 执行点击、滑动、文本输入、按键等操作
- 📸 屏幕截图 - 获取实时屏幕截图进行视觉分析
Talk is cheap, 请看: 🎞️ Bilibili 视频演示
find_adb_device_list- 扫描可用的 ADB 设备find_window_list- 扫描可用的 Windows 窗口connect_adb_device- 连接到 Android 设备connect_window- 连接到 Windows 窗口
screencap_and_ocr- 光学字符识别(高效,推荐优先使用)screencap_only- 屏幕截图,然后由大模型视觉处理(按需使用,token 开销大)
click- 点击指定坐标(支持多触点/鼠标按键选择、长按)- Windows 上支持指定鼠标按键:左键、右键、中键
double_click- 双击指定坐标swipe- 滑动手势(Android 设备滚动/翻页优先使用)input_text- 输入文本click_key- 按键操作(支持长按)- Android 上可模拟系统按键:返回键(4)、Home键(3)、菜单键(82)、音量键等
- Windows 上支持虚拟按键码:回车(13)、ESC(27)、方向键等
keyboard_shortcut- 键盘快捷键- 支持组合键:Ctrl+C、Ctrl+V、Alt+Tab 等
scroll- 鼠标滚轮(仅 Windows)
get_pipeline_protocol- 获取 Pipeline 协议文档save_pipeline- 保存 Pipeline JSON 到文件(支持新建和更新)load_pipeline- 读取已有的 Pipeline 文件run_pipeline- 运行 Pipeline 并返回执行结果open_pipeline_in_browser- 在浏览器中打开 Pipeline 可视化界面
pip install maa-mcp-
克隆仓库
git clone https://github.com/MistEO/MaaMCP.git cd MaaMCP -
安装 Python 依赖
pip install -e .
在 Cursor 等软件中,添加 MCP 服务器:
{
"mcpServers": {
"MaaMCP": {
"command": "maa-mcp"
}
}
}或
在 Cherry Studio 等软件中,添加 MCP 命令:
maa-mcp配置完成后,可以这样使用:
Android 自动化示例:
请用 MaaMCP 工具帮我连接 Android 设备,打开美团帮我点一份外卖,我想吃中餐,一人份,20 元左右的
Windows 自动化示例:
请用 MaaMCP 工具,看看我现在这页 PPT 怎么加一个旋转特效,操作给我看下
Pipeline 生成示例:
请用 MaaMCP 工具连接我的设备,帮我打开设置,进入显示设置,调整亮度到 50%。
操作完成后,帮我生成这个流程的 Pipeline JSON,以便后续可以直接运行。
MaaMCP 会自动:
- 扫描可用设备/窗口
- 建立连接
- 自动下载并加载 OCR 资源
- 执行识别和操作任务
MaaMCP 遵循简洁的操作流程,支持多设备/多窗口协同工作:
graph LR
A[扫描设备] --> B[建立连接]
B --> C[执行自动化操作]
- 扫描 - 使用
find_adb_device_list或find_window_list - 连接 - 使用
connect_adb_device或connect_window(可连接多个设备/窗口,获得多个控制器 ID) - 操作 - 通过指定不同的控制器 ID,对多个设备/窗口执行 OCR、点击、滑动等自动化操作
MaaMCP 支持让 AI 将执行过的操作转换为 MaaFramework Pipeline JSON 格式,实现一次操作,无限复用。
graph LR
A[AI 执行操作] --> B[操作完成]
B --> C[AI 阅读 Pipeline 文档]
C --> D[AI 智能生成 Pipeline]
D --> E[保存 JSON 文件]
E --> F[运行验证]
F --> G{是否成功?}
G -->|是| H[完成]
G -->|否| I[分析失败原因]
I --> J[修改 Pipeline]
J --> F
- 执行操作 - AI 正常执行 OCR、点击、滑动等自动化操作
- 获取文档 - 调用
get_pipeline_protocol获取 Pipeline 协议规范 - 智能生成 - AI 根据文档规范,将有效操作转换为 Pipeline JSON
- 保存文件 - 调用
save_pipeline保存生成的 Pipeline - 运行验证 - 调用
run_pipeline验证 Pipeline 是否正常运行 - 迭代优化 - 根据运行结果分析失败原因,修改 Pipeline 直到成功
与机械录制不同,AI 智能生成具有以下优势:
- 只保留成功路径:如果操作过程中尝试了多条路径(如先进入 A 菜单没找到,返回后又进入 B 菜单才找到),AI 会只保留最终成功的路径,去掉失败的尝试
- 理解操作意图:AI 能够理解每个操作的目的,生成语义清晰的节点名称
- 优化识别条件:根据 OCR 结果智能设置识别区域和匹配条件
- 验证与迭代:通过运行验证发现问题,自动修复并增强鲁棒性
Pipeline 生成后,AI 会自动进行验证和优化:
- 运行验证 - 执行 Pipeline 检查是否成功
- 失败分析 - 如果失败,分析具体哪个节点出错及原因
- 智能修复 - 常见优化手段:
- 增加备选识别节点(在 next 列表中添加多个候选)
- 放宽 OCR 匹配条件(使用正则表达式或部分匹配)
- 调整 roi 识别区域
- 增加等待时间(post_delay)
- 添加中间状态检测节点
- 重新验证 - 修改后再次运行,直到稳定成功
如果发现 Pipeline 逻辑本身有问题,AI 还可以重新执行自动化操作,结合新旧经验生成更完善的 Pipeline。
{
"开始任务": {
"recognition": "DirectHit",
"action": "DoNothing",
"next": ["点击设置"]
},
"点击设置": {
"recognition": "OCR",
"expected": "设置",
"action": "Click",
"next": ["进入显示"]
},
"进入显示": {
"recognition": "OCR",
"expected": "显示",
"action": "Click",
"next": ["调整亮度"]
},
"调整亮度": {
"recognition": "OCR",
"expected": "亮度",
"action": "Swipe",
"begin": [200, 500],
"end": [400, 500],
"duration": 200
}
}📌 Windows 自动化限制:
- 部分游戏或应用的反作弊机制可能会拦截后台控制操作
- 若目标应用以管理员权限运行,MaaMCP 也需要以管理员权限启动
- 不支持对最小化的窗口进行操作,请保持目标窗口在非最小化状态
- 若默认的后台截图/输入方式不可用(如截图为空、操作无响应),AI 助手可能会尝试切换到前台方式,届时会占用鼠标键盘
首次使用时,会自动下载 OCR 模型文件。但可能出现下载失败等情况,请检查数据目录:
- Windows:
C:\Users\<用户名>\AppData\Local\MaaXYZ\MaaMCP\resource\model\ocr\ - macOS:
~/Library/Application Support/MaaXYZ/MaaMCP/resource/model/ocr/ - Linux:
~/.local/share/MaaXYZ/MaaMCP/resource/model/ocr/
- 检查上述目录中是否有模型文件(
det.onnx,rec.onnx,keys.txt) - 检查
model/download.log中是否出现资源下载异常 - 手动执行
python -c "from maa_mcp.download import download_and_extract_ocr; download_and_extract_ocr()"再次尝试下载
提交问题时,请提供日志文件,日志文件路径如下:
- Windows:
C:\Users\<用户名>\AppData\Local\MaaXYZ\MaaMCP\debug\maa.log - macOS:
~/Library/Application Support/MaaXYZ/MaaMCP/debug/maa.log - Linux:
~/.local/share/MaaXYZ/MaaMCP/debug/maa.log
本项目采用 GNU AGPL v3 许可证。
- MaaFramework - 提供强大的自动化框架
- FastMCP - 简化 MCP 服务器开发
- Model Context Protocol - 定义 AI 工具集成标准