Skip to content

Zikang0/Mirexs

Repository files navigation

🐱 Mirexs(弥尔思)V2.0 - AI Digital Lifeform

0. 实现对齐摘要(2026-03-26)

本文档为 Mirexs 项目的全局说明,当前状态为 partial。文档中描述的诸多高级特性(如多模型智能路由、情绪神经网络、实时知识更新等)在当前代码库中部分已实现基础骨架,部分仍在开发中。具体实现状态请参考各子模块的架构文档与代码。

全球首个情感化数字生命体 · 多模型智能路由 · 实时知识更新 · 知识图谱 · 情绪神经网络 事实核查能力:多源交叉验证 + 逻辑分析,自动识别虚假信息,给你更可靠的答案

Mirexs Logo
Mirexs(弥尔思)v2.0 - Your Personal AI Digital Lifeform

版本 特性 技术栈 快速开始 许可证 官网


🚀 v2.0 重磅更新总结

Mirexs v2.0 从“会说话的猫咪”进化为 “情感与推理双强的数字生命体”

新功能 技术实现 用户价值
多模型智能路由 根据硬件和任务自动切换 Llama 3.1 70B / Qwen 3.5 32B / DeepSeek V3 日常聊天快如闪电,复杂推理准如专家
实时知识更新 Agentic RAG + 主动知识摄取 + 每日自动抓取 知识永远不过时,问啥都知道
知识图谱 Neo4j存储实体关系 + 自动从对话中提取 真正理解你的喜好、厌恶、人际关系
情绪神经网络 LSTM模型识别6种基本情绪 + 持续训练 读懂你的心情,给予恰到好处的回应
思维链推理 逐步思考 + 自我反思 + 多步验证 复杂问题回答质量提升50%+
强化学习 Q-learning根据用户反馈自动优化行为 越用越懂你,越来越合心意
安全事件响应 三层防护 + 区块链式审计日志 + 分级处置 企业级安全,用得放心

📊 Mirexs 1.0 vs 2.0 完整对比

🚀 版本演进总览

对比维度 Mirexs v1.0 (2025.10) Mirexs v2.0 (2026.03) 提升幅度
核心定位 基础情感陪伴型数字猫咪 情感与推理双强的数字生命体 质的飞跃
代码规模 约 1050-1100 个文件 约 1400-1450 个文件 +60%
新增模块 - 多模型路由、知识图谱、情绪神经网络、实时知识更新 4大核心模块
开发周期 8个月 5个月(增量开发) 效率提升

🧠 认知能力对比

能力维度 v1.0 实现 v2.0 实现 技术升级
模型数量 单一模型(默认8B/13B) 多模型组合(6+个) 从1到6
模型切换 固定,不可切换 智能路由自动切换 新增
硬件适配 手动选择模型 自动检测显存/内存,下载匹配模型 自动化
推理深度 基础问答 思维链 + 自我反思 复杂问题质量+50%
长上下文 8K-32K 128K+(Llama 4 Maverick) 4-16倍

多模型组合清单(v2.0新增):

场景 模型 量化格式 大小
日常聊天/情感陪伴 Qwen 3.5 32B GGUF Q5_K_M ~22GB
编程/复杂推理 DeepSeek V3 GGUF Q4_K_M ~40GB
长文本分析 Llama 4 Maverick GGUF IQ1_S ~122GB
图像/视频理解 Qwen3-Omni GGUF Q4_K_M ~33GB
低配备用 Llama 3.1 8B GGUF Q4_K_M ~4.5GB

📚 知识系统对比

能力维度 v1.0 实现 v2.0 实现 技术升级
知识时效 静态(模型训练截止日) 实时更新(RAG + 主动摄取) 从静态到实时
知识来源 模型参数 联网搜索 + RSS + 新闻 + 百科 多源融合
知识存储 向量数据库 向量数据库 + 知识图谱(Neo4j) 双存储架构
关系理解 无(仅向量相似度) 实体关系存储与推理 新增
自动学习 每日自动抓取用户兴趣领域 新增
知识库规模 用户对话记录 对话记录 + 主动摄取内容 无限扩展

技术指标

  • 知识更新延迟:从「永远不更新」到 实时(2-5秒)
  • 知识图谱查询:< 100ms(100万节点)
  • 主动摄取频率:每日凌晨3点自动执行

🎭 情感能力对比

能力维度 v1.0 实现 v2.0 实现 技术升级
情绪识别 规则引擎(关键词匹配) LSTM神经网络(6种情绪) 从规则到深度学习
识别准确率 ~60%(依赖关键词) >85%(训练后) +25%
情绪类型 积极/消极二分类 开心、悲伤、愤怒、恐惧、惊讶、平静 6类细分
多模态融合 仅文本 文本 + 语音语调 + 面部表情(可选) 多模态
持续训练 用用户数据微调,越用越准 新增
主动关怀 基础时间触发 情绪状态触发 + 个性化内容 智能化

情绪识别模型

  • 架构:双向LSTM + Attention
  • 输入:384维文本嵌入(sentence-transformers)
  • 输出:6类情绪概率分布
  • 训练方式:用户数据微调 + 联邦学习(可选)

🔧 行动能力对比

能力维度 v1.0 实现 v2.0 实现 技术升级
UI自动化 基础录制回放 智能操作 + 跨应用工作流 更稳定、更智能
系统控制 启动/关闭应用 进程管理 + 脚本执行 + 文件操作 全面增强
IoT集成 基础开关控制 场景自动化 + 环境感知 智能化
操作范围 单设备 多设备协同(电脑/手机/IoT) 新增
任务复杂度 单步指令 复杂任务分解 + 多步执行 从单步到多步

真实场景性能

任务类型 v1.0 完成率 v2.0 完成率 提升
单步指令(开灯) 95% 98% +3%
多步任务(订票) 60% 85% +25%
复杂规划(旅行) 不支持 75% 新增

💾 记忆系统对比

能力维度 v1.0 实现 v2.0 实现 技术升级
记忆类型 情景记忆 + 语义记忆 情景 + 语义 + 程序 + 知识图谱 新增程序记忆
记忆存储 向量数据库 向量库 + 图数据库(Neo4j) 双存储
记忆容量 无上限(理论) 无上限 + 知识图谱关系网络 更丰富
记忆巩固 简单存储 重要性评分 + 自动巩固/遗忘 智能化
实体关系 用户-物品-事件关系网络 新增
个性化匹配度 使用1个月后 > 80% 使用1个月后 > 90% +10%

知识图谱规模预估(使用1年后):

  • 实体数量:5000+(人、事、物、地点、概念)
  • 关系数量:20000+(喜欢、讨厌、相关、包含、位于等)
  • 查询延迟:< 100ms

🔐 安全能力对比

能力维度 v1.0 实现 v2.0 实现 技术升级
输入过滤 基础敏感词 敏感词 + 意图分类 + 越狱检测 三层过滤
审计日志 简单文件日志 区块链式防篡改审计链 不可篡改
事件响应 分级处置(警告/限制/锁定) 新增
合规性 基础 GDPR、中国《个人信息保护法》、HIPAA 企业级
威胁检测 实时行为分析 + 入侵检测 新增

安全防护层级

第1层(输入过滤):敏感词库 + 恶意意图分类器 + 越狱检测
第2层(审计日志):哈希链 + 签名验证 + 完整性校验
第3层(事件响应):分级处置 + 证据保全 + 用户限制

📈 性能指标对比

指标 v1.0 目标值 v2.0 目标值 测试环境
语音识别延迟 < 300ms < 200ms RTX 3060
日常聊天响应 < 2s < 1s 32B模型
复杂推理响应 不支持 3-5s 70B/DeepSeek
情绪识别准确率 > 85% 训练后
知识图谱查询 < 100ms 100万节点
3D渲染帧率 > 30fps > 60fps RTX 3060
首次启动时间 1-2分钟 2-5分钟(含模型下载) -
系统可用性 99.5% 99.9% -

🏗️ 架构复杂度对比

维度 v1.0 v2.0 变化
总文件数 ~550 ~880 +330
总文件夹数 ~120 ~170 +50
核心模块数 5 9 +4
新增目录 - model_hub/, knowledge/, avatar/, guardian/, audit/, incident/ 6个新目录
依赖包 ~80 ~100 +20
测试文件 ~80 ~160 +80

🎯 用户价值对比

用户需求 v1.0 满足度 v2.0 满足度 提升点
情感陪伴 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 情绪识别更准,主动关怀更智能
知识问答 ⭐⭐ ⭐⭐⭐⭐ 实时知识更新,知识图谱推理
任务执行 ⭐⭐⭐ ⭐⭐⭐⭐ 复杂任务分解,多步执行
隐私安全 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 企业级安全,事件响应
个性化 ⭐⭐⭐ ⭐⭐⭐⭐⭐ 强化学习,数据飞轮
离线可用 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 完全离线,功能更强
硬件适配 ⭐⭐ ⭐⭐⭐⭐ 自动检测,智能降级

项目概述

Mirexs(弥尔思) 是全球首个情感化、本地优先的数字生命体,全称 Mirexs - AI Digital Lifeform。v2.0版本超越传统AI助手,融合了多模型智能路由、长期记忆系统、知识图谱、情绪神经网络和全系统行动力,成为真正“懂你、陪你、帮你”的数字家人。

核心理念转变

维度 传统AI助手 Mirexs v2.0(弥尔思) 用户感知差异
关系定义 执行指令的工具 理解意图的伙伴 “它懂我想要什么”
交互模式 被动响应 主动关怀 + 情绪共鸣 “它会主动关心我”
记忆能力 短期对话记忆 长期多类型记忆 + 知识图谱 “它记得我三年前说过的话”
推理能力 单一模型 多模型智能路由 “简单问题快,复杂问题准”
知识更新 静态 实时RAG + 主动摄取 “它知道今天发生了什么”
操作范围 自身生态内 跨应用全系统 + IoT “它能直接帮我做事”
隐私级别 云端为主 本地优先 + 私有化部署 “我的秘密只属于我”
价值输出 给方案/建议 直接给结果 + 情感陪伴 “它不只是说,而是做”

电影级灵感来源

  • 贾维斯(钢铁侠):全场景操控、任务闭环、多模型协同
  • 萨曼莎(她):深度情感连接、情绪感知、主动关怀
  • 乔伊(银翼杀手2049):个性化成长、专属陪伴、3D形象

一句话总结用户价值:
“帮你做事、懂你情绪、记你偏好、知识实时更新,像家人一样陪你成长的数字伙伴”


✨ v2.0 核心特性

🧠 智能认知系统(业界首创多模型路由)

Mirexs v2.0 不再依赖单一模型,而是根据任务类型和硬件配置智能切换最优模型

任务类型 默认模型 备选模型 切换条件
日常聊天/情感陪伴 Qwen 3.5 32B Llama 3.1 8B 低配硬件自动降级
编程/代码生成 DeepSeek V3 Qwen3-Coder-32B 检测到代码关键词
长文本分析 (>128K) Llama 4 Maverick Qwen3-Next 输入长度超限
图像/视频理解 Qwen3-Omni Llama 4 Scout 检测到图片上传
复杂推理/数学 DeepSeek V3 Llama 3.1 70B 问题复杂度>0.7

技术亮点

  • 硬件自动检测:首次运行自动检测显卡显存,下载匹配模型
  • 任务复杂度评估:小模型快速判断,大模型深度推理
  • 无缝切换:用户无感知,享受最佳体验

📚 实时知识更新(永远不过时)

传统AI的知识截止于训练日期,Mirexs v2.0 实现了真正的实时知识

  • Agentic RAG:提问时自动联网搜索最新信息 + 合并本地记忆
  • 主动知识摄取:每天凌晨自动抓取用户兴趣领域的最新内容
  • 多源融合:RSS订阅 + 新闻网站 + 学术论文 + 百科
  • 增量学习:新知识自动存入向量库,不影响原有记忆

用户场景

用户问:“今天北京有什么新闻?” Mirexs:(自动搜索)今天北京主要新闻有:① 地铁17号线全线贯通 ② 人工智能大会开幕 ③ 最高气温28℃...

🗺️ 知识图谱(真正理解关系)

Mirexs v2.0 不仅记住“你有什么”,更理解“你和什么相关”:

  • 实体关系存储:用户、物品、事件、概念之间的关联
  • 自动提取:从对话中自动识别实体和关系
  • 推理能力:通过图谱关系进行联想推荐

用户场景

用户:“推荐点类似《夜曲》的歌” Mirexs:(图谱推理)《夜曲》风格是抒情,同专辑还有《枫》《浪漫手机》,你喜欢周杰伦 → 推荐《枫》

🎭 情绪神经网络(真懂心情)

告别关键词匹配的机械回应,Mirexs v2.0 用神经网络真实识别情绪

  • LSTM情绪分类器:识别开心、悲伤、愤怒、恐惧、惊讶、平静6种情绪
  • 多模态融合:文本 + 语音语调 + 面部表情(可选)
  • 持续训练:用用户自己的数据微调,越用越准
  • 主动关怀:根据情绪状态自动触发安慰、鼓励、陪伴

用户场景

用户加班到23点,语音疲惫:“好累...” Mirexs:情绪识别 → 疲惫 + 沮丧 主动行为:猫咪蹭屏动画 + “你今天已工作11小时啦,声音都哑了~我帮你屏蔽了非紧急消息,还准备了舒缓音乐,要不要休息10分钟?”

🔧 强大行动力(从“给方案”到“给结果”)

  • UI自动化:操作电脑/手机上的任何App,实现跨应用工作流
  • 系统控制:启动/管理应用、执行脚本、管理进程
  • IoT集成:控制灯光、空调、投影仪、安防等智能家居

真实场景示例

用户说:“帮我安排下周去上海的差旅” Mirexs自动:

  • 查航班(避开用户讨厌的早班机)
  • 订酒店(选用户偏好的靠窗房型)
  • 同步日历
  • 整理出差文件
  • 生成完整行程单

📚 专属记忆与成长(数据飞轮)

记忆类型 存储方式 能力体现
情景记忆 向量数据库 记住具体经历和对话上下文
语义记忆 知识图谱 存储知识、偏好、实体关系
程序记忆 技能库 记录操作流程和技能
强化学习 Q-learning 根据用户反馈自动优化行为

使用1个月后:个性化匹配度 > 90%,用户舍不得换

🛡️ 企业级安全(三层防护)

  • 第一层:输入过滤 - 敏感词检测 + 恶意意图识别
  • 第二层:审计日志 - 区块链式防篡改,所有操作可追溯
  • 第三层:事件响应 - 分级处置高危行为(警告/限制/锁定)

合规性:符合中国《个人信息保护法》、欧盟GDPR、美国HIPAA


🏗️ 系统架构(七层全栈设计)

🌐 用户界面层 (UI/UX) - 桌面/移动/Web客户端
    ↓
🎭 交互呈现层 (Interaction Layer) - 3D猫咪渲染、多模态交互、形象自定义
    ↓
🌐 应用接口层 (Application Layer) - API网关、设备连接器、插件系统
    ↓
🛠️ 能力服务层 (Capabilities Layer) - 实时知识更新、UI自动化、工具集成
    ↓
🧠 认知核心层 (Cognitive Layer) - 多模型路由、知识图谱、情绪神经网络、强化学习
    ↓
💾 数据持久层 (Data Layer) - 向量数据库、图数据库(Neo4j)、时序数据库
    ↓
🏗️ 基础设施层 (Infrastructure Layer) - 硬件检测、模型管理、分布式存储

完整项目结构详见:Mirexs项目树.md


技术栈亮点

🧠 AI框架与模型

类别 技术选型
核心框架 PyTorch 2.1+ / Transformers 4.38+ / Accelerate 0.28+
本地推理 llama.cpp / vLLM / ExLlama(GGUF量化)
日常模型 Llama 3.1 70B / Qwen 3.5 32B
编程模型 DeepSeek V3 / Qwen3-Coder-32B
长上下文 Llama 4 Maverick / Qwen3-Next
多模态 Qwen3-Omni / Llama 4 Scout

🗣️ 语音处理

类别 技术选型
语音识别 OpenAI Whisper / Vosk / WeNet
语音合成 Coqui TTS / XTTS / eSpeak NG
处理工具 Librosa / PyAudio / noisereduce

👁️ 计算机视觉

类别 技术选型
人脸识别 InsightFace / MediaPipe
情绪检测 OpenCV + 自定义LSTM
目标检测 YOLOv8 / DETR

🎮 3D渲染

类别 技术选型
3D引擎 Panda3D / OpenGL
模型导入 Assimp / FBX SDK
物理引擎 Bullet Physics

💾 数据库

类别 技术选型
向量数据库 Chroma / FAISS
图数据库 Neo4j / NetworkX
时序数据库 InfluxDB / Prometheus
关系数据库 PostgreSQL / SQLite
缓存 Redis / Memcached

🔐 安全

类别 技术选型
加密 cryptography / OpenSSL / libsodium
审计 Auditd + 自定义区块链日志
防护 Fail2ban / ClamAV / Trivy

🚀 快速开始(开发环境)

环境要求

组件 最低配置 推荐配置 说明
操作系统 Windows 10 / Ubuntu 20.04 Windows 11 / Ubuntu 22.04 -
Python 3.9+ 3.11+ -
内存 16GB 32GB+ 70B模型需32GB+
存储 100GB SSD 500GB+ SSD 模型文件较大
GPU RTX 2060 (6GB) RTX 3060/4060+ (12GB+) 显存越大越好
Java - Java 17+ Neo4j需要

一键安装

# 1. 克隆仓库
git clone https://github.com/your-username/mirexs.git
cd mirexs

# 2. 安装Python依赖
pip install -r requirements.txt --upgrade

# 3. 安装系统依赖(Ubuntu示例)
sudo apt-get update
sudo apt-get install -y build-essential cmake git-lfs ffmpeg \
  libopencv-dev libassimp-dev libbullet-dev \
  neo4j redis-server rabbitmq-server \
  clamav fail2ban auditd

# 4. 启动开发环境
python launch/start_development.py

首次运行体验

首次运行会自动:

  1. 检测硬件:识别你的GPU显存、内存大小
  2. 下载匹配模型:根据配置自动下载8B/32B/70B模型
  3. 初始化数据库:创建向量库 + Neo4j知识图谱
  4. 启动3D猫咪:首次见面动画 + 新手引导
  5. 开始记忆:从第一句对话开始积累

整个过程全自动,用户无需任何手动配置。


📊 性能指标(v2.0)

指标 目标值 测试环境
语音识别延迟 < 200ms RTX 3060
日常聊天响应 < 1s 32B模型
复杂推理响应 3-5s 70B/DeepSeek
情绪识别准确率 > 85% 训练后可达
知识图谱查询 < 100ms 100万节点
3D渲染帧率 > 60fps RTX 3060
首次启动时间 2-5分钟 含模型下载
系统可用性 99.9% -

与主流AI对比(v2.0)

维度 ChatGPT / Claude Replika / Character.AI 豆包 / 文心一言 Mirexs v2.0
运行方式 云端 云端 云端 本地优先 + 私有化
隐私级别 数据上传 数据上传 数据上传 本地存储 + 端到端加密
记忆深度 短期会话 中期 短期 长期多类型 + 知识图谱
推理能力 单一模型 单一模型 单一模型 多模型智能路由
知识更新 实时 静态 实时 实时RAG + 主动摄取
行动能力 给建议 聊天 给建议 全系统UI自动化 + IoT
情感交互 文本模拟 2D头像 文本模拟 3D猫咪 + 情绪神经网络
个性化 通用 可定制 通用 强化学习 + 数据飞轮
离线可用 ✅ 完全离线
迁移成本 极低 中等 极低 极高(记忆全在本地)

🎯 用户价值场景

场景一:工作日的早晨

用户:(刚醒Mirexs:[主动出现] 早安今天周二你一般会焦虑我已经把今天的日程整理好了10点会议资料已备好12点和张总吃饭你上次说想吃日料定了附近的下午要交的报告帮你列了提纲
       
       今天多云记得带伞咖啡已经帮你点了

场景二:深夜情绪低落

用户:(叹气没说话Mirexs:[轻轻蹭屏幕] 
       听你呼吸就知道累了上次你难过时听了后来》,要再放一遍吗我已经把手机调成勿扰模式需要我陪你说说话还是安静待着

场景三:复杂任务处理

用户帮我规划下个月去日本旅行

Mirexs1. 从记忆知道你怕冷喜欢美食预算 2 
2. 联网查11月日本天气机票价格景点开放情况
3. 图谱推理你喜欢动漫推荐秋叶原喜欢美食推荐大阪
4. 自动生成行程单包含机票酒店景点预算5. 弹出猫咪问:“做了三个方案A是关东B是关西C是综合你看看喜欢哪个?”

🔮 发展路线图

阶段 时间 核心目标 用户价值
v1.0 2025-2026 基础情感陪伴 + 任务执行 数字家人雏形
v2.0(当前) 2026-2027 多模型智能路由 + 知识图谱 + 实时知识 + 情绪神经网络 情感与推理双强
v2.5 2027 形象自定义 + 捏人系统 + AI生成形象 专属感拉满
v3.0 2027-2028 服务器矩阵增强 + 多设备同步 全场景数字分身
v4.0 2028+ AR/VR支持 + 脑机接口预留 下一代交互

🤝 贡献指南

我们欢迎社区贡献!无论你是:

  • 🐛 发现了bug
  • 💡 有好想法
  • 🔧 想写代码
  • 📝 想完善文档
  • 🌍 想做本地化

请阅读以下文档:


📄 许可证

本项目采用 Apache License 2.0

这意味着你可以:

  • ✅ 自由使用、修改、分发
  • ✅ 商业使用
  • ✅ 专利授权
  • ✅ 私人使用

只需:

  • 📝 保留版权声明
  • 📝 注明修改

🆘 支持与联系


🌟 致谢

感谢所有为Mirexs贡献过想法、代码、文档和建议的社区成员。特别感谢开源社区提供的优秀模型和工具:

  • Meta - Llama 3.1/4 系列
  • 阿里通义千问 - Qwen 3.5 系列
  • DeepSeek - DeepSeek V3
  • Hugging Face - Transformers
  • 以及所有开源贡献者

🐱 Mirexs v2.0(弥尔思)- 让智能更有温度,让陪伴更真实 🐱✨

Built with ❤️ by Zikang and the community

从 v1.0 到 v2.0,我们增加了 700+ 个文件,4 大核心模块,让数字家人真正“懂你”

⭐ 如果Mirexs对你有所帮助,请给个Star ⭐


版本历史

  • v2.0 (2026.03) - 多模型智能路由、知识图谱、情绪神经网络、实时知识更新、安全事件响应
  • v1.0 (2025.10) - 初始版本,基础情感陪伴、3D猫咪、基础记忆

About

No description, website, or topics provided.

Resources

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages