姓 名:Guo Meng
学 位:博士
联系方式:13811961054@139.com
AI/多媒体/智能硬件领域 研发部门负责人/技术负责人
2010至今 中国移动研究院 项目经理/技术负责人
2007-2010 北京三星研究院 研究员
2002-2007 中国科学院计算技术研究所 博士 专业:计算机科学与技术
1998-2002 中央民族大学(双一流/985/211) 学士 专业:电子工程
2015-至今 视频云平台及应用、深度学习平台,项目负责人,项目团队10人,外协人力10人,合作单位5家
视频云平台及应用:
- 负责视频云平台研发,包括立项规划、功能/架构设计、研发实现、应用推广等。
- 视频云平台面向行业和个人用户,提供视频上传、视频流接入、实时转码、存储、视频点播分发、视频直播分发等。平台已服务于中国移动集团视频宣传网站,并在省公司部署应用。
- 负责互联网视频监控产品研发,包括定制摄像机、手机前端采集APP、互联网视频监控平台、Web及手机视频监控浏览APP。
- 负责直播产品研发,包括专业摄像机直播采集和4G手机直播APP,支撑博鳌、凤凰网等4G直播应用。
- 主要技术:RTSP, RTMP, HLS, Nginx, Mysql, ELK, Hadoop, 云存储, FFmpeg, WordPress, etc.
深度学习平台:
- 负责深度学习平台研发,包括立项规划、功能/架构设计、研发实现、应用推广等。
- 深度学习平台扩展视频云平台的智能处理能力,包括深度学习在线推理模块、训练数据采集/处理模块和自动训练模块(持续研发中)。
- 负责深度学习在图像/语音处理的应用研发,负责模型训练。包括图像不良信息检测模型训练,语音消噪模型训练。
- 负责深度学习的医学图像处理模型训练,包括眼前图像白内障判别模型训练,眼底图像糖网判别模型训练。
- 参与人脸识别产品开发。研发人脸识别门禁终端,评估ARM及Intel芯片智能硬件实现方案。
- 主要技术:Tensorflow, Keras, Caffe, CNN, DNN, etc.
2013-2014 4G网络下音视频应用,项目负责人,项目团队5人,合作单位5家
- VoLTE视频优化。针对VoLTE业务商用前视频卡顿、模糊等现象,组织华为、三星等多个终端厂商,在杭州外场开展视频通话测试,收集VoLTE端到端视频数据包,分析定位问题,提出VoLTE视频通话优化方案。
- 4G网络下视频业务优化。4G网络商用初期,视频点播/直播业务与网络适配不佳,用户体验不好。针对此问题,在北京城区组织开展4G视频业务优化,协调北京移动、凤凰、优酷等视频网站开展移动、电信、联通网络视频业务比对测试,完成4G网络和视频业务双向适配,并在业内首次提出了可保障互联网视频用户体验的网络带宽量化值。
- 语音翻译关键技术研究与产品研发。完成语音识别/机器翻译技术验证,实现语音翻译概念产品,完成语音翻译业务形态,产品设计,以及业务平台方案。
- 中国移动灵犀业务。制定中国移动灵犀业务总体技术规范。
- 主要技术:SIP, Wireshark, H.264, HLS, FFmpeg, Freeswitch, 网络损伤, etc.
2010-2013 移动多媒体应用,项目负责人,项目团队2人,外协人力5人,合作单位8家
- 负责并建成移动多媒体实验室。负责实验室规划、设计及实施,建立移动媒体应用端到端评测环境,包括200平米视频/音频实验室、音视频采集/编码/传输/播放等多环节测试系统,制定测试指标及规范,制定测试视频数据集,研发测试工具。实验室已投入运行5年,支持多项音视频产品开发及优化。
- 负责并完成设备集采、新产品选型、现网业务优化等多项测试,包括视频监控业务集采测试、VoIP语音编码传输方案测试、综合网关视频转码器性能测试、SVAC视频编码质量测试等。
- 参与并完成国家重大专项“新型移动多媒体音视频编解码关键技术研发”,负责技术工作开展。
- 主要技术:H.264, FFmpeg, 质量评测方法, etc.
2007-2010 音视频codec研发
- 2009/08-2009/12,基于Cortex-A8的LCHF移动视频解码优化
- 2009/01-2009/08,语音编码codec优化
- 2008/10-2008/12,OMAP3430上的AVS移动视频解码器
- 2008/10-2008/12,移动多媒体家庭网关
- 2007/07-2008/12,PXA300上AVS移动视频编解码器优化
- 2007/05- 2007/06,CMMB Part2解复用
- 2007/02-2007/05,AVS移动解码器FPGA架构设计
2003-2007 高性能计算系统研发
- 2006/08-2007/01,数字电影系统
- 2004/10-2006/07,基于FPGA的数字信号处理系统
- 2004/08-2004/12,矩阵转置存储技术
- 2003/09-2004/09,Godson-1 工控计算机
项目开发及管理经验丰富,熟悉视频、深度学习、智能硬件领域相关技术;掌握平台系统架构设计和硬件方案设计;具有较强的分析及沟通能力,熟悉各类材料撰写;熟悉C、Python、Verilog等语言及Linux系统。
- 深度学习:理解深度学习技术,熟悉CNN、DNN模型训练,熟悉图像、语音处理技术。
- 多媒体:掌握视频/图像编解码及传输技术,熟悉RTSP、RTMP、HLS等流媒体协议,熟悉音视频质量评测技术,熟悉多媒体应用优化。
- 平台侧: 搭建开放平台,对外提供视频能力;工作涉及顶层规划、方案设计、产品研发、部署实施、后期支持等工作;熟悉Linux系统及云计算技术、平台侧开发常用技术,如WEB搭建、数据库存储、数据存储及消息处理、RESTful接口、系统部署等。
- 硬件:掌握硬件设计技术,熟悉FPGA/DSP/CPU开发,熟悉存储及总线技术。
- 通信:了解移动通信系统,熟悉SIP协议及3G/4G网络架构。
- 项目管理:项目经历丰富,熟练掌握项目管理流程,组织协调多个单位推动项目开展,与项目成员沟通顺畅。
- 具有较强的分析研究能力,熟悉各类材料撰写。
专利申请累计30余项,国内专利授权16项,PCT专利授权2项;标准化提案2项;部分专利/提案/文章发表如下:
- 《视频编码新技术和新方向》 《电信科学》,2017
- 《智能语音时代来了》 《工业经济论坛》,2014
- 《A Low Complexity Rate Control Algorithm for Portable Applications》 IEEE 2011 WiCOM
- 《码率控制初始QP计算方法》 AVS M2456,2008
- 《场景切换码率控制方法》 AVS M2457,2008
- 《噪声抑制方法、装置、电子设备和通信处理方法》 201210442169.3
- 《一种解码方法、装置及终端》 PCT/CN2011/084631
- 《method, device and terminal for decoding》 US 9,438,902 B2
- 《一种解码方法、装置及终端》 201010623562.3
- 《一种无线POS机的交易权限验证方法、装置及系统》 201110294434.3
- 《一种确定图像的感知量及图像编码的方法及装置》 201110135204.2
- 《一种语音对话翻译方法、装置及系统》 201310611654.3
- 《中国移动灵犀业务总体技术要求》 企标,2013
- 2017至今,中国通信行业标准化组织CCSA TC1 WG3工作组副组长
- 2016至今,中国移动研发核心能力清单评审专家、专利评审专家、评标专家
- 2018 Google TensorFlow Dev Summit - Extended Beijing,讲师
- 2013 IEEE International Symposium on Circuits and Systems,审稿人
- 开源和维护Github深度学习项目mosaic、ClearWave