embedx 是基于 c++ 开发的大规模 embedding 训练和推理系统,累计支持公司 12 个业务、 30 多个团队使用、上线百余次。
我们在以下推荐、搜索、支付 和 风控等产品落地使用了 embedx: 微信看一看、微信视频号、微信搜一搜、微信支付、微信安全、
腾讯新闻、应用宝、QQ 音乐、JOOX 音乐、腾讯课堂、领航平台 和 腾讯黑产打击 等 ,并取得了性能和效果双丰收。
更多介绍请参考详细介绍。
EmbedX系统的论文发表在PVLDB'2023, 引用 cite:
@article{10.14778/3611540.3611546,
author = {Zou, Yuanhang and Ding, Zhihao and Shi, Jieming and Guo, Shuting and Su, Chunchen and Zhang, Yafei},
title = {EmbedX: A Versatile, Efficient and Scalable Platform to Embed Both Graphs and High-Dimensional Sparse Data},
year = {2023},
volume = {16},
number = {12},
url = {https://doi.org/10.14778/3611540.3611546},
journal = {Proc. VLDB Endow.},
pages = {3543–3556}
}
-
已经实现的模型
- 十亿级节点、千亿级边的 图模型
- 百亿级样本、百亿特征的 深度排序、召回模型
- 十亿级节点、千亿级边与百亿级样本、百亿特征的 图与深度排序、图与深度召回的联合建模模型