梗直哥 Gengzhige

欢迎来到星河AI研究院 👋

AI时代，普通人怎么赢？

秉持“让AI不再难学，让科研不再难搞，让求学就业不走弯路”的初心，梗直哥团队致力于专业人工智能的知识普及和科技创新。

三年来，我们在B站、知乎等平台收获了20多万粉丝的关注与喜爱。上万名学员选修了我们人工智能三部曲等原创课程，参与了AI实战特训班、AI逐梦营等活动。数千名学员在我们的帮助下打破出身、专业、学校、地域、国家等限制，实现跨专业攻读硕博、出国留学、高薪就业、创业等目标。有志者事竟成，敢想敢干、会想会干，逆天改命就不是梦！

我们发起成了星河AI研究院（Galaxy AI Research Academy）。借助多年的行业积累、资源与人脉，与中美日顶尖大学、研究机构和企业开展合作，让普通学生也能无门槛地接触最新技术和高水平科研，发表高质量原创学术论文、专利和成果。每周内部交流、专题分享、线上线下活动、1对1指导。也许你不曾想到还有这样的机会，数百成员已然受惠，你动心了吗？

“道阻且长，行则将至，行而不辍，未来可期”。我们始终认为，梗直既是一种精神，也是人生的态度。希望我们在你奋力前行的路上成为良师益友，为你助力，为你加油，为你喝彩！

论文精读系列

我们近期会逐步分享强化学习领域的高引论文，欢迎关注。

点击查看，也欢迎大家在讨论区里提供建议。

年份	名称	简介
👇️DQN系列
2013	DQN	首次使用深度网络结合Q-learning学习控制策略
2015	DDQN	有效降低DQN在Atari环境中对动作价值的过估
2016	Dualing DQN	动作值函数拆分成状态值和动作优势
👇️策略梯度方法
2015	DDPG	将确定性策略梯度与深度网络结合
2018	TD3	引入延迟策略更新等机制进一步优化DDPG
👇️经典Actor-Critic方法
2016	A3C	异步并行架构加速训练
2018	SAC	基于最大熵的策略迭代框架
👇️PPO系列
2015	TRPO	引入信赖域约束策略更新
2017	PPO	最广泛应用的强化学习方法之一
2023	DPO	基于偏好数据隐式学习奖励模型
2024	GRPO	根据群体得分估计基线
2025	DAPO	引入解耦裁剪、动态采样等机制
👇️多智能体
2017	MADDPG	多智能体环境实现集中式Critic和分散式Actor架构
2021	MAPPO	PPO在多智能体环境同样可以取得良好效果

科研项目 - 星河计划招生简章

梗直哥招学生了！因会亲力亲为，希望把最好的指导和资源给到最需要的同学，本着宁缺毋滥的原则，每期仅严选10-15人（精英项目+新星项目）。条件如下：

25-36岁对AI科研兴趣强烈，希望深造、转型、转行、留学、基金申请、创业等。
本科以上学历，专业不限，学校不限。事实上已有学生中一半以上为其他专业背景，“X+AI”模式，我们相信跨领域合作才是AI发展的未来。从双非到top3，不论出身，只看动力和能力，我们希望在传统培养模式之外提供有志之才独特的成长与创新路径。
单身有工作经历者优先，大厂小厂无所谓，体制内外都可以，什么行业都行。
有博士学历或科研经历者优先，大学或科研机构年轻教师优先，有留学经历优先。
已加入星河AI研究院成员优先。

我们目前与中科院、京大、伊利诺伊等国内外顶尖科研机构，谷歌、微软、腾讯等一线大厂建立了良好的合作与联合培养机制。在研项目覆盖AI Agent，具身智能（机器人、自动驾驶），AI4S（投资、医学、计算化学、生物）等领域。

如果你在科研领域苦苦挣扎不知发展方向，如果你职场遭遇瓶颈渴望转型，如果你导师放养前途迷茫，这里也许是你寻求人生突破实现逆袭的最好机会！

精英项目：为期10-12个月，定制化培养模式，全程1对1指导，配备专业导师和合作资源。适合有一定实力和想法，希望能迫切改变当前处境，无论在学术上、职业发展上实现转型和跨越式发展的同学（痛苦指数8-10）。比如工作出现瓶颈、面临内卷的年轻老师、行业坍塌亟需转型等情况。从选题、调研、课题规划、算法设计、实验、输出全流程个性化指导。让你借助科研成果做敲门砖，砸开下一个机会！
新星项目：为期3-6个月，参与既有项目，在老师指导下实现对AI科研过程的熟悉。适合实力有限，但又想快速提升科研经验，转型算法工程师或早日拿到结果毕业的同学（痛苦指数6-7）。比如程序员群体、刚本科毕业或者研一学生等。
科研加速营：为期1个月，针对最难的选题选方向环节，从AI思维、核心算法、学习路线设计、学术职业规划等角度突击培训。适合对科研前景充满期待但又深感迷茫的同学（痛苦指数4-5），比如在校学生、职场人士，有一定想法但还没有确切行动意愿。20课时录播+大量内部材料+8课时直播+1次个性化咨询。正价￥6k，内部早鸟价格￥3k。导师除梗直哥团队外，还包括京都大学等知名院所教授、腾讯等一线国内外大厂资深技术专家、team leader专题讲座和面对面交流。

有意者请将简历发至微信gengzhige99，所有申请都会回复。我们将近期择优安排线上或线下面试。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

梗直哥 Gengzhige

Achievements

Achievements

Block or report Gengzhige

欢迎来到星河AI研究院 👋

论文精读系列

科研项目 - 星河计划招生简章

更多服务

Pinned Loading

Uh oh!