Skip to content
View Gengzhige's full-sized avatar

Block or report Gengzhige

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Gengzhige/README.md

欢迎来到星河AI研究院 👋

AI时代,普通人怎么赢?

秉持“让AI不再难学,让科研不再难搞,让求学就业不走弯路”的初心,梗直哥团队致力于专业人工智能的知识普及和科技创新。

三年来,我们在B站、知乎等平台收获了20多万粉丝的关注与喜爱。上万名学员选修了我们人工智能三部曲等原创课程,参与了AI实战特训班、AI逐梦营等活动。数千名学员在我们的帮助下打破出身、专业、学校、地域、国家等限制,实现跨专业攻读硕博、出国留学、高薪就业、创业等目标。有志者事竟成,敢想敢干、会想会干,逆天改命就不是梦!

我们发起成了星河AI研究院(Galaxy AI Research Academy)。借助多年的行业积累、资源与人脉,与中美日顶尖大学、研究机构和企业开展合作,让普通学生也能无门槛地接触最新技术和高水平科研,发表高质量原创学术论文、专利和成果。每周内部交流、专题分享、线上线下活动、1对1指导。也许你不曾想到还有这样的机会,数百成员已然受惠,你动心了吗?

道阻且长,行则将至,行而不辍,未来可期”。我们始终认为,梗直既是一种精神,也是人生的态度。希望我们在你奋力前行的路上成为良师益友,为你助力,为你加油,为你喝彩!


论文精读系列

我们近期会逐步分享强化学习领域的高引论文,欢迎关注。

点击查看,也欢迎大家在讨论区里提供建议。

年份名称简介引用
👇️DQN系列
2013DQN首次使用深度网络结合Q-learning学习控制策略Static Badge
2015DDQN有效降低DQN在Atari环境中对动作价值的过估Static Badge
2016Dualing DQN动作值函数拆分成状态值和动作优势Static Badge
👇️策略梯度方法
2015DDPG将确定性策略梯度与深度网络结合Static Badge
2018TD3引入延迟策略更新等机制进一步优化DDPGStatic Badge
👇️经典Actor-Critic方法
2016A3C异步并行架构加速训练Static Badge
2018SAC基于最大熵的策略迭代框架Static Badge
👇️PPO系列
2015TRPO引入信赖域约束策略更新Static Badge
2017PPO最广泛应用的强化学习方法之一Static Badge
2023DPO基于偏好数据隐式学习奖励模型Static Badge
2024GRPO根据群体得分估计基线Static Badge
2025DAPO引入解耦裁剪、动态采样等机制Static Badge
👇️多智能体
2017MADDPG多智能体环境实现集中式Critic和分散式Actor架构Static Badge
2021MAPPOPPO在多智能体环境同样可以取得良好效果Static Badge

科研项目 - 星河计划招生简章

梗直哥招学生了!因会亲力亲为,希望把最好的指导和资源给到最需要的同学,本着宁缺毋滥的原则,每期仅严选10-15人(精英项目+新星项目)。条件如下:

  1. 25-36岁对AI科研兴趣强烈,希望深造、转型、转行、留学、基金申请、创业等。
  2. 本科以上学历,专业不限,学校不限。事实上已有学生中一半以上为其他专业背景,“X+AI”模式,我们相信跨领域合作才是AI发展的未来。从双非到top3,不论出身,只看动力和能力,我们希望在传统培养模式之外提供有志之才独特的成长与创新路径。
  3. 单身有工作经历者优先,大厂小厂无所谓,体制内外都可以,什么行业都行。
  4. 有博士学历或科研经历者优先,大学或科研机构年轻教师优先,有留学经历优先。
  5. 已加入星河AI研究院成员优先。

我们目前与中科院、京大、伊利诺伊等国内外顶尖科研机构,谷歌、微软、腾讯等一线大厂建立了良好的合作与联合培养机制。在研项目覆盖AI Agent,具身智能(机器人、自动驾驶),AI4S(投资、医学、计算化学、生物)等领域。

如果你在科研领域苦苦挣扎不知发展方向,如果你职场遭遇瓶颈渴望转型,如果你导师放养前途迷茫,这里也许是你寻求人生突破实现逆袭的最好机会!

  • 精英项目:为期10-12个月,定制化培养模式,全程1对1指导,配备专业导师和合作资源。适合有一定实力和想法,希望能迫切改变当前处境,无论在学术上、职业发展上实现转型和跨越式发展的同学(痛苦指数8-10)。比如工作出现瓶颈、面临内卷的年轻老师、行业坍塌亟需转型等情况。从选题、调研、课题规划、算法设计、实验、输出全流程个性化指导。让你借助科研成果做敲门砖,砸开下一个机会!

  • 新星项目:为期3-6个月,参与既有项目,在老师指导下实现对AI科研过程的熟悉。适合实力有限,但又想快速提升科研经验,转型算法工程师或早日拿到结果毕业的同学(痛苦指数6-7)。比如程序员群体、刚本科毕业或者研一学生等。

  • 科研加速营:为期1个月,针对最难的选题选方向环节,从AI思维、核心算法、学习路线设计、学术职业规划等角度突击培训。适合对科研前景充满期待但又深感迷茫的同学(痛苦指数4-5),比如在校学生、职场人士,有一定想法但还没有确切行动意愿。20课时录播+大量内部材料+8课时直播+1次个性化咨询。正价¥6k,内部早鸟价格¥3k。导师除梗直哥团队外,还包括京都大学等知名院所教授、腾讯等一线国内外大厂资深技术专家、team leader专题讲座和面对面交流。

有意者请将简历发至微信gengzhige99,所有申请都会回复。我们将近期择优安排线上或线下面试。


更多服务

更多服务

Pinned Loading

  1. Machine-Learning Machine-Learning Public

    《机器学习必修课:经典算法与Python实战》配套代码

    Jupyter Notebook 98 43

  2. Deep-Learning-Code Deep-Learning-Code Public

    《深度学习必修课:进击算法工程师》配套代码

    Jupyter Notebook 74 39

  3. Reinforcement-Learning Reinforcement-Learning Public

    《强化学习必修课:引领智能新时代》配套代码

    Jupyter Notebook 36 34

  4. Deep-Learning Deep-Learning Public

    《趣味深度学习公开课》配套代码

    Jupyter Notebook 52 19