华中科技大学计算机科学与技术专业硕士在读,热爱编程与技术探索,喜欢分享知识与经验
我的兴趣所在:
看看我的项目
这里是我近期在做的一些项目。我非常喜欢尝试新项目、探索新点子,也总是在不断做新的尝试,欢迎常回来看看!
看看我的文章
除了写代码,我也喜欢记录所思所想,这里是我最近写的一些文章。
强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型
© 2025 息间