Stars
SFT, Expert Iteration, GRPO
面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版
📚 《从零开始构建智能体》——从零开始的智能体原理与实践教程
A minimal yet professional single agent demo project that showcases the core execution pipeline and production-grade features of agents.
这是一个从头训练大语言模型的项目,包括预训练、微调和直接偏好优化,模型拥有1B参数,支持中英文。
📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, HGEMM, FA-2 MMA.🎉
A high-throughput and memory-efficient inference and serving engine for LLMs
🚀🚀 「大模型」2小时完全从0训练64M的小参数GPT!🌏 Train a 64M-parameter GPT from scratch in just 2h!
本项目为量化开源课程,可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。
[NeurIPS'23 Oral] Visual Instruction Tuning (LLaVA) built towards GPT-4V level capabilities and beyond.
[Lumina具身智能社区] 具身智能技术指南 Embodied-AI-Guide
Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)
《大模型白盒子构建指南》:一个全手搓的Tiny-Universe