Stars
ComeFromTheMars / DeepSeek-TUI
Forked from Hmbown/CodeWhaleCoding agent for DeepSeek models that runs in your terminal
Turn Claude Code into a full game dev studio — 49 AI agents, 72 workflow skills, and a complete coordination system mirroring real studio hierarchy.
The data and source code for the paper "MoocRadar: A Fine-grained and Multi-aspect Knowledge Repository for Improving Cognitive Student Modeling in MOOCs"
Evolutionary multi-objective optimization platform
simon824 / langchain
Forked from langchain-ai/langchain⚡ Building applications with LLMs through composability ⚡
这是一个用于训练大语言模型的个人项目,主要实现了几种流行的强化学习算法(PPO、DPO、GRPO)。项目的目标是让大语言模型能够更好地理解和响应人类的偏好。 ### 📝 项目描述 LLM PPO训练框架 - 一个简单易用的大语言模型强化学习训练工具 这个项目是我个人开发的一个训练框架,用来训练和优化大语言模型。它支持三种不同的训练方法:PPO(让模型逐步改进)、DPO(直接从人类偏好学习)和…
基于大模型ChatGLM,微调方式为LORA,集SFT、RM、PPO算法为一体项目
智能闲鱼客服机器人系统:专为闲鱼平台打造的AI值守解决方案,实现闲鱼平台7×24小时自动化值守,支持多专家协同决策、智能议价和上下文感知对话。
本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/
Agent4Edu: Generating Learner Response Data by LLM-based Agents for Intelligent Education Systems (AAAI 2025)
使用 flask + pyecharts 搭建的新冠肺炎疫情数据可视化交互分析网站平台,包含疫情数据获取、每日疫情地图、曲线图展示,数据统计分析、态势感知、确诊人数预测分析算法设计、NLP舆情监测等任务(部署在http://covid.yunwei123.tech/)
Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translatio…