Lists (32)
Sort Name ascending (A-Z)
3D图像生成
confyui
confyui 相关的代码face
人脸相关项目,包括人脸编辑,动画生成等GAN
Image Edit
图像编辑image generatate
图像生成NeRF
神经辐射场OCR
SAM
sd-webui
关于stable diffusion的webui应用stable-diffusion
扩散模型transformer video
video generatate
视频生成代码或应用合集
光流估计
动漫相关
图像修复
图像文本匹配
图片搜索/图像匹配
基于扩散算法的图文算法
多任务
一个模型可以完成多个不同类别的任务大模型相关
大模型应用项目
换脸
数据集
目标检测/风格/姿态
包含目标检测,分割,姿态检测等项目目标跟踪/视频插帧
虚拟换衣
虚拟角色
包括人脸,人体重建驱动等视频插值
音频处理(生成)
风格迁移
Stars
The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.
real time face swap and one-click video deepfake with only a single image
为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, m…
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
The definitive Web UI for local AI, with powerful features and easy setup.
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
Build and share delightful machine learning apps, all in Python. 🌟 Star to support our work!
基于大模型搭建的聊天机器人,同时支持 微信公众号、企业微信应用、飞书、钉钉 等接入,可选择ChatGPT/Claude/DeepSeek/文心一言/讯飞星火/通义千问/ Gemini/GLM-4/Kimi/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
A generative speech model for daily dialogue.
GFPGAN aims at developing Practical Algorithms for Real-world Face Restoration.
Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and…
Official Code for DragGAN (SIGGRAPH 2023)
Instant voice cloning by MIT and MyShell. Audio foundation model.
Easily train a good VC model with voice data <= 10 mins!
Code and documentation to train Stanford's Alpaca models, and generate the data.
Real-time face swap for PC streaming or video calls
Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.
Open-Sora: Democratizing Efficient Video Production for All
Create Customized Software using Natural Language Idea (through LLM-powered Multi-Agent Collaboration)
State-of-the-art 2D and 3D Face Analysis Project
Generative Models by Stability AI
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Industry leading face manipulation platform