Skip to content

solming001/douyin

 
 

Repository files navigation

douyin

✨DouyinCrawler

English | Tiếng Việt | 简体中文

❤️开源不易,欢迎 star⭐

📢声明

本项目初衷为学习python爬虫、命令行调用Aria2python实现WebUI的案例,后用于尝试体验 AI 编程(前端及前后端交互部分纯 AI 生成),应用程序功能为获取抖音平台上公开的信息,仅用于测试和学习研究,禁止用于商业用途或任何非法用途。

任何用户直接或间接使用、传播本仓库内容时责任自负,本仓库的贡献者不对该等行为产生的任何后果负责。

如果相关方认为该项目的代码可能涉嫌侵犯其权利,请及时联系我删除相关代码

使用本仓库的内容即表示您同意本免责声明的所有条款和条件。如果你不接受以上的免责声明,请立即停止使用本项目。


🏠项目地址

https://github.com/erma0/douyin

🍬功能特性

📊 数据采集

  • ✅ 单个作品数据
  • ✅ 用户主页作品
  • ✅ 用户喜欢作品(需目标开放权限)
  • ✅ 用户收藏作品(需目标开放权限)
  • ✅ 话题挑战作品
  • ✅ 合集作品
  • ✅ 音乐原声作品
  • ✅ 关键词搜索作品
  • ✅ 关注用户(仅 cli 模式,需目标开放权限)
  • ✅ 粉丝用户(仅 cli 模式,需目标开放权限)

🎯 应用特性

  • 🔄 增量采集:智能增量采集用户主页作品
  • ⬇️ 批量下载:集成 Aria2,支持视频/图片批量下载
  • 🎨 多种模式:GUI 桌面应用 / Web 服务 / cli 命令行
  • 🌐 RESTful API:v2.0 提供完整的 HTTP API
  • 🔧 跨平台支持:Windows / macOS / Linux

📸 界面展示

软件界面

🚀快速开始

环境要求

📍测试环境:Win10 x64 + Python 3.12 + Node.js 22.13.0 + uv 0.9+

Windows 用户

Releases 下载,解压后运行 DouyinCrawler.exe

Web 服务(Docker / 全平台)

# Docker(推荐)
docker compose up -d

# 或手动启动
uv sync
cd frontend && pnpm install && pnpm build && cd ..
python -m backend.server

浏览器访问 http://localhost:8000

开发模式(前后端分离)

💡 推荐开发模式:后端使用 --dev 参数启动,支持热重载;前端使用 Vite 开发服务器

1. 环境配置(首次运行)

# 配置 uv 虚拟环境(创建 .venv 并安装依赖)
.\scripts\setup\uv.ps1

# 安装前端依赖
cd frontend && pnpm install

2. 启动后端(终端 1)

# 使用 uv 启动后端服务(开发模式,支持热重载)
uv run python -m backend.server --dev

# 或使用默认配置启动
uv run python -m backend.server

3. 启动前端(终端 2)

# 进入前端目录并启动开发服务器
cd frontend
pnpm run dev

4. 访问应用

浏览器访问 http://localhost:5173

💡 前端开发服务器会自动代理 API 请求到后端 http://127.0.0.1:8000

命令行(cli 模式)

uv run python -m backend.cli -u https://www.douyin.com/user/xxx -l 20

📖 详细使用说明请查看 USAGE.md

🔨构建和打包

# 交互式菜单
.\quick-start.ps1

# 或直接打包
.\scripts\build\pyinstaller.ps1

脚本目录结构:

scripts/
├── build/          # 打包脚本 (PyInstaller / Nuitka)
├── setup/          # 环境配置 (uv / aria2)
└── dev.ps1         # 开发环境构建

📊 技术栈

  • 后端: Python 3.12, FastAPI, PyWebView
  • 前端: React 18, TypeScript, Vite
  • 下载: Aria2
  • 打包: PyInstaller / Nuitka

Star History

Star History Chart

About

抖音爬虫——采集账号主页、喜欢、收藏、音乐原声、话题、搜索、合集、作品、关注、粉丝等公开数据。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • TypeScript 54.0%
  • Python 33.7%
  • PowerShell 8.8%
  • JavaScript 3.0%
  • Dockerfile 0.2%
  • HTML 0.2%
  • CSS 0.1%