✨ 专业的知乎评论数据采集解决方案,支持文章与回答的全量评论抓取
当你需要让 AI Agent 感知知乎内容生态——自动采集评论舆论、分析用户观点、驱动内容运营策略——第一道墙往往不是模型能力,而是平台数据获取能力的缺失。
本项目做的事很简单:把这道墙拆掉。
- ✅ 评论全量采集
- 支持文章(专栏)评论抓取
- 支持回答评论抓取
- 自动翻页,递归获取所有楼中楼(子评论)
- 🔐 x-zse-96 签名自动计算
- 内嵌 JS 运行时,自动生成知乎鉴权签名参数
- 适配知乎最新
x-zse-96/x-zse-93接口鉴权
- 🚀 高性能服务
- 基于 FastAPI + Uvicorn 异步服务
- 支持 Docker 一键部署
- Python 3.10+
- Node.js 20+
pip install -r requirements.txt
npm installpython App.py服务启动后访问 http://localhost:5007/docs 查看交互式 API 文档。
在浏览器中打开 www.zhihu.com,登录账号后按 F12 打开开发者工具,点击「网络」→ 找任意一个 API 请求 → 复制请求头中的 Cookie 字段值。
⚠️ 注意:必须登录后获取的 Cookie 才有效,其中d_c0字段用于 x-zse-96 签名计算,缺失将导致请求失败。
将获取到的 Cookie 字符串作为 cookies_str 参数传入接口,格式如下:
_zap=xxx; d_c0=xxx; z_c0=xxx; ...
获取知乎专栏文章的全部评论(含所有楼中楼子评论)。
请求参数
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| article_id | str | 是 | 文章 ID(URL 中的数字部分) |
| cookies_str | str | 是 | 知乎登录 Cookie 字符串 |
请求示例
curl -X POST http://localhost:5007/get_article_all_comment \
-H "Content-Type: application/json" \
-d '{
"article_id": "685931722",
"cookies_str": "_zap=xxx; d_c0=xxx; z_c0=xxx"
}'响应示例
{
"code": 200,
"message": "成功",
"data": [
{
"id": 123456789,
"author": {
"name": "用户昵称",
"avatar_url": "https://..."
},
"content": "评论内容",
"like_count": 42,
"child_comment_count": 3,
"child_comments": [
{
"id": 987654321,
"author": { "name": "回复用户" },
"content": "子评论内容"
}
]
}
]
}获取知乎回答的全部评论(含所有楼中楼子评论)。
请求参数
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| answer_id | str | 是 | 回答 ID(URL 中的数字部分) |
| cookies_str | str | 是 | 知乎登录 Cookie 字符串 |
请求示例
curl -X POST http://localhost:5007/get_answer_all_comment \
-H "Content-Type: application/json" \
-d '{
"answer_id": "3333952807",
"cookies_str": "_zap=xxx; d_c0=xxx; z_c0=xxx"
}'响应示例
{
"code": 200,
"message": "成功",
"data": [
{
"id": 111222333,
"author": {
"name": "用户昵称"
},
"content": "评论内容",
"child_comment_count": 2,
"child_comments": [
{
"id": 444555666,
"author": { "name": "回复用户" },
"content": "子评论内容"
}
]
}
]
}docker build -t zhihu-platform .
docker run -d -p 5007:5007 zhihu-platform| 日期 | 说明 |
|---|---|
| 26/04/10 | 项目初始化,完成文章与回答评论全量抓取 API 封装 |
本项目欢迎任何形式的贡献!如果你有新功能想法、Bug 修复或文档改进,欢迎提交 PR。
- Fork 本仓库并在新分支上开发
- 保持代码风格与现有代码一致
- PR 描述中请简要说明改动内容和目的
- 也欢迎通过 Issue 提出建议或报告问题
- 感谢 star⭐ 和 follow📰!不时更新
- 作者的联系方式在主页里,有问题可以随时联系我
- 可以关注下作者的其他项目,欢迎 PR 和 issue
- 感谢赞助!如果此项目对您有帮助,请作者喝一杯奶茶~~ (开心一整天😊😊)
- thank you~~~
如果你对爬虫和 AI Agent 感兴趣,请加作者主页 wx 通过邀请加入群聊
ps: 群123已超过wx限制人数500,请加群4