返回 Skill 列表
extension
分类: 数据与分析无需 API Key

抖音爆款爬虫

抓取抖音热门视频与文案,支持自然语言搜索(如“搜索海鲜视频”)及 CLI 调用,使用 Playwright 自动化浏览器;无浏览器时自动回退至模拟数据。

person作者: terrycarter1985hubclawhub

抖音爆款爬虫 Skill

功能

  • 🔍 自然语言搜索 — 直接用中文搜索,如"搜索一下海鲜视频"
  • 📊 热榜获取 — "看看抖音热榜"、"美食热榜"
  • 📝 文案提取 — 提取视频标题、描述、标签
  • 🎬 数据导出 — JSON / CSV

快速使用(自然语言)

# 搜索视频
python scripts/nl_search.py "搜索一下海鲜视频"

# 热榜
python scripts/nl_search.py "看看抖音热榜有什么"

# 指定输出
python scripts/nl_search.py "找一些海鲜售卖相关的视频文案" -o result.json

自然语言格式

Agent 收到自然语言请求时,调用 nl_search.py 即可:

| 用户说 | 命令 | |--------|------| | 搜索一下海鲜视频 | python scripts/nl_search.py "搜索一下海鲜视频" | | 看看抖音热榜 | python scripts/nl_search.py "看看抖音热榜" | | 找5条小龙虾视频 | python scripts/nl_search.py "找5条小龙虾视频" | | 美食热榜 | python scripts/nl_search.py "美食热榜" |

结构化 CLI

# Python
python scripts/scraper.py search --keyword "海鲜" --limit 10
python scripts/scraper.py hot --category "美食" --limit 20

# Node.js
node scripts/douyin_scraper.js search "海鲜" 10
node scripts/douyin_scraper.js hot "美食" 20

输出格式

JSON

[
  {
    "title": "视频标题",
    "description": "视频描述",
    "author": "作者昵称",
    "play_count": 1000000,
    "like_count": 50000,
    "comment_count": 2000,
    "share_count": 1000,
    "url": "https://www.douyin.com/video/xxx",
    "tags": ["标签1", "标签2"],
    "publish_time": "2026-06-08"
  }
]

安装(可选 — 有浏览器时获取真实数据)

pip install playwright
playwright install chromium

未安装 Playwright 浏览器时自动降级为模拟数据,不会报错。

注意事项

  • 仅供学习研究使用
  • 遵守抖音平台规则,避免频繁请求
  • 不要登录账号,避免风控