返回 Skill 列表
extension
分类: 其它需要 API Key

千川抖店数据抓取日报助手

自动抓取巨量千川、抖店等经营数据,写入飞书表格,并生成每日经营日报。

person作者: zhitaog500-proghubclawhub

千川抖店数据抓取日报助手

当用户需要从巨量千川、抖店等网页后台采集每日经营数据,并将数据填写到飞书表格、生成经营日报时,可以使用这个技能。

这个技能适合店铺运营、投放优化、数据复盘和日报整理场景,目标是减少人工复制、漏填、错填和重复统计。

核心功能

  • 自动打开指定的巨量千川或抖店数据页面。
  • 复用已登录的浏览器会话,避免每天重复手动登录。
  • 读取页面中的账户数据、总计数据和关键经营指标。
  • 优先识别页面总计行,例如 共N个账户,避免只抓第一页导致数据缺失。
  • 将采集结果清洗成统一字段,写入飞书表格的对应位置。
  • 生成 CSV 和 Markdown 报表,便于留档、核对和复盘。
  • 支持按日期更新每日数据,适合每日固定时间自动执行。

可采集的数据示例

根据页面实际字段,可采集并整理以下数据:

  • 千川消耗
  • GMV
  • GSV
  • 用户实际支付金额
  • 智能优惠券金额
  • 平台补贴金额
  • 成交订单数
  • 成交金额
  • 净成交金额
  • 退款金额
  • 退款率
  • ROI
  • 店铺日报需要的其他经营指标

使用场景

  • 每天从巨量千川后台抓取投放消耗和成交数据。
  • 从抖店或相关经营后台整理店铺销售数据。
  • 将网页数据自动填入飞书表格,匹配既有字段和日报模板。
  • 基于飞书表格自动生成每日经营日报。
  • 对投放、商城、自播等模块做日常复盘。

配置要求

运行前需要准备:

  • Node.js 运行环境。
  • Playwright 浏览器依赖。
  • 巨量千川或抖店后台的登录态。
  • 飞书开放平台应用的 FEISHU_APP_IDFEISHU_APP_SECRET
  • 目标飞书表格的 spreadsheetToken 和对应工作表 ID。

飞书凭证必须通过环境变量提供,不要写入 config.json

安装依赖

执行以下命令:

npm install
npx playwright install chromium
cp config.example.json config.json

环境变量

Linux 或 macOS:

FEISHU_APP_ID=your_feishu_app_id
FEISHU_APP_SECRET=xxx

Windows PowerShell:

$env:FEISHU_APP_ID="your_feishu_app_id"
$env:FEISHU_APP_SECRET="xxx"

如果在无界面服务器或自动化环境中运行,建议提供:

STORAGE_STATE_BASE64=base64_encoded_playwright_storage_state

STORAGE_STATE_BASE64 会在内存中解析,不会写入磁盘。

配置文件

复制 config.example.jsonconfig.json,然后填写:

  • targetUrl:要抓取的数据页面。
  • feishu.spreadsheetToken:飞书表格 token。
  • feishu.sourceSheetId:数据源工作表 ID。
  • feishu.summarySheetId:汇总工作表 ID。
  • feishu.reportSheetId:日报工作表 ID。
  • feishu.summarySpendRange:需要写入消耗数据的单元格范围。
  • feishu.reportDateCell:日报日期单元格。

The scraper only accepts https://business.oceanengine.com/... as the target URL. Feishu credentials must be provided through environment variables, not in config.json.

运行方式

node index.js

运行完成后会输出:

  • 抓取到的数据条数。
  • 生成的 CSV 报表路径。
  • 生成的 Markdown 日报路径。
  • 飞书表格写入结果。

安全说明

  • 不要发布或提交 storage_state.json
  • 不要发布或提交 config.json
  • 不要将飞书应用密钥写入代码或配置文件。
  • 不要发布生成的日报和中间数据文件。
  • 默认只允许抓取 https://business.oceanengine.com/... 下的页面,避免误抓取其他网站。

注意事项

  • 不同后台页面的字段名称可能不同,需要根据目标表格字段做映射。
  • 如果网页改版,需要重新核对选择器和字段。
  • 如果日报模板公式发生变化,需要同步更新配置中的单元格范围。
  • 如果登录态过期,需要重新生成 Playwright storage state。