返回 Skill 列表
extension
分类: 数据与分析无需 API Key

视频字幕提取

从主流视频平台链接提取视频字幕/文案文本。当用户想提取抖音、TikTok、YouTube、Bilibili、小红书、Instagram等平台视频的字幕或文案时,使用本技能。触发词:提取字幕、提取文案、视频转文字、视频字幕。

person作者: user_024db212hubcommunity

视频字幕提取 (video-transcript)

从主流视频平台链接中提取视频字幕/文案文本。支持抖音、TikTok、YouTube、Bilibili、小红书、Instagram、X/Twitter 等平台。

工作原理

通过浏览器自动化访问 https://www.transcriptgenerate.com/zh-CN 网站,粘贴视频链接,等待 AI 提取完成后获取字幕文本。全程免费,无需 API Key。

使用流程

第一步:从用户输入中提取视频链接

从用户的输入文本中提取视频链接。支持以下格式:

  • 完整 URL:https://v.douyin.com/xxx/https://www.youtube.com/watch?v=xxx
  • 分享文本中包含的链接(如抖音分享文案中的链接)

如果用户输入中包含多个链接,优先选择视频平台链接。无法唯一判断时,先让用户确认。

如果无法从用户输入中提取到有效链接,提示用户提供完整的视频链接。

第二步:打开提取网站

使用浏览器导航到:https://www.transcriptgenerate.com/zh-CN

第三步:输入视频链接并提取

  1. 找到页面顶部的输入框(placeholder 为 "粘贴视频链接,开始视频文案提取...")
  2. 点击输入框
  3. 使用 browser_type 清空并输入视频链接,设置 clear: true
  4. 由于 React 等框架的 input 事件监听机制,直接 type 可能不会触发按钮启用。需要使用 browser_evaluate 执行 JavaScript 来设置值并触发事件:
const input = document.querySelector('input[placeholder="粘贴视频链接,开始视频文案提取..."]');
if (input) {
  const nativeInputValueSetter = Object.getOwnPropertyDescriptor(window.HTMLInputElement.prototype, 'value').set;
  nativeInputValueSetter.call(input, '这里替换为视频链接');
  input.dispatchEvent(new Event('input', { bubbles: true }));
  input.dispatchEvent(new Event('change', { bubbles: true }));
}
  1. 等待 1-2 秒后,使用 browser_snapshot 检查"立即提取文案"按钮是否已启用(不再显示 disabled 状态)
  2. 点击"立即提取文案"按钮

第四步:等待提取完成

点击提取后,页面会显示加载状态:

  • 按钮文字变为"加载中..."
  • 出现"正在创建文案提取任务..."、"正在处理视频内容..."、"AI正在提取视频文案..."等提示

使用 browser_wait_for 等待 15-20 秒,然后使用 browser_snapshot 检查结果是否已出现。

判断提取完成的标志:

  • 按钮文字恢复为"立即提取文案"
  • 出现"文案提取结果"标题
  • 出现"复制文案"、"复制标题"、"复制描述"等操作按钮
  • 出现"视频文案"标题及下方文本内容

如果仍在加载中,继续等待 10 秒后再检查,最多等待 60 秒。

第五步:获取字幕文本

提取完成后,通过以下方式获取完整字幕文本:

方法一(推荐):点击"复制文案"按钮 + 读取剪贴板

  1. 点击"复制文案"按钮
  2. 使用 PowerShell 命令读取剪贴板内容并保存为 UTF-8 文件:
[Console]::OutputEncoding = [System.Text.Encoding]::UTF8;
$clip = Get-Clipboard -Raw;
[System.IO.File]::WriteAllText("临时文件路径\transcript.txt", $clip, [System.Text.Encoding]::UTF8);
Write-Output "Done, length: $($clip.Length)"
  1. 使用 Read 工具读取保存的文件内容

方法二:从页面 snapshot 中提取

使用 browser_snapshot 获取页面结构,找到"视频文案"标题(h4 元素),其 name 属性中包含完整文案文本。注意 snapshot 可能会截断长文本,如果文本不完整,使用方法一。

第六步:输出结果

将提取到的字幕/文案内容保存为文本文件到工作目录,文件名格式建议:字幕_<视频标题关键词>.txt

输出格式如下:

# 视频字幕提取结果

- **视频链接**: <原始链接>
- **视频标题**: <从页面提取的标题>
- **提取状态**: 成功/失败

## 字幕/文案内容

<完整字幕文本>

## 备注

<如有特殊情况说明>

同时提供文件下载链接。

支持平台

  • 抖音 (douyin.com)
  • TikTok
  • YouTube
  • Bilibili (bilibili.com)
  • 小红书 (xiaohongshu.com)
  • Instagram
  • X / Twitter

常见问题处理

链接解析失败

  • 确认链接格式正确,是完整的 http/https 链接
  • 抖音分享文本中可能包含特殊字符,确保提取的是纯 URL 部分
  • 提示用户提供完整链接或完整分享文本

提取超时

  • 等待最多 60 秒
  • 如果超时,提示用户视频可能较长或服务器繁忙,建议稍后重试

提取结果为空或不完整

  • 可能是视频没有语音内容
  • 可能是视频语言不支持
  • 建议用户手动到 https://www.transcriptgenerate.com/zh-CN 网页版尝试

网站不可用

  • 如果网站无法访问,提示用户网站可能临时不可用,建议稍后重试
  • 备选方案:用户可直接访问 https://www.transcriptgenerate.com/zh-CN 手动操作

注意事项

  • 提取过程中浏览器需要保持锁定状态(browser_lock)
  • 操作完成后记得解锁浏览器(browser_unlock)
  • 不要编造字幕内容,必须如实返回网站提取的结果
  • 如果提取失败,如实报告错误信息