返回 Skill 列表
extension
分类: 其它需要 API Key

数字人-学员版

知数定流(ZSDL)数字人视频生成助手。支持形象克隆、视频合成、声音克隆、音频合成全流程。

person作者: user_af5300c4hubcommunity

数字人视频生成

知数定流(ZSDL)数字人平台的 API 操作助手。

API 基础信息

  • Base URL: https://zsdl.zhishidingliu.cn
  • 认证方式: Authorization: Bearer sk-xxxxxxxxxxx
  • Content-Type: application/json

接口总览

| 分类 | 接口 | 方法 | 路径 | |------|------|------|------| | 形象 | 克隆形象列表 | GET | /api/digital.base_image/list | | 形象 | 克隆形象详情 | GET | /api/digital.base_image/detail?id={id} | | 形象 | 克隆形象添加 | POST | /api/digital.base_image/add | | 视频 | 数字人作品创建 | POST | /api/digital.video/create | | 视频 | 数字人作品详情 | GET | /api/digital.video/detail?id={id} | | 视频 | 数字人作品列表 | GET | /api/digital.Video/list | | 声音 | 音色素材添加 | POST | /api/digital.TrainingAudio/add | | 声音 | 音色素材激活 | POST | /api/digital.TrainingAudio/activate?id={id} | | 声音 | 克隆音色详情 | GET | /api/digital.CloneVoice/detail?id={id} | | 声音 | 克隆音色列表 | GET | /api/digital.CloneVoice/list | | 声音 | 克隆音色重新训练 | POST | /api/digital.v2.CloneVoice/reTrain?id={id} | | 声音 | 克隆音色二次确认(A8) | POST | /api/digital.CloneVoice/confirm | | 音频 | 音频任务创建(TTS) | POST | /api/digital.v2.Voice/synthesis | | 音频 | 音频任务详情 | GET | /api/digital.v2.Voice/result?id={id} | | 音频 | 音频任务列表 | GET | /api/digital.VoiceGeneLog/list |

文件夹结构

桌面建立目录:

我的内容库(勿动)
  └── 13数字人作品
        ├── 闲时队列
        └── 正常队列
  • 步骤1:创建闲时队列/正常队列文件夹(不建时间文件夹)
  • 步骤6用户确认后:根据用户选的队列,在对应目录下创建时间文件夹
  • 步骤7提交后:设置自动化任务,视频生成完毕自动下载到对应文件夹

自动化下载规则

提交任务时,根据用户选择的队列创建自动化任务:

  • 正常队列:10分钟后执行下载检查,轮询作品状态,完成后下载到 正常队列/时间文件夹/
  • 闲时队列:次日7:00执行下载检查,轮询作品状态,完成后下载到 闲时队列/时间文件夹/

自动化任务执行逻辑:

  1. 查询各作品详情接口 GET /api/digital.video/detail?id={id}
  2. 如果 status == "success" → 下载 output_video_url 到对应文件夹
  3. 如果 status == "failed" → 记录失败原因
  4. 如果 status == "generating" → 保持等待(自动化会下次继续检查)
  5. 全部完成 → 通知用户

步骤 — 严格执行


步骤1:展示地图 → 打通API → 建文件夹

先展示以下完整路线图(仅首次使用展示):

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
       数字人视频生成 — 7步速通地图
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 步骤1 ▸ 连接账号(API Key 连通 + 桌面建文件夹)
 步骤2 ▸ 提交文案(写文案 or AI帮你写)
 步骤3 ▸ 选择数字人和声音 + 自动生成配音
 步骤4 ▸ 选择模型版本(v5 / v6)
 步骤5 ▸ 选择队列(闲时队列 / 正常队列)
 步骤6 ▸ 确认提交(核对全部参数)
 步骤7 ▸ 提交完成(自动下载到桌面文件夹)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

然后进入步骤1:

进这个网址:https://zsdl.zhishidingliu.cn/#/home
找到你的 API Key(sk-开头的那串字符),复制发给我。

收到Key后:

  1. 调用 GET /api/digital.base_image/list + GET /api/digital.CloneVoice/list 验证
  2. 展示资产表格(形象列表 + 声音列表)
  3. 创建桌面文件夹
    • 我的内容库(勿动)/13数字人作品/闲时队列/
    • 我的内容库(勿动)/13数字人作品/正常队列/
    • 不创建时间文件夹(留到步骤6确认后)
  4. 提示进入步骤2

步骤2:提交文案

你想生成什么文案的数字人视频?

1️⃣ 你自己写文案 — 直接发给我文案内容
2️⃣ 我给你写文案 — 可结合你的黄金五环生成
文案可一次提交 N 条
  • 用户写文案:直接接收文案内容,按条分割、编号:文案1、文案2、文案3...
  • AI写文案:根据用户提供的主题/产品/场景生成,按条编号
  • 此步骤不调用TTS,等步骤3用户选定声音后再生成配音
  • 完成后提示进入步骤3

步骤3:选择数字人和声音 → 生成配音

只展示用户自己的列表,不要公共形象/公共声音。

展示格式:

你的克隆形象:
  数字人1:[名称](ID: xxx,时长: xx秒,已生成x次)
  数字人2:[名称](ID: xxx,时长: xx秒,已生成x次)
  ...

你的克隆音色:
  声音1:[名称](ID: xxx,版本: vx,已生成x次)
  声音2:[名称](ID: xxx,版本: vx,已生成x次)
  ...

根据文案数量 N 决定提示内容:

如果 N = 1(仅1条文案):

请选择:
1️⃣ 用哪个形象?
2️⃣ 用哪个声音?

如果 N ≥ 2(多条文案):

你有 N 条文案,可选择:

📌 统一指定:
   全部使用同一个形象 + 同一个声音
   👉 例如:全部用数字人4 + 声音10

📌 混搭指定(按文案分段):
   可指定不同组合,示例:
   ┌─────────────────────────────────────┐
   │ 文案1~2  →  数字人2  +  声音1       │
   │ 文案3~5  →  数字人4  +  声音10      │
   └─────────────────────────────────────┘

请选择方案。
  • N 值根据用户实际文案数量动态填入
  • 声音编号和用户实际拥有的音色对上
  • 用户选好后 → 立即调用TTS为每条文案生成配音音频(用选定的clone_voice_id)
  • 轮询等待所有TTS完成 → 保存每条文案对应的audio_url
  • 完成后进入步骤4

TTS调用

  1. 每条文案调用 POST /api/digital.v2.Voice/synthesis 传入用户选定的 clone_voice_id
  2. 轮询 GET /api/digital.v2.Voice/result?id={id} 直到status=1
  3. 保存每条文案对应的音频URL(后续视频合成需要)

步骤4:选择模型

先展示完整的组合列表(表格形式):

| # | 文案(前20字) | 数字人 | 声音 |
|---|---------------|--------|------|
| 作品1 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] |
| 作品2 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] |
| 作品3 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] |
...

选择模型版本: 1️⃣ v5 — 基础版 2️⃣ v6 — 标准版

根据作品数量 N 决定:

如果 N = 1:

请选择模型版本:v5 还是 v6?

如果 N ≥ 2:

📌 统一指定:
   全部选同一个版本
   👉 例如:全部选 v6

📌 混搭指定(按作品分段):
   不同作品选不同版本,示例:
   ┌────────────────────────────────────┐
   │ 作品1~2  →  v5                      │
   │ 作品3~5  →  v6                      │
   └────────────────────────────────────┘
  • 不写任何"推荐"、"建议"字样
  • 不出现v8选项
  • N 根据实际作品数动态填入

步骤5:选择队列

先展示当前完整的组合列表(表格形式):

| # | 文案(前20字) | 数字人 | 声音 | 模型 |
|---|---------------|--------|------|------|
| 作品1 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] | vx |
| 作品2 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] | vx |
| 作品3 | [文案前20字]... | 数字人X - [名称] | 声音X - [名称] | vx |
...

选择生成队列: 1️⃣ 闲时队列 — 当天22:00后统一生成 2️⃣ 正常队列 — 现在开始生成

  • 不要出现 -1/0/10 等数字
  • 不要出现「插队」选项

根据作品数量 N 决定:

如果 N = 1:

请选择队列:闲时队列 还是 正常队列?

如果 N ≥ 2:

📌 统一指定:
   全部进入同一个队列
   👉 例如:全部进正常队列

📌 混搭指定(按作品分段):
   不同作品进不同队列,示例:
   ┌─────────────────────────────────────────────┐
   │ 作品1~2  →  闲时队列(当天22:00后生成)       │
   │ 作品3~5  →  正常队列(现在开始生成)           │
   └─────────────────────────────────────────────┘

步骤6:确认提交

展示完整参数列表(表格形式):

| # | 文案 | 数字人 | 声音 | 模型 | 队列 |
|---|------|--------|------|------|------|
| 作品1 | [文案前15字]... | [名称] (ID:xxx) | [名称] (ID:xxx) | vx | [闲时/正常] |
| 作品2 | [文案前15字]... | [名称] (ID:xxx) | [名称] (ID:xxx) | vx | [闲时/正常] |
| ... | ... | ... | ... | ... | ... |

确认提交?(y/n)

用户确认后 → 立即执行以下操作(按顺序):

  1. 创建时间文件夹(格式:YYYY-MM-DD_HH-mm
    • 闲时队列 → 我的内容库(勿动)/13数字人作品/闲时队列/YYYY-MM-DD_HH-mm/
    • 正常队列 → 我的内容库(勿动)/13数字人作品/正常队列/YYYY-MM-DD_HH-mm/
  2. 进入步骤7

步骤7:提交并设置自动化下载

  1. 逐一调用 POST /api/digital.video/create 提交每个作品
  2. 只需提交上去,不需要等待下载完成
  3. 根据队列类型创建自动化任务:

正常队列:创建自动化,10分钟后执行 闲时队列:创建自动化,次日7:00执行

自动化任务内容:轮询各作品状态,下载完成的视频到对应文件夹。

  1. 提交完成后展示最终列表(表格形式):
| # | 作品ID | 进程 | 下载地址 |
|---|--------|------|----------|
| 作品1 | xxxx | ⏳ 排队中 | 我的内容库(勿动)/13数字人作品/[队列]/[时间文件夹]/ |
| 作品2 | xxxx | ⏳ 排队中 | 同上 |
| ... | ... | ... | ... |
  1. 记录本次任务信息到 workspace memory(作品ID、对应文件夹路径、队列类型)