返回 MCP 目录
public公开dns本地运行

AllVoiceLab-MCP

AllVoiceLab官方MCP服务器,支持文本转语音、视频翻译等强大API交互,为多款客户端提供语音生成、视频翻译及智能变声服务。

article

README

🚀 全声实验室模型上下文协议(MCP)服务器

全声实验室官方的模型上下文协议(MCP)服务器,支持与强大的文本转语音和视频翻译 API 进行交互。可让 Claude Desktop、Cursor、Windsurf、OpenAI Agents 等 MCP 客户端生成语音、翻译视频以及进行智能语音转换。适用于全球市场的短剧本地化、AI 生成有声读物、AI 驱动的影视旁白制作等场景。

🚀 快速开始

  1. 全声实验室 获取你的 API 密钥。
  2. 安装 uv(Python 包管理器),使用命令 curl -LsSf https://astral.sh/uv/install.sh | sh 进行安装。
  3. 重要提示:不同地区的 API 服务器地址需要与相应地区的密钥匹配,否则会出现工具不可用的错误。

| 地区 | 全球 | 中国大陆 | | ---- | ---- | ---- | | ALLVOICELAB_API_KEY | 从 全声实验室 获取 | 从 全声实验室 获取 | | ALLVOICELAB_API_DOMAIN | https://api.allvoicelab.com | https://api.allvoicelab.cn |

Claude Desktop

前往 Claude > 设置 > 开发者 > 编辑配置 > claude_desktop_config.json,添加以下内容:

{
  "mcpServers": {
    "AllVoiceLab": {
      "command": "uvx",
      "args": ["allvoicelab-mcp"],
      "env": {
        "ALLVOICELAB_API_KEY": "<在此插入你的 API 密钥>",
        "ALLVOICELAB_API_DOMAIN": "<在此插入 API 域名>",
        "ALLVOICELAB_BASE_PATH": "可选,默认为用户主目录。用于存储输出文件。"
      }
    }
  }
}

如果你使用的是 Windows 系统,需要在 Claude Desktop 中启用“开发者模式”才能使用 MCP 服务器。点击左上角汉堡菜单中的“帮助”,选择“启用开发者模式”。

Cursor

前往 Cursor -> 偏好设置 -> Cursor 设置 -> MCP -> 添加新的全局 MCP 服务器,添加上述配置。

完成以上操作后,你的 MCP 客户端就可以与全声实验室进行交互了。

✨ 主要特性

  • 多引擎技术开启无限语音可能:只需简单输入文本,即可实现视频生成、语音合成、语音克隆等功能。
  • AI 语音生成器(TTS):支持 30 多种语言的自然语音生成,超高度逼真。
  • 语音转换器:实时语音转换,适用于游戏、直播和隐私保护场景。
  • 人声分离:超快速 5 毫秒分离人声和背景音乐,精度行业领先。
  • 多语言配音:一键为短视频/电影进行翻译和配音,保留情感语调与节奏。
  • 语音转文本(STT):AI 驱动的多语言字幕生成,准确率超过 98%。
  • 字幕去除:无缝擦除硬字幕,即使在复杂背景下也能完美处理。
  • 语音克隆:3 秒超快速克隆,合成逼真人声。

📚 详细文档

中文文档

💻 使用示例

⚠️ 重要提示

使用这些工具需要全声实验室的积分。

基础用法

1. 文本转语音

尝试询问:将“At All Voice Lab, we’re reshaping the future of audio workflows with AI-powered solutions, making authentic voices accessible to creators everywhere.”转换为语音。

image

2. 语音转换

在生成上一个示例的音频后,选择该音频文件并询问:将其转换为男性语音。

image

3. 去除背景噪音

选择一个包含丰富声音(同时包含背景音乐和人声)的音频文件并询问:去除背景噪音。

image

4. 语音克隆

选择一个单一人声的音频文件并询问:克隆此语音。

image

5. 视频翻译

选择一个视频文件(英文)并询问:将此视频翻译成日语。

image

原始视频:

image

翻译后:

image

6. 去除字幕

选择一个带有字幕的视频并询问:去除此视频中的硬字幕。

image

原始视频:

image

任务完成后:

image

7. 文本翻译

选择一段长文本(例如“愚公移山”)并询问:将此文本翻译成日语。如果未指定语言,默认将其翻译成英语。

image

8. 字幕提取

选择一个带有字幕的视频并询问:从此视频中提取字幕。

image

任务完成后,你将得到一个 SRT 文件,如下所示:

image

🔧 可用方法

| 方法 | 简要描述 | | ---- | ---- | | text_to_speech | 将文本转换为语音 | | speech_to_speech | 在保留语音内容的同时将音频转换为另一种声音 | | isolate_human_voice | 通过去除背景噪音和非语音声音提取纯净的人声 | | clone_voice | 通过从音频样本中克隆创建自定义语音配置文件 | | remove_subtitle | 使用 OCR 技术从视频中去除硬字幕 | | video_translation_dubbing | 将视频语音翻译成不同语言并进行配音 | | text_translation | 将文本文件翻译成另一种语言 | | subtitle_extraction | 使用 OCR 技术从视频中提取字幕 |

📄 许可证

请参考 许可证文件

🔧 故障排除

日志文件位置如下:

  • Windows:C:\Users<用户名>.mcp\allvoicelab_mcp.log
  • macOS:~/.mcp/allvoicelab_mcp.log

请将日志文件通过电子邮件(tech@allvoicelab.com)联系我们。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端