金大哥 - AllVoiceLab-MCP MCP 详情

article

README

🚀 全声实验室模型上下文协议（MCP）服务器

全声实验室官方的模型上下文协议（MCP）服务器，支持与强大的文本转语音和视频翻译 API 进行交互。可让 Claude Desktop、Cursor、Windsurf、OpenAI Agents 等 MCP 客户端生成语音、翻译视频以及进行智能语音转换。适用于全球市场的短剧本地化、AI 生成有声读物、AI 驱动的影视旁白制作等场景。

🚀 快速开始

从全声实验室获取你的 API 密钥。
安装 uv（Python 包管理器），使用命令 curl -LsSf https://astral.sh/uv/install.sh | sh 进行安装。
重要提示：不同地区的 API 服务器地址需要与相应地区的密钥匹配，否则会出现工具不可用的错误。

| 地区 | 全球 | 中国大陆 | | ---- | ---- | ---- | | ALLVOICELAB_API_KEY | 从全声实验室获取 | 从全声实验室获取 | | ALLVOICELAB_API_DOMAIN | https://api.allvoicelab.com | https://api.allvoicelab.cn |

Claude Desktop

前往 Claude > 设置 > 开发者 > 编辑配置 > claude_desktop_config.json，添加以下内容：

{
  "mcpServers": {
    "AllVoiceLab": {
      "command": "uvx",
      "args": ["allvoicelab-mcp"],
      "env": {
        "ALLVOICELAB_API_KEY": "<在此插入你的 API 密钥>",
        "ALLVOICELAB_API_DOMAIN": "<在此插入 API 域名>",
        "ALLVOICELAB_BASE_PATH": "可选，默认为用户主目录。用于存储输出文件。"
      }
    }
  }
}

如果你使用的是 Windows 系统，需要在 Claude Desktop 中启用“开发者模式”才能使用 MCP 服务器。点击左上角汉堡菜单中的“帮助”，选择“启用开发者模式”。

Cursor

前往 Cursor -> 偏好设置 -> Cursor 设置 -> MCP -> 添加新的全局 MCP 服务器，添加上述配置。

完成以上操作后，你的 MCP 客户端就可以与全声实验室进行交互了。

✨ 主要特性

多引擎技术开启无限语音可能：只需简单输入文本，即可实现视频生成、语音合成、语音克隆等功能。
AI 语音生成器（TTS）：支持 30 多种语言的自然语音生成，超高度逼真。
语音转换器：实时语音转换，适用于游戏、直播和隐私保护场景。
人声分离：超快速 5 毫秒分离人声和背景音乐，精度行业领先。
多语言配音：一键为短视频/电影进行翻译和配音，保留情感语调与节奏。
语音转文本（STT）：AI 驱动的多语言字幕生成，准确率超过 98%。
字幕去除：无缝擦除硬字幕，即使在复杂背景下也能完美处理。
语音克隆：3 秒超快速克隆，合成逼真人声。

📚 详细文档

中文文档

💻 使用示例

⚠️ 重要提示

使用这些工具需要全声实验室的积分。

基础用法

1. 文本转语音

尝试询问：将“At All Voice Lab, we’re reshaping the future of audio workflows with AI-powered solutions, making authentic voices accessible to creators everywhere.”转换为语音。

2. 语音转换

在生成上一个示例的音频后，选择该音频文件并询问：将其转换为男性语音。

3. 去除背景噪音

选择一个包含丰富声音（同时包含背景音乐和人声）的音频文件并询问：去除背景噪音。

4. 语音克隆

选择一个单一人声的音频文件并询问：克隆此语音。

5. 视频翻译

选择一个视频文件（英文）并询问：将此视频翻译成日语。

原始视频：

翻译后：

6. 去除字幕

选择一个带有字幕的视频并询问：去除此视频中的硬字幕。

原始视频：

任务完成后：

7. 文本翻译

选择一段长文本（例如“愚公移山”）并询问：将此文本翻译成日语。如果未指定语言，默认将其翻译成英语。

8. 字幕提取

选择一个带有字幕的视频并询问：从此视频中提取字幕。

任务完成后，你将得到一个 SRT 文件，如下所示：

🔧 可用方法

| 方法 | 简要描述 | | ---- | ---- | | text_to_speech | 将文本转换为语音 | | speech_to_speech | 在保留语音内容的同时将音频转换为另一种声音 | | isolate_human_voice | 通过去除背景噪音和非语音声音提取纯净的人声 | | clone_voice | 通过从音频样本中克隆创建自定义语音配置文件 | | remove_subtitle | 使用 OCR 技术从视频中去除硬字幕 | | video_translation_dubbing | 将视频语音翻译成不同语言并进行配音 | | text_translation | 将文本文件翻译成另一种语言 | | subtitle_extraction | 使用 OCR 技术从视频中提取字幕 |

📄 许可证

请参考许可证文件。

🔧 故障排除

日志文件位置如下：

Windows：C:\Users<用户名>.mcp\allvoicelab_mcp.log
macOS：~/.mcp/allvoicelab_mcp.log

请将日志文件通过电子邮件（tech@allvoicelab.com）联系我们。

AllVoiceLab-MCP