article
README
🚀 MCP 文本转语音服务器
MCP 文本转语音服务器是一款功能多样的文本转语音(TTS)服务器,基于模型上下文协议(MCP)框架构建。它通过统一接口,让用户能够访问多种 TTS 引擎,为用户提供了便捷且丰富的语音合成体验。
🚀 快速开始
MCP 文本转语音服务器能通过统一接口访问多种 TTS 引擎,使用前需完成安装与配置。
先决条件
- Python 3.10 或更高版本
- uv 包管理器
- 有效的 OpenAI API 密钥(适用于 OpenAI TTS)
安装步骤
- 使用以下命令克隆仓库:
git clone https://github.com/your-repository.git
cd your-repository
- 安装依赖项:
pip install -r requirements.txt
- 根据需要配置
.env文件,如下所示:
OPENAI_API_KEY=your_api_key_here
- 启动服务器:
uv run python tts_mcp.py
配置说明
- 将
your_api_key_here替换为实际的 OpenAI API 密钥 - 确保 Python 环境满足最低版本要求(3.10+)
✨ 主要特性
- 🌐 多种 TTS 引擎统一在一个服务器中
- 🎧 实时音频流播放
- 🔄 MCP 协议支持,与 Claude 和其他 LLM 无缝集成
- 🎛️ 可配置的语音选择(适用于两种引擎)
- 💬 通过自然语言指令实现声音定制(OpenAI)
- ⚡ 调整播放速度(适用于两种引擎)
- 🛑 播放控制,支持停止音频和清空队列
📦 安装指南
先决条件
- Python 3.10 或更高版本
- uv 包管理器
- 有效的 OpenAI API 密钥(适用于 OpenAI TTS)
安装步骤
- 使用以下命令克隆仓库:
git clone https://github.com/your-repository.git
cd your-repository
- 安装依赖项:
pip install -r requirements.txt
- 根据需要配置
.env文件,如下所示:
OPENAI_API_KEY=your_api_key_here
- 启动服务器:
uv run python tts_mcp.py
💻 使用示例
启动服务器
# 使用uv运行环境管理器启动
uv run python tts_mcp.py
# 或者使用简化的Kokoro-only版本
uv run python simple_tts_mcp.py
此命令将启动 MCP 服务器,使其可供连接和使用。
📚 详细文档
与 Claude Desktop 集成
此服务器设计用于与 Claude Desktop 或其他支持 MCP 协议的应用程序协同工作。无需额外配置即可直接使用。
MCP 函数定义
tts_mcp.py
tts_main()
- 接受输入参数:
text(要转换的文本)、voice(选择语音,默认为 "default") - 支持以下命令参数:
--af-synthesis: 使用文件生成语音--stream: 启用音频流播放
tts_streaming()
- 实现了基于 OpenAI 的实时 TTS 功能,支持多种语言和语音风格。
可用语音
Kokoro TTS
- 默认语音:
af_heart
OpenAI TTS
- 可用语音:
alloy,ash,ballad,coral,echo,fable,onyx,nova,sage,shimmer - 默认模型:
gpt-4o-mini-tts
开发与测试
本地调试
fastmcp dev ./tts_mcp.py
此命令启动 MCP Inspector 界面,方便开发者测试服务器功能。
故障排除
遇到问题时,请参考以下常见解决方案:
- 无音频输出:检查系统音频配置
- OpenAI TTS 失败:确认 API 密钥有效且具有 TTS 权限
- 服务器未找到:确保 MCP 服务器已正确注册在您的 MCP 宿主中
📄 许可证
此项目遵循 Apache License 2.0 协议,具体条款请参阅 LICENSE 文件。
贡献指南
欢迎贡献!请随意提交 Pull Request。
微信扫一扫