README
🚀 香蕉图像MCP
香蕉图像MCP是一个基于MCP(模型上下文协议)的服务器,它能让Claude等AI助手借助谷歌最新的Gemini图像模型生成高质量图像。你只需描述需求,Claude就能从快速概念草图到惊艳的4K专业艺术作品,满足你的多样创作需求。
🚀 快速开始
在不到2分钟的时间内启动并运行。
前提条件
- 从 Google AI Studio 获取一个免费的Gemini API密钥。
- 安装 Claude Desktop。
安装
添加到你的Claude Desktop配置文件中:
{
"mcpServers": {
"banana-image": {
"command": "uvx",
"args": ["banana-image-mcp"],
"env": {
"GEMINI_API_KEY": "your-api-key-here"
}
}
}
}
📁 配置文件位置
| 平台 | 路径 |
|----------|------|
| macOS | ~/Library/Application Support/Claude/claude_desktop_config.json |
| Windows | %APPDATA%\Claude\claude_desktop_config.json |
| Linux | ~/.config/Claude/claude_desktop_config.json |
🔄 更新到最新版本
使用 uvx 时,包会在本地缓存。要获取最新版本:
# 清除此包的缓存
uv cache clean banana-image-mcp
# 然后重启Claude Desktop
或者在你的配置中明确指定版本:
"args": ["banana-image-mcp==1.0.1"]
🔌 其他MCP客户端(Cursor、VS Code、Cline等)
其他支持MCP的客户端配置相同。只需将服务器配置添加到客户端的MCP配置文件中。
✨ 主要特性
4K超高清输出
专业版模型可生成高达 3840px 的图像,非常适合专业工作、营销材料和印刷品。
双模型支持
- 快速版:2 - 3秒,最高1024px,适用于快速迭代。
- 专业版:5 - 8秒,最高4K,适用于最终交付物。
智能模型选择
服务器会根据你的提示自动选择最佳模型。说“快速草图”使用快速版,说“4K专业”使用专业版。
谷歌搜索知识融合
专业版模型利用谷歌搜索的真实世界知识生成更准确、符合事实的图像。
灵活的纵横比
支持所有常见比例:1:1、16:9、9:16、4:3、3:2、21:9 等。
自然语言编辑
使用简单的文本命令(如“让天空更有戏剧性”或“去除背景”)编辑现有图像。
📦 安装指南
见快速开始部分的安装步骤。
💻 使用示例
基础用法
只需自然地要求Claude生成图像:
"生成一只穿着宇航服的可爱猫咪"
"创建一张4K质量的咖啡杯专业产品照片"
"制作一个16:9的烹饪主题YouTube缩略图"
"编辑这张图片:让天空更有戏剧性"
模型比较
| 模型 | 速度 | 最大分辨率 | 适用场景 | |-------|-------|----------------|----------| | Gemini 2.5 快速版 | 2 - 3秒 | 1024px | 快速草稿、迭代、原型 | | Gemini 3 专业版 | 5 - 8秒 | 4K (3840px) | 最终资产、营销、专业工作 |
服务器默认使用专业版模型以获得最佳质量。可以使用关键词控制: | 输入内容... | 使用的模型 | |-------------|------------| | "快速草图"、"草稿"、"原型" | 快速版 | | "4K"、"专业"、"高质量" | 专业版 | | (默认) | 专业版 |
参数参考
| 参数 | 类型 | 默认值 | 描述 |
|-----------|------|---------|-------------|
| prompt | 字符串 | 必需 | 图像描述 |
| model_tier | 字符串 | "pro" | "flash"、"pro" 或 "auto" |
| resolution | 字符串 | "4k" | "1k"、"2k"、"4k"、"high" |
| aspect_ratio | 字符串 | - | "1:1"、"16:9"、"9:16"、"4:3"、"21:9" 等 |
| thinking_level | 字符串 | "high" | "low" 或 "high"(仅专业版) |
| enable_grounding | 布尔值 | true | 启用谷歌搜索知识融合(仅专业版) |
| n | 整数 | 1 | 图像数量(1 - 4) |
| negative_prompt | 字符串 | - | 图像中要避免的内容 |
环境变量
| 变量 | 是否必需 | 默认值 | 描述 |
|----------|----------|---------|-------------|
| GEMINI_API_KEY | 是 | - | 你的Gemini API密钥 |
| IMAGE_OUTPUT_DIR | 否 | ~/banana-images | 生成图像的保存位置 |
📚 详细文档
可创作内容
| 创作类型 | 说明 | | ---- | ---- | | 产品摄影 | 具有专业摄影棚灯光效果的照片 | | 概念艺术 | 奇幻风景、角色设计等 | | 营销材料 | 社交图形、横幅、缩略图等 | | 技术图表 | 流程图、架构图等 | | 逼真图像 | 肖像、自然、城市摄影等 | | UI/UX原型 | 应用界面、网页设计等 |
路线图
- [x] 4K分辨率输出(最高3840px)
- [x] 双模型支持(快速版 + 专业版)
- [x] 谷歌搜索知识融合
- [x] 灵活的纵横比
- [x] 自然语言图像编辑
- [x] GitHub Actions CI/CD
- [ ] 批量图像生成
- [ ] 图像到图像转换
- [ ] 视频生成支持
- [ ] 本地模型支持(Ollama)
查看 开放问题 以获取完整的提议功能和已知问题列表。
🔧 技术细节
开发
# 克隆仓库
git clone https://github.com/zengwenliang416/banana-image-mcp.git
cd banana-image-mcp
# 安装依赖
uv sync
# 在开发模式下运行
fastmcp dev banana_image_mcp.server:create_app
# 运行测试
pytest
# 代码检查和格式化
ruff check .
ruff format .
📄 许可证
本项目采用MIT许可证进行分发。有关更多信息,请参阅 LICENSE 文件。
联系我们
曾文亮 - @zengwenliang416
项目链接: https://github.com/zengwenliang416/banana-image-mcp
致谢
- FastMCP - 为该服务器提供支持的MCP框架。
- Google Gemini - 图像生成背后的AI模型。
- Anthropic MCP - 协议规范。
- Best-README-Template - README灵感来源。
微信扫一扫