返回 MCP 目录
public公开dns本地运行

banana-image-mcp

Banana Image MCP是一个基于MCP协议的AI图像生成服务器,让Claude等助手能够使用Google Gemini模型生成高质量图像,支持4K分辨率和智能模型选择。

article

README

🚀 香蕉图像MCP

香蕉图像MCP是一个基于MCP(模型上下文协议)的服务器,它能让Claude等AI助手借助谷歌最新的Gemini图像模型生成高质量图像。你只需描述需求,Claude就能从快速概念草图到惊艳的4K专业艺术作品,满足你的多样创作需求。

🚀 快速开始

在不到2分钟的时间内启动并运行。

前提条件

安装

添加到你的Claude Desktop配置文件中:

{
  "mcpServers": {
    "banana-image": {
      "command": "uvx",
      "args": ["banana-image-mcp"],
      "env": {
        "GEMINI_API_KEY": "your-api-key-here"
      }
    }
  }
}
📁 配置文件位置

| 平台 | 路径 | |----------|------| | macOS | ~/Library/Application Support/Claude/claude_desktop_config.json | | Windows | %APPDATA%\Claude\claude_desktop_config.json | | Linux | ~/.config/Claude/claude_desktop_config.json |

🔄 更新到最新版本

使用 uvx 时,包会在本地缓存。要获取最新版本:

# 清除此包的缓存
uv cache clean banana-image-mcp

# 然后重启Claude Desktop

或者在你的配置中明确指定版本:

"args": ["banana-image-mcp==1.0.1"]
🔌 其他MCP客户端(Cursor、VS Code、Cline等)

其他支持MCP的客户端配置相同。只需将服务器配置添加到客户端的MCP配置文件中。

✨ 主要特性

4K超高清输出

专业版模型可生成高达 3840px 的图像,非常适合专业工作、营销材料和印刷品。

双模型支持

  • 快速版:2 - 3秒,最高1024px,适用于快速迭代。
  • 专业版:5 - 8秒,最高4K,适用于最终交付物。

智能模型选择

服务器会根据你的提示自动选择最佳模型。说“快速草图”使用快速版,说“4K专业”使用专业版。

谷歌搜索知识融合

专业版模型利用谷歌搜索的真实世界知识生成更准确、符合事实的图像。

灵活的纵横比

支持所有常见比例:1:116:99:164:33:221:9 等。

自然语言编辑

使用简单的文本命令(如“让天空更有戏剧性”或“去除背景”)编辑现有图像。

📦 安装指南

见快速开始部分的安装步骤。

💻 使用示例

基础用法

只需自然地要求Claude生成图像:

"生成一只穿着宇航服的可爱猫咪"
"创建一张4K质量的咖啡杯专业产品照片"
"制作一个16:9的烹饪主题YouTube缩略图"
"编辑这张图片:让天空更有戏剧性"

模型比较

| 模型 | 速度 | 最大分辨率 | 适用场景 | |-------|-------|----------------|----------| | Gemini 2.5 快速版 | 2 - 3秒 | 1024px | 快速草稿、迭代、原型 | | Gemini 3 专业版 | 5 - 8秒 | 4K (3840px) | 最终资产、营销、专业工作 |

服务器默认使用专业版模型以获得最佳质量。可以使用关键词控制: | 输入内容... | 使用的模型 | |-------------|------------| | "快速草图"、"草稿"、"原型" | 快速版 | | "4K"、"专业"、"高质量" | 专业版 | | (默认) | 专业版 |

参数参考

| 参数 | 类型 | 默认值 | 描述 | |-----------|------|---------|-------------| | prompt | 字符串 | 必需 | 图像描述 | | model_tier | 字符串 | "pro" | "flash""pro""auto" | | resolution | 字符串 | "4k" | "1k""2k""4k""high" | | aspect_ratio | 字符串 | - | "1:1""16:9""9:16""4:3""21:9" 等 | | thinking_level | 字符串 | "high" | "low""high"(仅专业版) | | enable_grounding | 布尔值 | true | 启用谷歌搜索知识融合(仅专业版) | | n | 整数 | 1 | 图像数量(1 - 4) | | negative_prompt | 字符串 | - | 图像中要避免的内容 |

环境变量

| 变量 | 是否必需 | 默认值 | 描述 | |----------|----------|---------|-------------| | GEMINI_API_KEY | | - | 你的Gemini API密钥 | | IMAGE_OUTPUT_DIR | 否 | ~/banana-images | 生成图像的保存位置 |

📚 详细文档

可创作内容

| 创作类型 | 说明 | | ---- | ---- | | 产品摄影 | 具有专业摄影棚灯光效果的照片 | | 概念艺术 | 奇幻风景、角色设计等 | | 营销材料 | 社交图形、横幅、缩略图等 | | 技术图表 | 流程图、架构图等 | | 逼真图像 | 肖像、自然、城市摄影等 | | UI/UX原型 | 应用界面、网页设计等 |

路线图

  • [x] 4K分辨率输出(最高3840px)
  • [x] 双模型支持(快速版 + 专业版)
  • [x] 谷歌搜索知识融合
  • [x] 灵活的纵横比
  • [x] 自然语言图像编辑
  • [x] GitHub Actions CI/CD
  • [ ] 批量图像生成
  • [ ] 图像到图像转换
  • [ ] 视频生成支持
  • [ ] 本地模型支持(Ollama)

查看 开放问题 以获取完整的提议功能和已知问题列表。

🔧 技术细节

开发

# 克隆仓库
git clone https://github.com/zengwenliang416/banana-image-mcp.git
cd banana-image-mcp

# 安装依赖
uv sync

# 在开发模式下运行
fastmcp dev banana_image_mcp.server:create_app

# 运行测试
pytest

# 代码检查和格式化
ruff check .
ruff format .

📄 许可证

本项目采用MIT许可证进行分发。有关更多信息,请参阅 LICENSE 文件。

联系我们

曾文亮 - @zengwenliang416

项目链接: https://github.com/zengwenliang416/banana-image-mcp

致谢

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端