返回 MCP 目录
public公开dns本地运行

ScreenPilot

ScreenPilot是一个通过MCP服务器让LLM全面控制设备的工具,提供屏幕自动化工具包,支持屏幕捕获、鼠标键盘控制等功能,适用于自动化、教育和娱乐。

article

README

🚀 屏幕控制专家

屏幕控制专家借助MCP服务器,让大语言模型得以全面掌控你的设备。它提供了屏幕自动化工具包,可对图形用户界面进行控制和交互,在自动化、教育和娱乐等领域都能发挥重要作用。

🚀 快速开始

按照以下步骤操作,即可开启屏幕控制专家的使用之旅。

✨ 主要特性

  • 📷 屏幕捕获与分析
  • 🖱️ 鼠标控制(点击、定位)
  • ⌨️ 键盘输入(打字、按键、热键)

📦 安装指南

  1. 安装Python 3.12。
  2. 克隆仓库:
git clone https://github.com/Mtehabsim/ScreenPilot.git
  1. 创建虚拟环境:
python -m venv venv
  1. 激活虚拟环境:
venv\Scripts\activate
  1. 安装所需包:
pip install -r requirements.txt
  1. 打开Claude AI桌面。
  2. 依次点击“文件” -> “设置” -> “开发者” -> “编辑配置”。
  3. 打开配置文件并粘贴以下内容:
{
    "mcpServers": {
        "device-controll": {
            "command": "pathToEnv\\venv\\Scripts\\python.exe",
            "args": [
                "pathToProject\\ScreenPilot\\main.py"
            ]
        }
    }
}
  1. 进行路径替换:
    • pathToEnv\\venv\\Scripts\\python.exe”替换为你的python.exe的完整路径。
    • pathToProject\\ScreenPilot\\main.py”替换为你的main.py文件的完整路径。
  2. 保存配置文件。
  3. 打开Claude AI桌面。
  4. 转到“文件” -> “退出”。
  5. 现在你可以打开Claude AI桌面并享受ScreenPilot。

可用工具

  • 屏幕捕获:截取屏幕并获取屏幕信息。
  • 鼠标控制:移动鼠标并执行点击。
  • 键盘操作:输入文本、按键和使用热键组合。
  • 滚动:在不同方向和具体位置进行滚动。
  • 元素检测:检查屏幕上是否存在元素并等待其出现。
  • 动作序列:按顺序执行多个动作。

🤝 贡献

欢迎大家为项目贡献力量!请随时提交Pull Request。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端