返回 Skill 列表
extension
分类: 数据与分析无需 API Key

Excel 数据自动清洗引擎 Pro

Excel 数据自动清洗引擎:自动去重、格式统一、缺失值处理、智能分类、交叉验证。 输入脏数据,输出干净报表。 支持 CSV/XLSX/JSON。 适用于财务、运营、数据分析师、电商卖家。

person作者: lijinhao123-dothubclawhub

Excel 数据自动清洗引擎

别再手动清理数据了,AI 比你快 100 倍

能做什么

  • 🧹 自动去重 — 按单列或多列去重,智能识别相似重复
  • 📐 格式统一 — 日期/电话/地址/金额...自动标准化
  • 🔧 缺失值处理 — 智能填充/标记/删除空值
  • 🏷️ 智能分类 — 根据内容自动打标签/归类
  • 交叉验证 — 检查数据逻辑(比如金额=单价×数量)
  • 📊 输出报表 — 生成清洗前后对比 + 数据质量评分

触发方式

用户说以下任意关键词时加载此技能:

  • "清洗数据" "整理表格" "处理 Excel"
  • "去重" "数据太乱" "帮我看这个表"

使用流程

第一步:读数据

让用户提供文件路径或粘贴数据。

  • read 直接读文件(CSV/TXT/JSON)
  • Excel 用 Python openpyxl 解析

第二步:体检报告

自动扫描并输出数据质量报告:

📊 数据体检报告
━━━━━━━━━━━━━━━
总行数:12,847
总列数:18
重复行:342 (2.7%)
缺失值:156 处
   - 价格列:23 个空值
   - 日期列:89 个格式错误
   - 手机号列:44 个不规范
异常值:12 处(价格负数、日期未来)
数据质量分:82/100 ⚠️

第三步:自动清洗

按发现的问题逐项处理:

  1. 去重 — 保留第一条或按业务规则合并
  2. 日期标准化 — 统一为 YYYY-MM-DD 格式
  3. 电话标准化 — 统一为纯数字或格式化
  4. 金额清洗 — 去除货币符号/空格,统一小数位
  5. 空值处理 — 数值列填中位数、分类列填"未知"
  6. 异常值标记 — 标记可疑数据但不删除

第四步:输出清洗结果

保存清洗后的文件:

  • 原文件名_cleaned.xlsx(干净数据)
  • 原文件名_report.md(清洗报告,记录了改了什么)

第五步:可选拓展

用户可以说:

  • "再帮我分类" → 对某列 AI 自动分类
  • "生成图表" → 自动生成柱状图/折线图/饼图
  • "导出飞书表格" → 写入飞书多维表格

工具使用

  • read — 读取原始数据文件
  • exec — 运行 Python openpyxl/pandas 处理
  • write — 写出清洗后的文件
  • web_search — 辅助数据验证(如手机号归属地)

常用清洗规则(内置)

| 列类型 | 规则 | |--------|------| | 手机号 | 去空格、统一 11 位、验证格式 | | 日期 | 统一 YYYY-MM-DD、修复乱码日期 | | 金额 | 去货币符号、统一小数、检测异常 | | 地址 | 提取省市区、补充邮编 | | 姓名 | 去空格、统一大小写 | | 身份证 | 验证校验位、提取生日性别 |

客户画像

  • 做财务/报表的运营
  • 每天要处理供应商报价的采购
  • 电商卖家(批量处理订单/商品数据)
  • 数据分析新人(不想写 Python)

定价参考

本技能模板在 ClawHub 建议售价:39-69 元 搭配定制化清洗规则:129 元


由 OpenClaw 技能工厂制作 | 2026.05