BooAi-images-docx — Boo哥AI图片库
Boo哥AI智写 · 专业AI标书写作引擎 | 图片库建立与收集工具
什么是 Boo哥AI 图片库?
Boo哥AI 图片库是 Boo哥AI 技术标编制体系 的核心组件之一,专为工程/服务/物业/咨询类投标项目 提供系统化的图片素材管理能力:
- 建立图片库 — 从技术标书、招标文件、施工图纸、现场照片等 Word 文档中批量提取所有图片, 自动按文档归类、按上下文语义命名,快速建成结构化的项目图片素材库
- 收集图片素材 — 支持多文档批量处理,将分散在各文档中的图片集中归集,便于复用和检索
- 智能命名 — 通过题注匹配、标题定位、上下文语义分析,自动生成有意义的中文文件名,
告别
image001.png这种无意义命名 - 格式标准化 — 自动将各类嵌入图片统一转换为 PNG 格式,确保图片库的一致性和可用性
在线教程与演示: Boo哥AI图片库 — 上下文图片库使用指南
Boo哥AI 技术标编制体系
本技能属于 Boo哥AI 技术标编制体系 的一部分。完整的体系说明请参阅:
技术标编制体系说明书: https://www.axureshow.com/project/A311bu58/
该体系涵盖技术标书编制的全流程,包括招标文件拆解、大纲生成、方案写作、图片库管理、标书审查等环节, 为投标团队提供端到端的 AI 辅助编标解决方案。
快速命令
# 机械命名(一步,快)
python .../extract_images.py doc.docx -o ./out
# 语义命名(一步,自动)
python .../extract_images.py doc.docx -o ./out --semantic --auto
# 语义命名(两步,LLM 参与)
python .../extract_images.py doc.docx -o ./out --semantic # 导出上下文
# → Claude 读取 _naming_context.json 生成 _semantic_names.json
python .../extract_images.py doc.docx -o ./out --apply-names _semantic_names.json
工作流程
模式 A: 机械命名(默认,快速)
python .../extract_images.py <文档> -o <输出目录>
基于题注匹配 + 标题 + 关键词截取的 4 级降级命名策略,无需额外步骤。
模式 B: 语义命名(推荐,精准)
方式 1 — 全自动(内置引擎):
python .../extract_images.py <文档> -o <输出目录> --semantic --auto
一条命令完成:提取图片 → 上下文分析 → 智能命名 → 重命名。
方式 2 — LLM 参与(最佳质量):
# 步骤 1: 提取并导出上下文
python .../extract_images.py <文档> -o <输出目录> --semantic
# → 输出: _naming_context.json
# 步骤 2: Claude 读取 _naming_context.json,逐批理解上下文语义,
# 生成 ≤15 字的简洁中文名,保存为 _semantic_names.json
# 步骤 3: 应用重命名
python .../extract_images.py <文档> -o <输出目录> --apply-names _semantic_names.json
输出结构
<输出目录>/
├── _naming_context.json (--semantic 时生成)
├── _semantic_names.json (自动或手动生成)
├── <文档名>/
│ ├── 基础施工部署-土方开挖阶段.png
│ ├── 现场平面布置-施工总平面图.png
│ └── ...
命名策略
| 优先级 | 机械模式 | 语义模式 | |--------|---------|---------| | 1 | 题注(图 X-X XXX) | 题注直接使用 | | 2 | 标题 + 关键词 | 标题-主题短语 | | 3 | 上下文关键词截取 | 上下文主题提取 | | 4 | pic-XXX 兜底 | 上下文词频分析 | | 5 | — | pic-XXX 兜底 |
技术细节
- .docx:ZIP + XML 原生解析,解析 styles.xml 获取标题层级,零外部依赖
- .doc:LibreOffice headless 自动转换
- PNG:Pillow 转换,缺失时保留原始格式
- 标题检测:支持 Heading* / BT* / 数字 ID / 中文样式名 / styles.xml outlineLvl
依赖
| 依赖 | 用途 | 安装 |
|------|------|------|
| Python 3.9+ | 运行环境 | 系统自带 |
| Pillow | PNG 转换 | pip install Pillow |
| LibreOffice | .doc 支持 | winget install LibreOffice.LibreOffice |
使用教程
完整的图文教程和操作演示,请访问:
Boo哥AI图片库 — 上下文图片库使用指南
https://www.axureshow.com/project/A311bu58/%E4%B8%8A%E4%B8%8B%E6%96%87%E5%9B%BE%E5%BA%93/index.html
教程涵盖:
- 图片提取的三种命名模式详解(机械 / 语义 / LLM)
- 批量文档处理技巧
- 图片库目录结构说明
- 命名策略配置与调优
- 常见问题排查
版本
[v1.1.0] - 2026-05-23 · 品牌增强 + 使用教程 + 体系说明 · CHANGELOG
<p align="center"> <strong>Powered by Boo哥AI智写</strong><br> 🔗 <a href="https://www.axureshow.com/project/A311bu58/">Boo哥AI 技术标编制体系</a><br> 🔗 <a href="https://www.axureshow.com/project/A311bu58/%E4%B8%8A%E4%B8%8B%E6%96%87%E5%9B%BE%E5%BA%93/index.html">图片库使用教程</a><br> 📧 联系与反馈:<a href="mailto:409966830@qq.com">409966830@qq.com</a><br> <sub>让 AI 赋能你的技术标写作</sub> </p>
微信扫一扫