senior-computer-vision
计算机视觉工程技术,用于物体检测、图像分割和视觉AI系统。涵盖CNN和视觉转换器架构、YOLO/Faster R-CNN/DETR检测、Mask R-CNN/SAM分割以及使用ONNX/TensorRT进行生产部署。包括PyTorch、torchvision、Ultralytics、Detectron2和MMDetection框架。在构建检测流水线、训练自定义模型、优化推理或部署视觉系统时使用。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
计算机视觉工程技术,用于物体检测、图像分割和视觉AI系统。涵盖CNN和视觉转换器架构、YOLO/Faster R-CNN/DETR检测、Mask R-CNN/SAM分割以及使用ONNX/TensorRT进行生产部署。包括PyTorch、torchvision、Ultralytics、Detectron2和MMDetection框架。在构建检测流水线、训练自定义模型、优化推理或部署视觉系统时使用。
根据广告脚本创建包含2-4秒元素、B-roll规格和AI生成提示的详细故事板。在为编辑准备脚本、规划视频拍摄或生成可用于制作的创意规格时使用。
车牌识别集成。管理车辆、摄像头、区域、用户、警报。当用户想要与车牌识别数据交互时使用。
ScoreDetect集成。管理组织。当用户想要与ScoreDetect数据交互时使用。
使用此技能来创建播客剧集、访谈、对话和对话风格的音频。触发词:"create podcast"(创建播客)、"podcast episode"(播客剧集)、"interview audio"(访谈音频)、"dialogue"(对话)、"conversation"(交谈)、"two hosts discussing"(两位主持人讨论)、"audio show"(音频节目)、"radio show"(…
使用此技能分析产品评论,找出常见问题,并优先考虑改进。触发词:"analyze reviews", "review analysis", "customer feedback", "what are people saying", "product reviews", "review sentiment", "find complaints", "customer complaints", "im…
crebee-social-media-gateway
给视频烧录字幕。支持从本地视频自动提取文字稿(FunASR 词级时间轴),也支持手动提供 LRC/ASS 字幕文件。语种自动识别,中文字幕自动启用中英双语模式。支持目录批量处理。6种系统字体 + 本地fonts/目录自动发现,字体偏好自动记忆,6种颜色。触发词:视频加字幕、添加字幕、烧录字幕、给视频配字幕、加字幕、字幕烧录、生成字幕视频、批量加字幕、批量烧录、目录加字幕。
实现苏格拉底式引导教学,通过提问引导学生思考,支持7种引导类型和错误类型映射。
将抽象/隐喻性的叙述转化为具体的视觉故事结构。使用场景:当需要将诗歌/戏剧性叙述从多样内容生成转换为逐场视觉分解,以便进行编剧格式化时。管道位置:多样内容生成 → **叙述者** → 编剧 → 生产验证者 → 想象 → 存档-验证 主要功能:在“私人祭坛”(抽象隐喻)与“女子每天回到同一个海滩地点”(可拍摄场景)之间架起桥梁。输出:具有具体视觉动作、保留情感核心及故事逻辑文档的场景分解。
Roboflow集成。管理项目。当用户想要与Roboflow数据交互时使用。
通过x402进行AI电话呼叫、购买电话号码并获取通话记录。用途:- 进行由AI驱动的外拨电话- 安排电话和获取通话记录- 购买和管理电话号码- 留下语音邮件- 将电话转接到人工触发词:- “call”、“phone call”、“make a call”、“dial”- “buy number”、“phone number”、“get a number”- “voicemail”、“leave a…
使用此技能进行AI文本转语音生成。触发词包括:“generate voice”、“create audio”、“text to speech”、“TTS”、“read this aloud”、“generate narration”、“create voiceover”、“synthesize speech”、“podcast audio”、“dialogue audio”、“multi-spea…
模拟一个专家小组讨论某个话题。根据上下文建议3位相关专家/角色,让他们辩论方法、权衡利弊,并最终提出建议。在头脑风暴、探索设计方案或希望从多个专家角度看待问题时使用。
使用Seedance模型生成视频。当用户希望从文本提示、图片或参考资料创建视频时调用。
知识库的搜索自动完成功能和类型前缀建议优化
翻译视频字幕(SRT、VTT、TXT)之间的语言。支持批量翻译并保持时间同步。在创建多语言字幕、扩展到国际观众或翻译视频记录时使用。
为4格工程师幽默漫画生成Nano Banana Pro提示。当用户提到“漫画作成”、“エンジニア漫画”、“4コマ”或“あるある”时使用。
Rosette文本分析集成。管理组织。当用户想要与Rosette文本分析数据交互时使用。
使用代理团队进行对抗性头脑风暴,以实现多角度分析。当用户希望对独立观点之间进行充分的想法探索和真实辩论时使用。在“团队头脑风暴”、“对抗性头脑风暴”、“与团队一起头脑风暴”、“辩论这个想法”或用户明确要求基于团队的分析时触发。虽然比单个代理头脑风暴的成本更高,但分析深度显著增加。
使用此技能可以创建带有旁白和音乐的完整视频。触发词:"创建视频","产品视频","解释视频","宣传视频","演示视频","培训视频","广告视频","商业广告","营销视频","带旁白的视频","带音乐的视频","品牌视频","推荐视频"。协调内容包括:脚本、旁白、背景音乐、视频片段/图片以及最终组装。
使用Deepgram Nova-2 API转录音频文件(ogg/mp3/wav/m4a/webm)。当用户发送语音消息或要求转录音频时使用。
微信公众号(WeChat Official Accounts)公开内容查询与文章分析 skill,通过 MaxHub API 查询公众号文章、账号信息、评论、阅读互动、视频/媒体相关数据和搜索能力。适合公众号内容选题、舆情分析、账号画像、评论研究和媒体监控。默认 read-only,但部分媒体/评论数据具有隐私和版权敏感性;agent 应按 recipes 调用并遵守数据最小化与授权边界。所有请求…
由AI驱动的OpenClaw会话上下文管理