Audio Features Expert
与Leavn音频系统合作 - TTS、讲道录音、引导模式音频、环境声音、语音配置文件、音频编排
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
与Leavn音频系统合作 - TTS、讲道录音、引导模式音频、环境声音、语音配置文件、音频编排
当用户请求跨多个问题的自主操作时使用。协调并行工作人员,监控进度,处理SLEEP/WAKE周期,并在无需用户干预的情况下工作直到完成整个范围。
利用BigQuery Object Tables进行非结构化数据(音频、图像等)分析及构建Audio Analytics Agent的指南。涵盖GCS数据连接、元数据缓存、AI模型集成以及ADK代理实现模式。
使用omicverse的Bulk2Single工作流程,将批量RNA-seq队列转换为合成单细胞数据集,用于细胞比例估计、beta-VAE生成以及与参考scRNA-seq的质量控制比较。
通过使用二维码扫描、e-Kasa API 和 GPS 提取从收据照片创建检查点(10-40秒)
在通过ClaudeCollider MCP服务器使用SuperCollider进行音乐实时编码时使用。
协助进行图像分析、物体检测和视觉AI任务
管理大型语言模型上下文窗口的策略,包括摘要、修剪、路由以及避免上下文腐化。使用场景:上下文窗口、令牌限制、上下文管理、上下文工程、长上下文。
将人声、双耳音效和音效素材混音成最终母带
回测结果解释器和策略评估器。分析历史回测表现,识别优缺点,并提供可操作的策略改进建议。
当用户需要Claude不具备的能力(如图像生成、实时X/Twitter数据)或明确请求使用外部模型时(例如:“blockrun”、“use grok”、“use gpt”、“dall-e”、“deepseek”)
分析故事人物关系,识别类型、特点及发展变化。适用于深度理解人物关系网络、分析关系对情节推动作用、为情节设计提供关系支撑
从化学名称或SMILES生成2D结构图像和交互式3D查看器。支持2D的PNG/SVG输出和3D构象的3Dmol.js HTML查看器。
处理照片上传、分析和处理在Claude Code中的应用。当用户希望上传图片、分析截图、处理照片或在Claude Code对话中使用视觉内容时,应使用此技能。
搜索并从已导入的电影中提取片段。查询SRT字幕,根据时间戳提取视频片段,并跟踪场景上的Horus笔记。在/ingest-movie处理完内容后使用。
用于LLM对话的持久内存系统,包括短期记忆、长期记忆和基于实体的记忆。使用场景:对话记忆、记住、记忆持久性、长期记忆、聊天历史。
AI合作伙伴系统 - 专家选择与协作
从账单/收据图片中提取数据,并返回适用于午餐分账应用程序的JSON
使用Mem0、claude-mem或自定义实现为AI代理构建持久内存系统。当向代理添加对话记忆、用户偏好或上下文回忆时使用。涵盖内存架构模式、检索策略和隐私控制。不适用于RAG系统(请使用building-rag-systems)。
自动将处理过的媒体(音频转录和图片摘要)在正确的时间戳位置整合到chat.md文件中。当您想要将处理过的.json音频文件和.md图片摘要合并到每日的chat.md对话记录中时,请使用此功能。
此技能应在分析棋局时使用。当用户提供用于分析的FEN位置或询问特定棋局时自动触发。提供引擎驱动的分析,并用自然语言解释最佳走法、关键变体以及战略/战术主题。
OpenAI的模型连接了视觉和语言。能够实现零样本图像分类、图文匹配和跨模态检索。在4亿张图文对上进行训练。可用于图像搜索、内容审核或无需微调的视觉-语言任务。最适合通用图像理解。
创建视频、图片和文本内容
为Horus角色编排电影创作。指导通过以下阶段:研究→剧本→构建工具→生成→组装。使用Docker隔离的编码环境,仅使用免费/开源工具,并实现全面的记忆整合。