code-from-image
从图像中使用OCR提取代码或伪代码并正确实现的指南。当任务涉及从图像(PNG、JPG、屏幕截图)中读取代码、伪代码或算法,并执行或实现所提取的逻辑时,应使用此技能。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
从图像中使用OCR提取代码或伪代码并正确实现的指南。当任务涉及从图像(PNG、JPG、屏幕截图)中读取代码、伪代码或算法,并执行或实现所提取的逻辑时,应使用此技能。
机器学习推理模式,其中预测是按预定时间间隔为大型数据集生成的,而不是实时生成的
模拟Geoffrey Hinton的代理 —— 深度学习之父,2018年图灵奖得主,反向传播和深度信念网络的创造者。当您想要:关于深度学习的历史视角
使用yt-dlp从各种平台下载视频并提取音频。当用户提供了一个视频链接、要求下载视频,或者对话中包含来自YouTube、Twitter/X、Vimeo、TikTok、Instagram等平台的视频链接时使用。
下载并转录YouTube视频为干净、去重的Markdown文档,并带有章节标题。使用yt-dlp获取字幕(手动或自动生成),移除自动字幕中的滚动文本三重化伪影,从视频元数据中插入章节标记,并生成带时间戳的转录本和纯文本版本。当用户想要:(1) 转录YouTube视频,(2) 从YouTube获取转录本或字幕,(3) 从视频创建InfoNugget,(4) 从YouTube URL或视频ID中提取文…
通过编写和执行自包含的Python脚本来进行全面的数据分析、统计建模和数据可视化。当您需要分析数据集、执行统计测试、创建可视化或使用可重复的基于代码的工作流程构建预测模型时,请使用此方法。
专业音频制作,适用于音乐、播客和声音设计。在处理任何媒介的音频录制、混音、母带处理或声音设计时使用。
在实现任何计算机视觉功能时使用 - 图像分析、物体检测、姿态检测、人物分割、主体提取、手/身体姿态跟踪。
使用句子转换器或类似嵌入模型进行文本嵌入检索任务的指南。当任务涉及加载文档、使用嵌入模型编码文本、计算相似度分数(余弦相似度)以及根据查询的语义相似性检索/排序文档时,应使用此技能。适用于MTEB基准任务、文档检索、语义搜索和文本相似性排名。
使用AgentGo进行本地RAG(检索增强生成)操作,包括文档摄入、语义搜索和问答。支持多提供商LLM、MCP工具、技能和认知记忆(Hindsight/PageIndex)。在构建具有长期记忆能力的本地知识库和AI助手时使用。
将音频文件转录为文本,并自动检测语言(支持中文和英语)
在设计结合了图检索与大语言模型推理的完整GraphRAG系统时使用。当用户提到GraphRAG系统、技术栈、Neo4j与大语言模型、LangChain图、LlamaIndex知识图谱、用于RAG的社区检测、混合符号-向量集成、生产环境下的GraphRAG或特定领域的图RAG时调用。提供架构设计、技术选型及领域定制化指导。
使用设计哲学创建美观的视觉艺术作品,格式为.png和.pdf文档。当用户要求创建海报、艺术品、设计图或其他静态作品时,你应该运用这项技能。创造原创的视觉设计,绝不复制现有艺术家的作品以避免侵犯版权。
创建适用于Slack的优化动画GIF所需的知识和工具。提供约束条件、验证工具和动画概念。当用户请求为Slack制作类似“制作一个X做Y的GIF”的动画GIF时使用。
游戏音频系统、音乐、空间音频、音效和语音实现。通过专业中间件集成构建沉浸式音频体验。
未检测到主题,手部姿势缺少标志点,低置信度观察,视觉性能,坐标转换,VisionKit错误,观察结果为空,文本未被识别,条形码未被检测到,DataScannerViewController无法工作,文档扫描问题
[WHAT] 通过与OpenAI兼容的API为开源LLM提供快速、成本效益高的推理和微调 [HOW] 无服务器推理、按需GPU部署、LoRA微调(SFT、RFT、DPO)、firectl CLI [WHEN] 在部署开源模型、针对自定义用例进行微调或从OpenAI迁移时使用 [WHY] 100+模型、提示缓存、批量推理、多LoRA部署、强化微调 触发词: "fireworks", "firewor…
文本向量化(Embedding)基础服务。将自然语言转换为高维稠密向量,为语义搜索、聚类分析、推荐系统等下游任务提供核心数据支持。
从学术论文和内容生成专业的幻灯片图片。创建包含样式说明的全面大纲,自动从PDF中检测图表,然后生成单独的幻灯片图片。当用户要求“创建幻灯片”、“制作演示文稿”、“生成幻灯片集”或“幻灯片集”时使用。
多模态分析专家,分析 PDF/图片/视频/音频/图表/架构图/截图。
构建AI代理和工作流的模式和架构,使用大语言模型。在设计涉及工具使用、多步骤推理、自主决策或大语言模型驱动任务编排的系统时采用。
FFmpeg音频处理、批量编辑、标准化、混音和自动化音频制作工作流程。适用于大规模音频处理、编辑任务自动化或构建音频流水线时使用。
智能计量经济学分析代理。当用户输入以"autoregmonkey:"开头时,LLM会解析经济学计量任务,参考RAG数据库知识,动态调用Python和Stata技能执行任务,最后生成中文报告。
生成各种条形码格式,包括Code128、EAN、UPC等。