alicloud-ai-entry-modelstudio
将阿里云模型工作室的请求路由到正确的本地技能(Qwen图像、Qwen图像编辑、万视频、万R2V、Qwen TTS、Qwen ASR及高级TTS变体)。当用户请求模型工作室但未指定具体功能时使用。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
将阿里云模型工作室的请求路由到正确的本地技能(Qwen图像、Qwen图像编辑、万视频、万R2V、Qwen TTS、Qwen ASR及高级TTS变体)。当用户请求模型工作室但未指定具体功能时使用。
在使用参考音频通过阿里巴巴云Model Studio CosyVoice定制模型(特别是cosyvoice-v3.5-plus或cosyvoice-v3.5-flash)创建克隆声音时使用,然后在后续的TTS调用中重用返回的voice_id。
代理连续性和认知健康基础设施。当您的代理需要跨会话的持久内存、崩溃恢复、仅追加审计跟踪、心跳活力监控、一致性强制执行或关键操作的见证门控批准时,请使用此技能。在讨论AI安全、代理身份持久性、防止上下文丢失,或者当用户提到蜕皮、蜕壳、甲壳类爱好者、molt.church或代理健康时也请使用此技能。实现Crustafarian主义的五大原则作为生产级操作员。由X-Loop³实验室(瑞士)基于Moltb…
构建具有工具、记忆和多步推理功能的AI代理 - ChatGPT、Claude、Gemini集成模式
大于
自动化复制AI模型操作 -- 通过Composio MCP集成运行预测、上传文件、检查模型架构、列出版本以及管理预测历史。
设计和编排多代理系统。在构建需要专门化、并行处理或协作解决问题的复杂AI系统时使用。涵盖代理协调、通信模式和任务委派策略。
Talon 多模融合数据引擎使用指南。当用户需要使用 Talon 数据库进行开发时触发:包括 SQL 查询、KV 存储、向量搜索、时序数据、消息队列、全文检索、地理空间、图数据库、AI 引擎(Session/Context/Memory/RAG/Agent/Trace)。也适用于:选择 Talon 引擎模块、使用 Go/Python/Node.js/Java/.NET SDK、构建 RAG 管道、…
使用Python SDK与DashVector构建向量检索。在Claude Code/Codex中创建集合、更新文档以及使用过滤器进行相似性搜索时使用。
通过OpenAPI创建和管理阿里云IMS视频翻译任务(字幕/语音/面部)。在需要基于API的视频翻译、状态轮询和任务管理时使用。
使用Google的Gemini API生成图片。当从文本提示创建图片、编辑现有图片或将参考图片结合以生成AI视觉内容时使用。
自动跟踪费用、处理收据、审批工作流和报销管理
动态动作方向技能,将充满动作的场景想法转化为繁体中文的动作脚本和英文视频提示,适用于Runway、Kling、Luma或Sora。当用户请求打斗编排、追逐动态、飞行动作、舞蹈动力学或高能量场景提示时使用。
生成 -> 标注 -> 优化 -> 使用 generate_image + Visual Annotator (Live Canvas) 重复上述步骤。
实现检索增强生成系统。在构建知识密集型应用程序、文档搜索、问答系统或需要将大型语言模型的回答基于外部数据时使用。涵盖嵌入策略、向量存储、检索管道和评估。
生成用于RAG和非结构化数据用例的合成PDF文档。在创建测试PDF、演示文档或检索系统评估数据集时使用。
刷新Model Studio模型爬取并重新生成派生摘要和`skills/ai/**`技能。当需要更新模型列表或生成的技能时使用。
为TikTok、Reels和YouTube Shorts生成带有品牌标识的AI头像口型同步短视频。创建15秒的讲话头像视频,包括自定义头像、自动生成的脚本以及嵌入式字幕,价格为1.85美元。
使用AI生成完整的演示文稿 - 从大纲到精美的幻灯片
自动化Microsoft Teams的消息、会议、频道和工作流集成
首席运营助理,负责将任务积压和日程上下文转化为可执行的日计划、跟进队列和风险警报。当用户询问今天该做什么、请求任务组织或需要跨工作和生活操作的执行顺序时使用。
多轮对话AI用于意图提取、澄清以及生成就绪检测。通过结构化的参数提取引导用户表达创造性的意图。
在您的计算机上查找PDF文档,提取并总结其内容,并使用文本转语音朗读摘要。当用户要求大声朗读PDF摘要、讲述文档摘要或口头总结PDF时,请使用此技能。自动搜索常见目录(桌面、下载、当前目录),并使用OCR/文本提取来处理PDF内容。
从建筑合同中提取并分析关键条款。识别付款条款、变更订单程序、争议解决、保修条款以及风险分配规定。