melogen
将乐谱转换为MIDI和MusicXML,将音频转录为MIDI,并通过Melogen CLI分析音乐结构。功能包括:乐谱OCR/OMR、PDF转MIDI、PNG/JPG乐谱转MIDI、MP3/WAV/FLAC/OGG/M4A音频转MIDI、复调转录、音轨分离、节拍量化、音乐理论分析(调性、和声、曲式、调式)。用途包括:音乐转录、音乐记谱、音乐制作、音频转录、乐谱数字化、MIDI转换、音乐AI、音乐分…
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
将乐谱转换为MIDI和MusicXML,将音频转录为MIDI,并通过Melogen CLI分析音乐结构。功能包括:乐谱OCR/OMR、PDF转MIDI、PNG/JPG乐谱转MIDI、MP3/WAV/FLAC/OGG/M4A音频转MIDI、复调转录、音轨分离、节拍量化、音乐理论分析(调性、和声、曲式、调式)。用途包括:音乐转录、音乐记谱、音乐制作、音频转录、乐谱数字化、MIDI转换、音乐AI、音乐分…
周到的GPT集成。管理数据、记录并自动化工作流程。当用户希望与周到的GPT数据交互时使用。
Veritone集成。管理数据、记录并自动化工作流程。当用户想要与Veritone数据交互时使用。
Vimeo集成。管理视频。当用户想要与Vimeo数据交互时使用。
Winston AI集成。管理数据、记录并自动化工作流程。当用户想要与Winston AI数据交互时使用。
ByteHouse 混合检索 Skill,支持全文检索 + 向量检索,结合 RRF 重排算法实现更精准的检索结果。当用户需要在ByteHouse数据库中进行全文检索 + 向量检索,结合 RRF 重排算法实现更精准的检索结果时,使用此Skill。
使用Volcengine Imagination API生成音乐。支持人声歌曲、乐器背景音乐和歌词生成。当用户想要创作歌曲、背景音乐、配乐、写歌词,或提到“音乐生成”、“BGM”或“作曲”时使用。
视觉质量诊断助手适合市场营销、运营、内容媒体、电商在用户提出“这张图够发布吗”这类问题,需要快速拆解目标、判断重点并形成可执行结果时使用,帮助基于输入材料生成摘要、诊断结论、行动建议和可复用交付物。
生成照片集成。管理人物。当用户想要与生成的照片数据交互时使用。
Trint集成。管理数据、记录并自动化工作流程。当用户想要与Trint数据交互时使用。
VideoAsk集成。管理数据、记录并自动化工作流程。当用户想要与VideoAsk数据交互时使用。
Warpwire集成。管理数据、记录并自动化工作流程。当用户想要与Warpwire数据交互时使用。
Wistia集成。管理数据、记录并自动化工作流程。当用户希望与Wistia数据交互时使用。
用于图像降采样的图像重采样操作符。当用户需要执行以下操作时使用此技能:- 将图像调整/降采样到目标大小 - 更改图像DPI设置 - 在JPG/PNG格式之间转换支持4种插值方法:最近邻、双线性、双三次和Lanczos。支持从URL、TOS、base64或二进制输入。需要LAS_API_KEY进行身份验证。
使用官方SDK为存储在字节跳动TOS中的对象提供图像处理能力。支持获取图像信息、格式转换、调整大小和添加水印。当您需要分析或转换存储在TOS中的图像时,请使用此功能。
精通统计分析、预测建模、机器学习和数据故事讲述,以推动业务洞察。
HTML/CSS转图片集成。管理图片。当用户想要与HTML/CSS转图片的数据进行交互时使用。
Uberduck集成。管理数据、记录并自动化工作流程。在用户想要与Uberduck数据交互时使用。
VIDIZMO集成。管理数据、记录并自动化工作流程。当用户想要与VIDIZMO数据交互时使用。
WatsonX AI集成。管理数据、记录并自动化工作流程。当用户想要与WatsonX AI数据交互时使用。
通过BytePlus InfoQuest API进行AI优化的网页搜索、图片搜索和内容提取。当您需要从网络上收集简洁且最新的信息、查找图片或从特定URL中提取干净的内容时,请使用此技能。
视频修复操作符(las_video_inpaint)用于从视频中移除水印/字幕/标志。当用户需要以下操作时使用此技能:- 从视频中移除水印、字幕或滚动字幕- 通过修复固定区域(fixed_bboxes)或自动检测的区域来修复视频- 运行视频恢复并获取输出TOS路径+可选的字幕边界框支持从公网URL/内网URL/TOS输入,并输出到TOS。如果用户提供本地视频文件或需要本地输出,请使用byted-t…
让AI Agent通过 VoxCPM2 TTS API 给视频自动配音技能
自然语言处理专家,使用Hugging Face、spaCy和LangChain设计文本分类、命名实体识别、翻译以及大语言模型集成系统。适用于构建NLP流水线、文本分析或基于大语言模型的功能。触发词包括“NLP”、“文本分类”、“NER”、“命名实体”、“情感分析”、“spaCy”、“Hugging Face”、“transformers”。