Audio Processor
音频处理全能工具集,基于 Python + ffmpeg + librosa/pydub 实现。
核心能力
1. 音频格式转换
- 支持 MP3 / WAV / FLAC / OGG / AAC / M4A 互转
- 批量转换目录内音频
- 自定义比特率、采样率、声道数
2. 音频剪辑与合并
- 按时间码裁剪(hh:mm:ss 格式)
- 去除首尾静音段
- 多段音频合并拼接
- 淡入淡出效果
3. 音频分析
- 波形可视化(matplotlib)
- 频谱分析(FFT + spectrogram)
- 音量检测(RMS / dBFS)
- BPM / 节奏检测
- 静音段检测与分割
4. 音频效果处理
- 降噪(spectral gating)
- 变速不变调 / 变调不变速
- 音量标准化(peak / RMS / LUFS)
- 混响、延迟效果
5. 音频信息提取
- 时长、采样率、比特率、声道数
- ID3 标签 / 元数据读写
- 音频指纹生成
快速开始
# 格式转换
python3 scripts/convert_format.py input.wav output.mp3 --bitrate 320k
# 剪辑音频(从30秒到2分钟)
python3 scripts/cut_audio.py input.mp3 output.mp3 --start 00:00:30 --end 00:02:00
# 分析音频特征
python3 scripts/analyze_audio.py input.mp3 --output report.json
# 降噪处理
python3 scripts/denoise.py input.mp3 output.mp3
# 批量处理目录
python3 scripts/batch_process.py ./audio_dir/ --action convert --format mp3
依赖安装
pip install -r requirements.txt
核心依赖:ffmpeg(系统级)、pydub、librosa、soundfile、mutagen、numpy、matplotlib、noisereduce
脚本说明
| 脚本 | 功能 |
|------|------|
| convert_format.py | 格式转换,支持所有主流格式 |
| cut_audio.py | 按时间码裁剪音频 |
| merge_audio.py | 多文件合并拼接 |
| analyze_audio.py | 音频特征分析(波形/频谱/BPM) |
| denoise.py | 降噪处理 |
| speed_pitch.py | 变速变调 |
| normalize_volume.py | 音量标准化 |
| batch_process.py | 批量处理目录 |
| extract_metadata.py | 元数据提取与编辑 |
| detect_silence.py | 静音检测与自动分割 |
详细用法
参见 references/ 目录:
audio-formats.md- 支持的音频格式详解effects-guide.md- 效果处理参数指南api-reference.md- 脚本 API 参考
微信扫一扫