一、数据集简介
FMA 是音乐分析数据集,由整首 HQ 音频、预计算的特征,以及音轨和用户级元数据组成。它是一个公开数据集,用于评估 MIR 中的多项任务。以下是该数据集包含的 csv 文件及其内容: tracks.csv:记录每首歌每个音轨的元数据,例如 ID、歌名、演唱者、流派、标签和播放次数,共计 106,574 首歌。 genres.csv:记录所有 163 种流派的 ID 与名称及上层风格名(用于推断流派层次和上层流派)。 features.csv:记录用 librosa 提取的常见特征。 echonest.csv:由 Echonest(现在的 Spotify)为 13,129 首音轨的子集提供的音频功能。
二、文件类型
序号 | 名称 | 大小 |
---|---|---|
1 | fma_large.zip | 93GB |
2 | fma_medium.zip | 22GB |
3 | fma_small.zip | 7.2GB |
4 | fma_metadata.zip | 342MB |
5 | fma_full.zip | 879GB |
三、github链接
https://github.com/mdeff/fma