查阅了很久的资料,决定依据Yoshida的《Image retrieval system using impression words》这篇论文里的词语来定义。
Yoshida 等的 Art museum 系统,统计用户在看完图画后用到 的印象形容词,从中选取了 10 个常用的形容词,来描述图画。10 个形容词为 Warm、soft、natural、 clear、elegant、chic、authentic、classic、gorgeous、dynamic,并将每个词分为 5 个强度,分别是 very、 slightly、netural、not、not entirely,并以此建立起一个情感空间。
那么在实际的操作中,我们张开一个10维的向量空间,然后以[y=sigma(x)]的方式实现归一化,将值域定在[-1,1]之间。
在用特征词去生成旋律的时候,我们希望能够将节奏型、节拍也顺便生成,当然这可以用一个简单的naive Bayes算法完成。