表題のとおり、音楽感情認識のレビュー論文を読みました。 日本語の資料が少ないので、分かったことを簡単にまとめたいと思います。

章立て

この論文は次のような章立てになっています。

  1. イントロダクション
  2. 音楽感情認識と心理学の関係
  3. 感情認識システムの設計
  4. 人手による正解データの作成
  5. テキスト情報を使った音楽感情認識
  6. 音響特徴量を使った音楽感情認識
  7. 複数ドメインの特徴量の組み合わせ
  8. 結論

分かりやすくするために、若干の意訳が入っています。 正確な各章のタイトルは論文をご参照ください。

心理学に基づく音楽感情の取り扱い

はじめに、音楽感情のどういった側面を分析するのかについて述べられています。 著者らは音楽に関係した感情を

  • 音楽によって表現される感情
  • 音楽から知覚される感情
  • 音楽が誘発する感情

の三種類にまとめ、このうち、音楽によって表現される感情に主眼を置くことを宣言しています。 音楽から知覚される感情と、音楽が誘発する感情の違いは [Juslin and Luakka, 2004] に詳しく書かれています。 これはおそらく、「怒り」の感情を知覚することで「共感」を覚える、というような違いのことだと思われます。

次に、音楽感情を計算機上でどう取り扱うかが説明されます。ここではカテゴリー分類の例として MIREX の 5 分類が、連続空間モデルの例としてラッセルの円環モデル(Valence-Arousal; VA 空間モデル)が紹介されます。

音楽感情の計算機的取り扱い

計算機による音楽感情認識がクラス推定・回帰問題のいずれかとなることを指摘した上で、各論に入ります。

4章は正解データの作り方について。人手による方法、Last.fm を参照する方法などが説明されています。

5-7章は、テキスト情報・音響特徴量・これらの組み合わせによる感情認識研究の網羅的なサーベイとなっています。 8章は結論で、研究分野の将来展望などが述べられています。

全体としてはとても面白く、音楽感情認識の基本が詰まった論文という印象でした。

参考文献