バンド編曲に向けたギター音源からベース音源を生成するCNNモデル

581 Views

October 11, 24

#CNN #音響信号処理 #自動編曲 #音楽情報処理 #特徴量抽出

スライド概要

Kitahara Lab

@kthrlab

スライド一覧

日本大学文理学部情報科学科北原研究室。「Technology Makes Music More Fun」を合言葉に、音楽をはじめとするエンターテインメントの高度化に資する技術の研究開発を行っています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

音楽を題材に情報科学を研究する

Kitahara Lab 11.6K

卒論発表

Kitahara Lab 3.1K

Attentionメカニズムを取り入れた音楽生成モデルの性能評価に関する研究

transformer

Kitahara Lab 2.5K

自由度が徐々に上がる作曲ソフトウェア

Kitahara Lab 2.4K

ハモリパート練習支援システムのための音響信号を対象とした副旋律生成の検討

Kitahara Lab 2.2K

ストリートダンスにおけるアクセントの踊り分けの分析

Kitahara Lab 1.6K

各ページのテキスト

バンド編曲に向けたギター音源からベース音源を生成するCNNモデル北原研香西智雄

背景  ギターリストの中にはギターで作曲を楽しむ人が居る。  だが、編曲するとなると、人と音楽知識を要する。  そこで知識いらずで自動バンド編曲してくれるシステムがあればいいな。パソコンを通して、バンド編曲

研究概要  今回は、ギターの音響信号から、ベースの音響信号の生成を取り扱うことにする。入力出力モデルベースonly

CNN フィルター層逆フィルター層特徴量フーリエ変換圧縮復元特徴量抽出予測結果フーリエ変換一致するよう学習する

データセット作成に用いたソフト Cakewalk By BandLab ビート八分音符のみ BPM 120 小節数 4(8秒) 学習データ数 10曲テストデータ数 11曲(1曲のみ、実演奏) 実際のデータセット内の音源の楽譜

実験目的・実験条件  特徴量抽出手法を変えて、設定した条件ごとの予測結果を比較する。特徴量抽出手法条件学習データテストデータ 1 短時間フーリエ変換(STFT) 1 Cakewalk Cakewalk 2 メルスペクトログラム(Mel) 2 Cakewalk Cakewalk(ローパスフィルタ適用) 3 クロマグラム(Chorma) 3 Cakewalk 実演奏  評価基準  正解音源と予測音源の基本周波数の一致度合い(正解率) 。

実験結果:条件1 入力データ guitar音源 bass音源 STFT 復元音源正解率:0.70 コード進行:AmFGC Mel 復元音源正解率:0.54 Chroma 復元音源正解率:0.79

実験結果:条件2 入力データコード進行:A#CDmEm guitar音源 bass音源 STFT Mel Chroma 復元音源復元音源復元音源正解率:0.29 正解率:0.26 正解率:0.58

実験結果:条件3 入力データコード進行:CDEmAm guitar音源 bass音源 STFT Mel Chroma 復元音源復元音源復元音源正解率:0.20 正解率:0.09 正解率:0.35

10.

結論  CNNでギター音響信号からベース音響信号の生成を行った。  最も精度の高いモデルは、クロマグラムだった。  考察  クロマグラムは和音分析に特化しているため、うまくいった。  音源がエフェクターなどに加工されるとうまくいかない可能性がある。  今後の課題  データセットを増やして、精度に変化が生じるか。  特徴量抽出手法の設定条件を変更し、精度に変化が生じるか。