1.3K Views
March 15, 18
スライド概要
矢田部浩平, 北村大地, "近接分離最適化によるブラインド⾳源分離," 日本音響学会 2018年春季研究発表会講演論文集, 1-4-10, pp. 431–434, Saitama, March 2018.
Kohei Yatabe, Daichi Kitamura, "Blind source separation via proximal splitting algorithm," Proceedings of 2018 Spring Meeting of Acoustical Society of Japan, 1-4-10, pp. 431–434, Saitama, March 2018 (in Japanese).
http://d-kitamura.net/links_en.html
1-4-10 近接分離最適化による ブラインド音源分離 ○ 矢田部 浩平(早大),北村 大地(東大)
ブラインド音源分離問題 混合された信号を混合前の信号に分離 マイク位置や音源位置などの事前情報を用いずに推定(ブラインド) 独立成分分析の発展形が盛んに研究されている 混合系の逆(分離系)を推定することで信号を復元 独立性基準によるブラインド音源分離 ⇒ 統計的な独立性を最大化するように分離フィルタを推定する 混合系 Kohei Yatabe 2018 分離系
独立性基準によるブラインド音源分離問題 音源モデル項と負Logdet項の最小化問題に帰着 負Logdet項は各分離手法で共通(自明解を避ける効果) ⇒ 分離手法ごとの違いは音源モデル項の違いとして現れる 音源モデル項 新たな音源モデルが新たな手法を生む より良い音源モデルの発見によって性能が向上できると期待される ⇒ 様々なモデルを試行錯誤することで手法が改良・改善されてきた Kohei Yatabe 2018
分離性能は音源モデル項によって決まる 音源モデル項の違いが分離結果の違いを与える Laplace 分布に基づく周波数領域独立成分分析(FDICA) 球対称 Laplace 分布に基づく独立ベクトル分析(IVA) 板倉斎藤 NMF に基づく独立低ランク行列分析(ILRMA) Kohei Yatabe 2018
音源分離における最適化アルゴリズム 最適化問題を解いた結果が分離結果 多くの最適化問題は反復アルゴリズムを用いて解く必要がある ⇒ 一般的なアルゴリズム vs 特別設計されたアルゴリズム 勾配降下法(gradient descent method) 勾配を利用しコスト関数が小さくなる方向に反復更新 微分さえできればアルゴリズムを導出可能(簡単) 微分できないと困る,パラメータ調整が容易でない,収束が遅い 補助関数法(majorization-minimization method) コスト関数に合わせて補助関数を特別に設計して逐次最小化 収束が速い,パラメータ調整が不要 コスト関数に適した補助関数を発見する必要,不安定な演算を含む Kohei Yatabe 2018
研究目的・提案手法 より一般的で適用範囲の広いアルゴリズムの提案 多くの音源分離モデルを統一的に扱えるアルゴリズム ⇒ 微分不可能だったり非有限なモデルでも緩和問題として対応可能 音源モデルを取り換えた際の導出が簡単なアルゴリズム ⇒ 負Logdet項を分離することで音源モデル項のみ考えれば良くなる 観測信号の条件によらない安定的なアルゴリズム ⇒ 逆行列演算などの条件によって不安定になる操作を含まない 提案手法:主双対分離型の近接アルゴリズム 近接分離アルゴリズムを独立性基準の音源分離問題に適用 ⇒ アルゴリズムが適用できるように変形して問題自体を新たに定義 複数の項からなる音源モデルを扱うことが可能 Kohei Yatabe 2018
今回扱う目的関数 負Logdet項と何らかの関数の和の最小化 負Logdet項は手法(音源モデル)によらず共通 ⇒ 負Logdet項と音源モデル項を別々に扱えるアルゴリズムが好ましい ∵ 音源項のみを考えてアルゴリズムを変形すれば良い モデル毎に変化 共通 主・双対分離アルゴリズムを適用 近年注目されている凸最適化アルゴリズムの1つ ⇒ 目的関数の複数の項を手続きとして分離して解くことで効率化 Kohei Yatabe 2018
主双対分離アルゴリズム(Primal-dual splitting) 複数の項の和の最小化を行う反復解法 関数の和で定義される問題をより簡単な部分問題に分解して解く 有界線形作用素との合成関数を含む場合も効率良く解くことが可能 Kohei Yatabe 2018
主双対分離アルゴリズム(Primal-dual splitting) 複数の項の和の最小化を行う反復解法 関数の和で定義される問題をより簡単な部分問題に分解して解く 有界線形作用素との合成関数を含む場合も効率良く解くことが可能 Kohei Yatabe 2018
主双対分離アルゴリズム(Primal-dual splitting) 複数の項の和の最小化を行う反復解法 関数の和で定義される問題をより簡単な部分問題に分解して解く 有界線形作用素との合成関数を含む場合も効率良く解くことが可能 Kohei Yatabe 2018
近接作用素(proximity operator) 近接項により扱いやすくなった部分問題 その関数を現在地の近傍で最小化する作用素 ⇒ が微分可能で が小さいときは勾配法の1ステップに似た操作 微分不可能な関数でも微分可能な緩和問題になってるので解くのが楽 ⇒ 2ノルムとの極小畳み込み(Moreauエンベロープ) 多くの有用な関数の近接作用素は解析解が存在 解析解を代入することで直ちにアルゴリズムを導出可能 解析解がない場合でも反復解法を適用することで対処可能 ⇒ アルゴリズムの一部を差し替えるのみで音源モデルをテスト可能 Kohei Yatabe 2018
Logdet項の近接作用素 Logdet項を特異値で緩和 特異値で書き換えることでユニタリ不変関数に 各特異値に負Logの近接作用素を適用すれば良い それぞれの特異値に少しだけ値を足す操作(安定的に計算可) Kohei Yatabe 2018
音源モデル項の解釈 観測データによって決まる有界線形作用素との合成 最適化変数は分離フィルタなので観測データは分離フィルタの変換 ⇒ 分離フィルタをベクトル化して書けば観測データは行列 分離フィルタ推定問題のベクトル表現 主双対分離型アルゴリズムが適用できる形式 ⇒ Logdet項の近接作用素は前述の通り ⇒ 音源モデル項の近接作用素のみを気にすれば良い Kohei Yatabe 2018
提案アルゴリズム Kohei Yatabe 2018
提案アルゴリズム 特異値分解をして 特異値を増やす操作 音源項の近接作用素 (音源項のみの最適化) Kohei Yatabe 2018
提案アルゴリズム Kohei Yatabe 2018
提案アルゴリズム 特異値拡大 音源項の近接作用素 (各項を独立に解く) Kohei Yatabe 2018
提案アルゴリズム なら何でも良い ゼロで良い 提案する正規化法 を適用すれば どちらも1で良い Kohei Yatabe 2018
実験条件 SiSEC 2011 (UND, dev1) liverec [Araki et al., 2012] SiSEC 2011の実環境収録音源を使用 ⇒ 4音源2チャンネル収録音源を2つに分けて使用 残響時間:130ミリ秒 ハン窓(128ミリ秒,ハーフオーバーラップ) 分離フィルタは単位行列で初期化 Source 1 Source 2 Source 1 Source 2 1m 40 80 45 5 cm Kohei Yatabe 2018 1m Mixture A 5 cm 75 Mixture B
実験結果(SDR改善量) Kohei Yatabe 2018
実験結果(SDR改善量) 反復1回あたりの計算時間 (Core i5-7200U, MATLAB 2017a) AuxIVA:80.8 ms 提案手法:47.4 ms_ Kohei Yatabe 2018
むすび 今年のICASSPで発表します! 主双対分離アルゴリズムを音源分離に適用 独立性基準のブラインド音源分離問題に対するアルゴリズムを提案 ⇒ 幅広い音源モデルを統一的かつ安定的に解くことが目的 複数の項を含む音源モデルを簡単に扱うことが可能 ⇒ RPCAやHPSSのようなモデルを用いた分離手法への応用 コードを修正する手間を省くことで多くのモデルをテスト可能 ⇒ 実験の4つのモデル全体を5分未満でコーディングできた(電車内) 残された課題 Logdet項の非凸性に起因するアルゴリズムの挙動の解析・収束証明 近接作用素が解析的に解けない問題に対する有用性の調査 Kohei Yatabe 2018