toaruharunohi’s diary

機械学習系会議の論文/資料の要約

要約: NAM: Non-Adversarial Unsupervised Domain Mapping

新たなDomain変換の手法Non-Adversarial domain Mapping(NAM)を提案。GANに基づかないので安定して射影の学習が可能。

Non-Adversarial Exact Matching

単純な仮定が成り立つ場合から始める。ドメインXとYから得られたデータ集合{ x_i}と{ y_i}を考え、それぞれの y_iに対応するデータが{ x_i}の中に含まれていてそれが T(x)=yを満たすと仮定する。そのようなxとyのペアを探したい場合、(1)xとyのマッチングを推定する、(2)変換T(・)を推定する、という二つの問題を解くことになる。これを式に起こすと次のようになる:

f:id:toaruharunohi:20180919102758p:plain

ここでMijはマッチすると推定されたときには1、そうでないときには0になる変数であるとする。 これを最小化するのは困難である。そこで、Mについてのバイナリの制約条件を[tex: M{ij} \geq 0]、[tex: \sum_j M{ij} =1]という制約に緩和して最小化するような枠組みが提案されている。これはANGAN (Identifying analogies across domains, ICLR2018)と呼ばれる手法である。

Non-Adversarial Inexact Matching

実際にはドメインXとYの間でのExactなマッチングは存在しない(つまり1対1対応していない)ことが多い。そのような場合には、それぞれのyについてy=T(x)を満たすようなxがドメインXのデータ集合{ x_i}の中に存在するという仮定自体を見直すべきである。

そこでこの論文では、yに対応するxをドメインXのデータ集合{ x_i}の中から探してくるのではなく、ドメインXに属していてかつ y=T(\widetilde{x})を満たすような \widetilde{x}をそれぞれのyごとに擬似的に生成するという枠組みを提唱している。

擬似的に生成する方法としては様々なものが考えられるが、例えば次のように \widetilde{x}を定義するという方法が挙げられる:

f:id:toaruharunohi:20180919102801p:plain

しかしながらこの方法には、ドメインXに含まれるデータのsimplexでは適切なデータを生成することができないという問題点や、パラメータ数がデータ数の二乗のペースで増加していくという問題点がある。

Non-Adversarial Mapping (NAM)

この論文ではなんらかの手法(GANやVAEなど)を用いて既に手元に潜在変数からのドメインXのデータの生成器G(・)があるとして、それを用いてyに対応するドメインXのデータxを生成することを考える。 具体的には、次の目的関数を最小化することによりそれぞれのyに対応するxを生成する潜在変数zと射影T(・)を同時に学習する。この研究ではこれをNon-Adversarial Mapping (NAM)と命名している:

f:id:toaruharunohi:20180919102804p:plain

(3)の損失としてはSemanticなラベルで学習済みのCNNを用いたPerceptual Lossを使用することを提唱している:

f:id:toaruharunohi:20180919102901p:plain

f:id:toaruharunohi:20180919102910p:plain

NAMはGANベースの手法とは異なり安定して学習ができるという利点を有する。

なお、xに対応するyではなくyに対応するxを求めたい場合には(3)の潜在変数だけを更新するようにすれば良い。

実験結果の例

f:id:toaruharunohi:20180919102930p:plain

f:id:toaruharunohi:20180919102939p:plain