要約: NAM: Non-Adversarial Unsupervised Domain Mapping
新たなDomain変換の手法Non-Adversarial domain Mapping(NAM)を提案。GANに基づかないので安定して射影の学習が可能。
Non-Adversarial Exact Matching
単純な仮定が成り立つ場合から始める。ドメインXとYから得られたデータ集合{}と{}を考え、それぞれのに対応するデータが{}の中に含まれていてそれがを満たすと仮定する。そのようなxとyのペアを探したい場合、(1)xとyのマッチングを推定する、(2)変換T(・)を推定する、という二つの問題を解くことになる。これを式に起こすと次のようになる:
ここでMijはマッチすると推定されたときには1、そうでないときには0になる変数であるとする。 これを最小化するのは困難である。そこで、Mについてのバイナリの制約条件を[tex: M{ij} \geq 0]、[tex: \sum_j M{ij} =1]という制約に緩和して最小化するような枠組みが提案されている。これはANGAN (Identifying analogies across domains, ICLR2018)と呼ばれる手法である。
Non-Adversarial Inexact Matching
実際にはドメインXとYの間でのExactなマッチングは存在しない(つまり1対1対応していない)ことが多い。そのような場合には、それぞれのyについてy=T(x)を満たすようなxがドメインXのデータ集合{}の中に存在するという仮定自体を見直すべきである。
そこでこの論文では、yに対応するxをドメインXのデータ集合{}の中から探してくるのではなく、ドメインXに属していてかつを満たすようなをそれぞれのyごとに擬似的に生成するという枠組みを提唱している。
擬似的に生成する方法としては様々なものが考えられるが、例えば次のようにを定義するという方法が挙げられる:
しかしながらこの方法には、ドメインXに含まれるデータのsimplexでは適切なデータを生成することができないという問題点や、パラメータ数がデータ数の二乗のペースで増加していくという問題点がある。
Non-Adversarial Mapping (NAM)
この論文ではなんらかの手法(GANやVAEなど)を用いて既に手元に潜在変数からのドメインXのデータの生成器G(・)があるとして、それを用いてyに対応するドメインXのデータxを生成することを考える。 具体的には、次の目的関数を最小化することによりそれぞれのyに対応するxを生成する潜在変数zと射影T(・)を同時に学習する。この研究ではこれをNon-Adversarial Mapping (NAM)と命名している:
(3)の損失としてはSemanticなラベルで学習済みのCNNを用いたPerceptual Lossを使用することを提唱している:
NAMはGANベースの手法とは異なり安定して学習ができるという利点を有する。
なお、xに対応するyではなくyに対応するxを求めたい場合には(3)の潜在変数だけを更新するようにすれば良い。
実験結果の例