toaruharunohi’s diary

機械学習系会議の論文/資料の要約

ICLR17

要約: Multi-view Recurrent Neural Acoustic Word Embeddings

https://arxiv.org/pdf/1611.04496.pdf 音声データと文字列データについて、両者の共通空間への射影をそれぞれ学習させる研究。 目標は文字列cとして表現される単語を発音する音声データxがあった時に、両者を音声データの共通空間への射影f(x)と文字列デー…