論文メモ Character-Aware Neural Language Models
概要
文字単位の入力から次に出現する単語を予測するニューラル言語モデルの論文である。 アーキテクチャは入力から近い順にCNN, highway network, LSTMからなる。 実験データにPenn Treebankを、評価指標にPerplexityを採用してモデルを評価したところ、 論文が発表された2016年時点でのSOTAの60%程度のパラメタしかないモデルでありながら、これに匹敵する性能を発揮した。