Posts

NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE(2015)

概要

Decoderに注意機構を採用したencoder-decoderモデルを提案したICLR2015の論文である。論文の発表当時、encoder-decoderモデルによる翻訳の多くは、encoderが入力文を固定長ベクトルに変換し、固定長ベクトルから翻訳された文を出力していた。著者らは、固定長ベクトルへの変換が長い文の翻訳性能を下げていると考え、固定長ベクトルを注意機構におきかえたencoder-decoderモデルを提案した。モデルは、翻訳に加え、生成する単語と入力文の箇所の関係を学習する。推定時には、まず、次に生成する単語に関係する入力文の箇所を推定する。次に、推定された箇所と生成済の単語列をもとに、単語を生成する。特に長い文書の翻訳において、固定長ベクトルをつかうモデルよりも、提案手法が優れていることを実験的に示した。

February 1, 2020

Why Should I Trust You? Explaining the Predictions of Any Classifier

概要

モデルの予測に説明をあたえる手法、Local Interpretable Model-agnostic Explanations (LIME)を提案する。モデルが回帰や分類器であれば、アルゴリズムによらずLIMEを適用できる。説明を与えたい事例近くにある事例を解釈可能なモデルに学習させ、解釈可能なモデルで予測を説明する。また、個別の予測ではなく、モデル自体をよく説明する事例を集める手法Submodullar Pick (SP)-LIMEを提案する。

#説明可能なAI

January 26, 2020

Active Learning for Ranking through Expected Loss Optimization

概要

Yahoo! Labsで開発されたランキングのための能動学習の論文である。提案手法は、Yahoo!検索エンジンでの採用実績がある。手法は、Expected Loss Optimization(ELO)とよばれ、ベイズ決定則によって識別したときの損失の期待値が最大になるデータを選ぶ。 ELOに用いる損失関数にDCGを採用したExpected DCG Loss Optimization(ELO-DCG)を提案し、実験で評価した。

January 19, 2020

AtCoderに提出したコードをテストするためのDockerイメージ

AtCoderに提出したコードをテストするためのDockerイメージを実装した。イメージのDockerfileはこちらにある。 AtCoderで提出したコードをgithubで管理していて、これをテストするために作った。

January 14, 2020

Unsupervised Models for Named Entity Classification(1999)

概要

1999年に発表された教師なしの固有表現抽出の手法である。発表時期が古いことに注意してほしい。 2つの手法が提案されている。ひとつは、DL-CoTrainと呼ばれるルールベースの手法であり、教師なしデータに既存のルールを適用、適用結果から導出したルールを既存のルールに追加、をくりかえしてルールを増やす。もう一方は、AdaBoostを応用したCoBoostとよばれる手法である。ルールベースの手法のほうがCoBoostよりもよい実験結果であったので、前者のみを説明する。

January 13, 2020

Multilabel Classification with Label Correlations and Missing Labels(2014)

概要

ラベルの相関関係を学習し推論に利用するマルチラベルの線形モデルを提案した論文である。相関関係のあるラベル集合を相関関係のないラベル集合に変換し、ラベルごとに分けて学習する手法、Label transformationを応用する。分類器は、相関関係だけなく、学習データに与えられていないラベルを推定するように拡張できる。

#マルチラベル分類

January 6, 2020

Learning Deep Structured Semantic Models for Web Search using Clickthrough Data(2013)

概要

クエリと文書を同じ低次元の空間に射影する深層学習のモデルを提案した論文である。クエリと文書は、適合度合いが高いほど、近くに配置される。教師データは、クエリと文書の組からなる教師データである。実験では、商用検索エンジンから抽出した16510件のクエリと対応するWeサイトのタイトルがつかわれる。 Web文書の大量の語彙をあつかうために、語彙の増加に対して次元数を抑えるbag-of-wordsの手法、word hasingも提案した。

#ランキング学習

January 4, 2020

Classification in the Presence of Label Noise: a Survey(2013)

概要

ノイズのある教師データによるクラス分類のサーベイ論文である。発表時期は、2013年の12月である。主な内容は、ノイズの分類、ノイズが分類に及ぼす影響、ノイズへの対策である。

December 30, 2019

Distributed Representations of Sentences and Documents(2014)

概要

Doc2Vecのアルゴリズムとして採用されたニューラル言語モデルParagraph Vectorを提案した論文である。 bag of wordsは、文書の単語順を記憶せず、また、似た意味の単語ベクトルと無関係なベクトルを単語にわりあてる。 Paragraph Vectorは、文脈中の単語と抽出元のパラグラフから文脈の中心の単語をあてられるように学習することで、可変長文字列から固定長の文書埋め込みベクトルを生成できるようになる。これにより、単語順と単語の意味を記憶したベクトルの生成を実現する。

#Embedding

December 28, 2019

GloVe: Global Vectors for Word Representation(2014)

概要

GloVeは,コーパスに出現する単語の共起回数を学習するニューラル言語モデルである。既存手法を単語の出現頻度の統計値つかう手法と対数双線形モデルに分類し、両者の長所を備え短所を補う手法として、GloVeを提案する。

#Embedding

December 21, 2019