メモ metapath2vec: Scalable Representation Learning for Heterogeneous Networks
September 7, 2018異種混合ネットワークから、ノード数x次元数の分散表現を獲得するための手法。 異種混合とは、企業、業界、ニュースなど複数の種類の概念がグラフのノードとして扱われていることを意味する。 獲得した分散表現を訓練データとして分類、クラスタリング、検索に応用し、既存手法と比較している。
ベースにあるアイデアは、skip-gramにおける単語とその文脈(context)を、ノードと周辺のノードに対応させ、 skip-gramのアルゴリズムをネットワークに応用するというもの。 ノードの周辺の情報は、対象のノードからのランダムウォークで遷移する確率によって表現され、skip-gramに与えられる。 ノードの型を分散表現へ反映するにはノードの型情報も与える必要があり、遷移確率を隣接するノードの型によって決めることで型情報を与えている。 論文の表題にあるmetapathは、「企業->業界->企業」のように状態が型で表される遷移列であり、ランダムウォークの経路を制限する。
論文はこちらからダウンロードできます。