Posts

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer(2020)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformerは、複数の異なる自然言語処理を、統一的にテキストからテキストを生成する問題とみなした大規模な実験によって、自然言語処理への転移学習の応用に見通しをつけた。この統一的なアプローチは、Text-to-Text Transfer Transformer(T5)と名づけられた。既存の技術への理解を深めることを目的としており、新たなアルゴリズムの提案はない。一方、調査する技術の限界を調べるために、大きなデータが必要であったことから、新たなデータセットColossal Clean Crawled Corpus(C4)が作られた。 C4には、Common Crawlから抽出された英語のテキストがふくまれる。

#Transformer

August 5, 2023

Catalan Numbers(2016)

カタラン数は、いくつかの組合せの問題の解で知られる自然数の系列である。 \(n\)個の対応する括弧"(, )“からなる文字列の組合せの数や、一辺の長さが\(n\)の格子の左上から右下への対角線より上を通る最短経路の数は、\(n\)番目のカタラン数である。このページでは、この2つの問題の解がカタラン数であるとして、漸化式と二項係数の2つの形式によるカタラン数の一般項を求める。

#カタラン数

July 29, 2023

Abstract Syntax Networks for Code Generation and Semantic Parsing

Abstract Syntax Networksは、非構造的な文章などの入力から、抽象構文木(AST)にしたがう系列を生成できるencoder decoderである。 decoderは、ASTの生成規則にある記号に対応するモジュールを再帰的に構成したネットワークである。モジュールは、右辺のどの生成規則を選択すべきか推定する。そして、選択した規則のモジュールをさらに再帰的に選択することで、ASTにしたがう出力を生成する。

July 1, 2023

Fibonacchi Heaps and Their Uses in Improved Network Optimization Algorithms(1987)

Fibonacci heaps(F-heaps)は、ダイクストラアルゴリズムの高速化ために開発された木構造の抽象データ型である。ノードは、1つの値を保存し、親へのポインタをもつ。また、2つのポインタによって、同じ階層にある兄弟ノードからなる双方向リストに組み込まれる。ルート階層にあるノードはいずれも親をもたない。そのほかにも、削除時に使用されるboolean型の変数がノードごとに1つある。ヒープにある要素の数\(n\)に対して、要素を償却時間計算量\(O(\log n)\)でき、また、定数の償却時間計算量でほかの主要な操作を行える。

June 24, 2023

Layer Normalization (2016)

層正規化 (Layer Normalization) はニューラルネットワークのユニットへの入力の重みつきの和を正規化し、学習時間を短縮する。各層ごとの重みを掛けた入力の総和の平均と標準偏差を求め、この2つの統計量で層の各ユニットの総入力を正規化する先行研究のバッチ正規化は、ミニバッチごとに、各ユニットの入力の重みつき和の平均と分散を計算し、ユニットの総入力を正規化する。バッチ正規化でも学習時間を短縮できるが、その効果はミニバッチのサイズに依存する。また、単純にはRNNに適用できない。

#層正規化

June 17, 2023

Universal Classes of Hash Functions(1977)

値の保存と参照からなる任意のリクエストの系列を、系列長の時間計算量で処理できるハッシュ関数と連想配列を示す。求めるハッシュ関数の集合があるとき、各ハッシュ関数の時間計算量の平均がリクエストの系列長に等しくなる。

#Hash Function

June 10, 2023

Unsupervised Cross-lingual Representation Learning at Scale (2020)

多言語モデルを大規模なコーパスで訓練し、含意関係認識、質問応答、固有表現抽出において、多言語版のBERTを上まわる予測性能を実現した。モデルのアーキテクチャはRoBERTaで、Lample and Conneau, 2019に近い方法でモデルを訓練する。 LampleとConneauの手法を含む従来の多言語の言語モデルの評価実験では、WikipediaやWikipediaと同程度の大きさのコーパスが使われていた。従来の訓練データに対し、100言語からなる2.5TBのCommonCrawlをコーパスに使い、コーパスを大規模化することによるモデルへの影響を分析した。パラメタ数などのモデル大きさを固定し、言語の種類数を30まで増やしたところ、コーパスの小さい言語の性能が向上したが、それ以上増やすと逆に予測性能が低下した。

June 3, 2023

A Majority Consensus Approach to Concurrency Control for Multiple Copy Databases(1979)

データベースを同期するためのアルゴリズムmajority consensusを提案する。アプリケーションは任意のデータベースに更新リクエストを送信でき、データベースは更新リクエストの処理について含意をとる。データベースは、タイムスタンプのついたレコードの集合である。タイムスタンプは、レコードの値の更新時刻をあらわす。