Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer(2020)
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformerは、 複数の異なる自然言語処理を、統一的にテキストからテキストを生成する問題とみなした大規模な実験によって、自然言語処理への転移学習の応用に見通しをつけた。 この統一的なアプローチは、Text-to-Text Transfer Transformer(T5)と名づけられた。 既存の技術への理解を深めることを目的としており、新たなアルゴリズムの提案はない。 一方、調査する技術の限界を調べるために、大きなデータが必要であったことから、新たなデータセットColossal Clean Crawled Corpus(C4)が作られた。 C4には、Common Crawlから抽出された英語のテキストがふくまれる。