Posts

論文メモ SQuAD: 100,000+ Questions for Machine Comprehension of Text

読解タスクのテストデータセットSQuADをつくり、ロジスティック回帰で難易度を評価した。難易度は、ベースラインのF1スコアが20%, 強いモデルで51.0%, 人間で86.8%程度である。

August 28, 2020

論文メモ Extensible Effects An Alternative to Monad Transformers

モナド変換子にかわるモナドの合成方法Extensible Effectsの実装を示す。

August 23, 2020

論文メモ When and Why Your Code Starts to Smell Bad

200件のAndroid, Apache, EclipseのOSSプロジェクトのコミット履歴を調査し、不吉な匂いが生じる原因と理由を調査した。常識では、改修の繰返しによって匂いのない既存のコードに匂いが生じると考えられているが、これに反して、不吉な匂いのするコードのほとんどが作成時点で不吉な匂いを出していたことを明らかにした。

August 21, 2020

論文メモ Extracting and Composing Robust Features with Denoising Autoencoders

ノイズを含む入力からノイズのない入力を復元するように学習すると、次元圧縮の性能を向上できることを示した。層の深いautoencoderを学習するには、良い初期値を与えなければらないことが知られていた。先行研究は、各中間層を個別に学習することで、良い初期値を求められることを示した。具体的には、各中間層について、前の層の入力から次の層の出力を推定できるよう個別に学習させる。一方で、何が良い初期値をなすのかは知られていなかった。表題の論文は、その条件は入力に含まれるノイズに対して頑強であると仮説をおき、ノイズを除去できるように目的関数を設定することで、次元圧縮の性能が上がることを示し、仮説の正しさを確かめた。

August 21, 2020

論文メモ Statistical Errors in Software Engineering Experiments: A Preliminary Literature Review

ソフトウェア工学の実験において、統計をもちいた手法がどれだけ誤用されているかを調査した。薬学や心理学の実験では、統計による手法が時に誤って使われていることが知られている。一方で、ソフトウェア工学では、どの程度誤用がみられるのかは分かっていない。著者らは、2006から2015年のソフトウェア工学のトップ会議ICSEで発表された論文770件から、実験や評価に統計的手法をもちいたものを選び、10の観点からなる判断基準で、手法の妥当性を評価した。

August 14, 2020

論文メモ Semi Supervised Learning with Ladder Networks

Ladder Networkを半教師あり学習に応用する。 Ladder Networkは、2015年に、著者の一人Valpolaによって教師なし学習のためのネットワークとして発表されている*。

August 14, 2020

論文メモ An Empirical Study On Program Failures On Deep Learning Jobs

Microsoftの社内では深層学習のプラットフォームPhillyが運用されており、そこで起きた4960件のジョブの失敗原因を調査した。調査では、失敗の原因を20のカテゴリに分類し、カテゴリごとに失敗の件数を集計した。

August 7, 2020

論文メモ A Tale from the Trenches: Cognitive Biases and Software Development

エンジニア10人の普段の開発状況から、認知バイアスが開発者にあたえる影響やバイアスの頻度、対策方法について調査した。

July 31, 2020

論文メモ Factorization Machines

Factorization Machineは、Matrix factorizationのようなFactorization modelとSVMの両方の利点をもつ。 Matrix modelには疎な特徴を入力することができるが、予測のモデルに使うには汎用性に欠ける。一方、SVMは、汎用的であるが、推薦システムで使われるような疎な特徴を扱うことができない。 Factorizatiom Machineは、両者の利点をそなえており、疎な任意の実数を要素にもつ特徴ベクトルを扱うことができる。また、予測の計算量が線形であり、必要なパラメタの数も線形であるため、SVMのサポートベクタのように訓練データをモデルに持たせる必要がない。そのために、大量の訓練データを使う学習も可能となる。

July 31, 2020

Exploration of Technical Debt in Start-ups

スタートアップ86社を調査し、スタートアップにおける技術的負債を招く要因(precedents)、負債を抱える側面(dimentions)、その影響(outcomes)について調査した。チームの人数の多さと熟練度の低さが負債の要因を誘発し、負債はテストの不足によくみられた。

July 24, 2020