#253 過学習とは(プログラミング)

過学習とは、与えられたデータに適用し過ぎてしまい、正しい基準が構築されないことである。

 

深層学習では、ドロップアウトという手法を用いることで過学習を防ぐ。

 

これは、学習時にランダムに一部のニューロン(特定の入力に対して値を出力するもの)を消し去る手法。

 

他にも、過学習を回避する方法の代表的なものの1つに、正則化がある。

 

正則化とは、偏りのあるデータの影響をなくす方法のこと。

 

データの集合から外れているデータの影響を正則化を用いることにより消している。こうすることにより、データを学習し過ぎることなく、データを分類することができる。

 

データを起こしているモデルのことをバリアンスが高いと言い、学習不足を起こしているモデルのことをバイアスを高いと言う。