BPTT法

Next: RTRL法 Up: RNNの基本的学習方法について Previous: RNNの基本的学習方法について

BPTT法

BPTT法は、時刻から t までネットワークの計算を行いながら、入出力と結合荷重を保持しておき、その後 t からまで誤差の計算、および結合荷重の更新を行う方法である。そのため、この際用いる出力の教師信号は時刻 t におけるもののみで、時刻から t までの間のものは用いない。この方法は離散時刻の場合には、RNNをフィードフォワードの階層型NNとみなしてBP法を適用することと等価である。ここで時刻における入力と時刻 t のみにおける教師信号を与えたとき、時刻 t における出力ユニットの出力が教師信号になるような学習法を考察する。

ここで、ネットワーク全体の2乗誤差関数を

とする。ただし、

である。

この誤差関数 E を極小化するような学習則を考えたい。ここでは各時刻ごとの結合荷重は時刻には依存しない定数であるとする。誤差関数 E を結合荷重で偏微分すると、　　　

eqnarray73

となる。よって、を計算するためには、を求めなければならない。そのため、出力ユニット（）・隠れユニット（）の2つの場合を分けて考える。まず、、すなわち出力ユニットへの結合荷重に対しては、

eqnarray103

次に、、すなわち隠れユニットへの結合荷重に対しては、

eqnarray121

となる。従ってこれらから、を再帰的に求めることができる。ここで、

とおけば、

と整理される。よって、結合荷重の更新は

とすればよい。ここでは学習率である。

前述のようにBPTT法では学習を行う際、入出力や結合荷重を保持しなければならない。よって考慮する期間が長くなるほど、計算量と必要なメモリーの量が増えていく。このような理由から、BPTT法では無限に続く波形を学習することは不可能である。実際に学習を行う場合には、過去の入出力や結合荷重をすべて保持せず、あらかじめ定められた h 時点前までのデータのみを保持し、それ以前のデータは保持しないで、近似するという打ち切り型通時的逆伝播（truncated BPTT）法が提案されている（Williams and Zipser,1989;1995）。この方法を用いることで計算量と必要なメモリーの節約が可能である。しかし、近似に必要な h が大きくなれば同じことであり、上に書いたような問題に対しての根本的解決とはならない。

Hitoshi Kobayashi
Wed Jul 26 04:25:55 JST 2000