next up previous
Next: 教師強制 Up: RNNの基本的学習方法について Previous: BPTT法

RTRL法

これは前のものとは異なり、誤差の逆伝播を行わず、1時刻前の勾配の情報を用いて実時間で学習を行う方法である。
具体的には、各ユニットの出力の微分的な依存関係を線形連立方程式の形で表現し、厳密な最急降下学習則を求めるというものである。

いま、時刻tにおける実際の出力と教師信号の2乗誤差関数 E(t) を

displaymath605

と定義する。 このような誤差関数 E(t) を結合荷重 tex2html_wrap_inline517 で偏微分すれば、

eqnarray174

となる。

ここで tex2html_wrap_inline617 に注目して tex2html_wrap_inline619 とおけば、

eqnarray198

ここで tex2html_wrap_inline621 は、

displaymath606

となるクロネッカーのデルタである。

したがって 、 tex2html_wrap_inline623 は1時刻前の tex2html_wrap_inline625 から計算できることがわかる。 ここでネットワークの初期状態は結合荷重とは無関係であるため、 tex2html_wrap_inline627 のとき、 tex2html_wrap_inline629 とすることができる。よってこの初期条件から順に計算を行うことができる。 ゆえに、学習率を tex2html_wrap_inline599 とすれば、結合荷重の更新量 tex2html_wrap_inline633 は、

displaymath607

となる。 このようにRTRL法では tex2html_wrap_inline623 を逐次計算することができ、BPTT法のように過去の 入出力や結合荷重を保存しておく必要はない。



Hitoshi Kobayashi
Wed Jul 26 04:25:55 JST 2000