RTRL法

Next: 教師強制 Up: RNNの基本的学習方法について Previous: BPTT法

これは前のものとは異なり、誤差の逆伝播を行わず、１時刻前の勾配の情報を用いて実時間で学習を行う方法である。
具体的には、各ユニットの出力の微分的な依存関係を線形連立方程式の形で表現し、厳密な最急降下学習則を求めるというものである。

いま、時刻ｔにおける実際の出力と教師信号の2乗誤差関数 E(t) を

と定義する。このような誤差関数 E(t) を結合荷重で偏微分すれば、

eqnarray174

となる。

ここでに注目してとおけば、

eqnarray198

ここでは、

となるクロネッカーのデルタである。

したがって、は1時刻前のから計算できることがわかる。ここでネットワークの初期状態は結合荷重とは無関係であるため、のとき、とすることができる。よってこの初期条件から順に計算を行うことができる。ゆえに、学習率をとすれば、結合荷重の更新量は、

となる。このようにRTRL法ではを逐次計算することができ、BPTT法のように過去の入出力や結合荷重を保存しておく必要はない。

Hitoshi Kobayashi
Wed Jul 26 04:25:55 JST 2000