Next: RNNの用法
Up: second-orderのリカレントネットを用いたオートマトンの学習
及び抽出
Previous: 対象とする問題
ここで用いられるのはsecond-orderのRNNと呼ばれるものである。そこで、first-order ・second-orderのRNNとはそれぞれどのようなものを指しているのかを説明する。
- first-order ・second-orderのRNNについて
ここで、first-order ・second-orderと呼んでいるRNNは、それぞれの結合の違いによって区別される。(具体的には図1,2を参照)
second-orderのRNNは、 であらわされる N 個の入力へのフィードバッ
クを持った隠れユニットと、フィードバックを持たない であらわされ
る L 個の入力ユニット、 であらわされる実数値の 個のウェイトを持っている。またウェイト は、次のステップの隠
れユニット に対して、隠れユニット と入力ユニット
の積が与える影響を表す。それに対して、first-orderのRNNのウェイトは隠
れユニット と入力ユニット のそれぞれの値に対して影響をあ
たえる。従って、ウェイトの個数はこの場合 (N+L)N 個となる。first-order
・second-orderのRNNの構造的な違いは、ウェイトの数である。また、
second-orderのRNNの、入力ユニットの数が隠れユニットの数に比べて少ないう
ちは、first-orderのネットワーク同様、ネットワークの複雑さは で増大するだけである。
このsecond-orderの形式において、ネットワークの入出力を[0,1]とし、入力記号の数だけ入力ユニットを用意することで、隠れユニットと入力ユニットの積はAND演算に、重みづけ和はOR演算に相当することになる。従って、first-orderにおける図3のようなネットワークは、second-orderにおいては図2のように、より一般的に表すことができる。
さらに、隠れユニットにあるオートマトンの状態を割り当てることで、その状態
遷移{input,state} {nextstate}をより明確にあらわすことができる(図4(a),(b)参照)。このようなオーダーの違いはネットワークの能力にも大きく影響する。
図 1 first-orderのRNNの構造
図 2 second-orderのRNNの構造
図中のmultは積を表す。
ウェイト は、入力 と隠れユニット の積が、次の
時間ステップ t の隠れユニット に与える影響を表す。
図 3 first-orderのRNNの一例
図 4 second-orderのRNNとオートマトンの状態遷移との対応
(a)は、オートマトンが状態 にあるとき、入力 により状態
に遷移することを表す。(b)はsecond-orderのRNNによる、(a)の表現で
ある。ここで灰色のノードはその持つ値がある値以上であり、対応するノード
が状態、または入力として選択されていることを表す。隠れユニット
がそれぞれ(a)における状態 に、入力ユニット
が入力 に対応する。
Hitoshi Kobayashi
Wed Jul 26 02:38:44 JST 2000