4.EMアルゴリズム

参考文献[4],pp4-6

(2)EMアルゴリズムの幾何学

 適当な条件を満たす確率分布p(r)の多様体S={p(r)}を考えます。パラメトリックな指数型分布族M={p(r;θ)}は、Sの部分多様体となり、これをモデル多様体Mとよぶことにします。
Mはe-平坦な部分多様体となります。

 観測されないデータが存在しない場合、観測データrが与えられると、それに対してS上の一点ηを対応させることができます(下図a)。しかし、この点は必ずしもモデル多様体に属しているわけではありません。そこで、Sの点ηに対応するM上の点θを求めることになります。これが最尤推定量θとなります。

 EMアルゴリズムでは観測されないデータの存在を仮定するため、観測データからすぐにS上の一点は特定できず、候補となる点が集まった部分多様体が対応することになります(下図b)。この部分多様体をデータ多様体Dとよびます。データ多様体は、m-平坦な部分多様体となります。

 ここで、次ページに示す手順を繰り返すことでM上の最尤推定量θを求めます。


Introductory Study of Information Geometry
[ まえ | 目次 | つぎ ]