資料作成
今日は一日中,金曜日のセミナーの資料作成をしていました.
講演タイトルはもうアナウンスされているはずで,確率統計学に関係ない数学者にEMアルゴリズムの話をします.ただ,学生さんが多いだろうというお話を聞きましたので,理解しやすいように例を考えました.これが大変.
塾や学校の先生をしてみると分かると思いますが,数学や理科のテスト問題を作るのって,結構大変です.問題を設定して,答えを作って,なおかつそれによって問題を解いた人の理解が深まるようにしなければなりません.
今日,僕が作ったのは三つ(四つ).
標準正規分布は,平均がゼロ,分散が1と決まっていて,推定するものがないので何もしなくて良い.(これはまあ,意味なし.半ウケ狙い)
これは正規分布がいくつかあるという状況で,正規分布に基づく確率で発生する入力信号がたくさん入ってきたときに,どの正規分布から発生したかを隠れ変数として元の正規分布のパラメータを推定する問題です.一からEMアルゴリズムの式を導いたので,基礎的な計算練習のやり直してなんか色々思い出しました.
さらに,実際に推定する様子がその場で見られるように,Mathematicaでその場でデモが出来るプログラムを作りました.
これは複数の正規分布を足し合わせた確率分布があるとして,入力信号から正規分布とその重み(足し会わせ度)を全て推定する問題です.ただし最初からパラメータが多いとイヤになると思ったので,位置だけ違う複数の正規分布の足し合わせにしました.
これはもう,全てのパラメータを推定します.ここまで来たら実用になります.
こちらは,産総研の赤穂さんのJavaアプレットでデモをすることにしました.
さて,まだ2/3くらいしかできてません.大学で話すからには,基礎に加えて最先端の情報を提供しないと.何たって学生さんだけじゃなく,スタッフも一応来ますから.今日と明日,まだがんばろう.