2011-10-01から1ヶ月間の記事一覧

やっと基本のEMアルゴリズム

C++

これまで勾配法で最適解を求めてきましたが、今回はEMアルゴリズムを使って解を求めていきます。EMアルゴリズムとは、E(Expectation)ステップとM(Maximization)ステップを繰り返していき、解を求めるアルゴリズムです。今回は、ガウス混合分布をですとデ…

ニュートン法,準ニュートン法

この時期になって就活のメールが届くようになってきました。 正直まだ早いなぁという気持ちですが、そろそろ準備しないとまずいんですかね。M2の皆様のアドバイス大募集中です。(身近にM2の先輩がいないので…割と本気でお願いします)さて、前回は最急降下…

最急降下法と共役勾配法

前期の授業で習ったまま放置してたのでちょっと復習。最適化問題を解く際に利用される手法。数式を書くには体力が足りないので…今回はケプラーの第3法則をデータとして利用しました(授業で)D:太陽との距離 R:公転周期 K:定数みたいな法則があります。今…

Levenshtein Distance

C++

今日は混合分布のところが理解できずに永遠に詰んでました。大学1年に戻らないといけないかもですね…orzというわけでネタがないので、ちょっと前のやつを投下!Levenshtein Distanceを求めるプログラムです。詳しい内容はそこらじゅうにたくさんあるので、こ…

N-gramモデル作ってみた

ちょっと必要になったので。今までテキストデータを使った研究をしていた時には、一つのドキュメントにそれなりの文字数が使われていたので、形態素解析(chasen・MeCab)→助詞等を削る→各ドキュメントを単語のfeatureベクトルにという流れが常套手段だった…

k-nnを使った簡単なパターン認識

勉強がてらに簡単にやってみました。k-nn法(k-nearest neighbor method)は、本来確率密度を推定する際に、ノンパラメトリック(推定がパラメータに依らない)な手法をして用いられますが、これをパターン認識に応用することができます。詳しくはPRML上巻のノ…