ベイジアンネットワークを少しだけかじった
WSDM2012のExploring Social Influence via Posterior Effect of
Word-of-Mouth Recommendationsという論文を読んでいたら、ベイジアンネットワークなるものが出てきた。
論文の内容はソーシャルメディア上での口コミが与える影響みたいな感じですが、この辺で詰んだのでちょっと調べてみた。
この資料がとてもわかりやすかったので、ほぼそのまま
http://www.ne.jp/asahi/hiroki/suyari/BayesianNetworkIntro1.pdf
ネットワークの特徴として
1.各ノードがそれぞれ確率変数で表され
2.ノード間の矢印が因果関係を表し
3.その因果関係が条件付確率で定量化されている有向非循環グラフ
ということらしい。
こんなん
各々のノードに確率変数が与えられていて、各矢印が、がに与える影響を表している。
この影響の度合いは、条件付き確率で定義される。
簡単な例
※一番下の行は1,1でした。
ここで、となるとき、その要因となる因子を知りたいとする。このとき、明確な答えが出せないので、確信度という指標を利用する。
今回の問題の場合は、
となる。つまり、事後確率になる。
一番上だけベイズの定理を利用して解くと
ほかの値は
今回の場合は、が高くなる一方で、同時に起こる可能性は低いこともわかる。
実際には、収集データの不足の補完(EMアルゴリズム)や、グラフ構造の決定などの課題があるらしい。
本当は簡単なコードかこうと思ったけど、ちょっとつらいので、なし。