C++

それなりにうまくいったNB

C++

前回の記事では、うまくいかなかったナイーブベイズを紹介しました.結局何が悪いのかよくわからないので別のデータを使ってやってみることにした.使用データ:カテゴリ付きの新聞記事データ 特徴ベクトル:単語出現頻度データサンプル 単語行列.txt 4191 2…

うまくいかないNB

本格的に勉強したいないぁと思い最近入門機械学習を少しづつ読み進めている. 入門 機械学習作者: Drew Conway,John Myles White,萩原正人,奥野陽,水野貴明,木下哲也出版社/メーカー: オライリージャパン発売日: 2012/12/22メディア: 大型本購入: 2人 クリッ…

ひどい実装でk-trussしてみた

C++

ちょっと前にとあるPFIセミナーで@iwiwi]先生の発表であったk-trussの実装を試してみたくてやってみた. ムリ・ムダ・ムラの連発で死にたい.すんげー時間かかって,今後の人生が不安になったりした. あと,ナイーブな実装しか試してない.エッジ削除の際の…

ファイル操作で少し困ったこと

C++

備忘録 ファイル読み込むときに" >> "を使うと >|c| void readUser(char *fn1){ ifstream fin; string str,s; int u,i; fin.open(fn1); while(!fin.eof()){ fin >> u >> s; VecU.push_back(s); } } for(i=0;i<VecU.size();i++){ cout << VecU[i] << endl; } } ||< みたいになって >|| 1 a 2 b 3 c ||< みたいなデータに対して出力</vecu.size();i++){>…

minimum spanning treeを作る

C++

久しぶりの技術ブログ今回minimum spanning treeを作る目的 ・対象ノードの関係をみる ・グラフをスパースにして視覚的に見やすくする!・minimum spanning treeとは グラフにリンクと距離が与えられたとき,重みの総和が最小になるように辺を選んで作った全…

やっと基本のEMアルゴリズム

C++

これまで勾配法で最適解を求めてきましたが、今回はEMアルゴリズムを使って解を求めていきます。EMアルゴリズムとは、E(Expectation)ステップとM(Maximization)ステップを繰り返していき、解を求めるアルゴリズムです。今回は、ガウス混合分布をですとデ…

Levenshtein Distance

C++

今日は混合分布のところが理解できずに永遠に詰んでました。大学1年に戻らないといけないかもですね…orzというわけでネタがないので、ちょっと前のやつを投下!Levenshtein Distanceを求めるプログラムです。詳しい内容はそこらじゅうにたくさんあるので、こ…

圧縮の重要性

C++

パターン認識する予定でしたがちょっと変更します。 学部3年の時から今の研究室に配属されて、今まで僕自身いろいろな大規模データを扱ってきました。そして扱った数だけ研究室のサーバを吹っ飛ばしました(笑)大規模なデータを扱う際には、サーバのメモリ…