ruby

うまくいかないNB

本格的に勉強したいないぁと思い最近入門機械学習を少しづつ読み進めている. 入門 機械学習作者: Drew Conway,John Myles White,萩原正人,奥野陽,水野貴明,木下哲也出版社/メーカー: オライリージャパン発売日: 2012/12/22メディア: 大型本購入: 2人 クリッ…

配列に対するindexとHashのアクセス時間が違いすぎてやばい

Rubyでn-gramの計算をするためにプログラムを書いていたが、全くスピードが出ず悩んでいたら、配列に対してindexでアクセスしていたところを配列ではなくてHashで組んだら改善された。http://d.hatena.ne.jp/A_Koide0519/20111002/1317535717:前回に比べて、…

N-gramモデル作ってみた

ちょっと必要になったので。今までテキストデータを使った研究をしていた時には、一つのドキュメントにそれなりの文字数が使われていたので、形態素解析(chasen・MeCab)→助詞等を削る→各ドキュメントを単語のfeatureベクトルにという流れが常套手段だった…

system 関数の出力をファイルにリダイレクト

今日はここでほとんどの時間を使ってしまった…。system() の中で標準出力をファイルにリダイレクトしたいのだが、リスト形式だとうまくいかない問題が発生。これにはちゃんとした理由があって、system 関数の出力をファイルにリダイレクト(perl)*1によると、…