FIT2012で発表してきました
本日9月5日
「Mentionツイートからのバースト期間の抽出」
と題して発表してきました.
手法としては,あるトピック(ここでは,たくさんMentionされたユーザとハッシュタグを仮定)に対するツイートの投稿時刻を利用します.
このツイートの投稿間隔が指数分布に従うと仮定して,このパラメータが大きく変化する点を2つ求め,その箇所をバースト区間として検出するものです.
検出されたバースト期間のバーストの強さ、バーストの持続性,衰退などの特徴について考察し,情報拡散モデルへの応用について議論しました.
本当は資料載せたいですが,載せていいのも悪いものの判断がつかないので…
議論としては,確率過程の仮定が妥当かどうかというのが最大の課題な感じがしました.先行研究に合わせているわけですが,現実的には,データに合わせるべき部分であると思います.
もう一つとしては,数字ばっかりが先行して,それが実際にマーケティングなんかで使えますか?という話.これは,@y_benjoさんが紹介しているICMLのこの論文での主張と同じだと思います.この議論に関しては,大学の研究室だけでは少し難しいと感じていて,分野(データ)の専門家の知識が必須になると思います.なので,企業の方々と共同で取り組むようなイメージにならないといけない感じがします.
幸いにも,今回も過去の発表でも,企業の方々と議論を交わすことができ,この分野に興味を持っていただいていると感じることがおおいので,現実で使えるような技術と現在の状態のギャップを埋められるような研究ができるとよいなぁと感じました.