WebDB2011

先週の土曜日になりますが、WebDB2011に行ってまいりました。

前年は一応発表もしたのですが、今年は間に合わず(関係者の皆様申し訳ないです)、行くかどうか迷ったのですが、先輩が論文賞を取ったこともあり、行くことにしました。

WebDBのすごいところは、スポンサー企業が充実していること。
http://db-event.jpn.org/webdbf2011/index.html:WebDBトップページ

これを見てもらえれば十分伝わるかと。

それはさておき、自分が見てきた発表の感想をば

ユーザモデリングと応用(3G-1)
  11/5(土) 9:30-10:45    座長:中村聡史(京都大学

ホテル業界におけるクチコミ情報に基づいた顧客満足度予測モデルの構築とポジショニング分析
 藤井絵美子(関西学院大学), 植野剛, 中元政一, 東高宏(JST ERATO 湊離散構造処理系プロジェクト), 加藤直樹(京都大学), 羽室行信(関西学院大学)

大阪のホテルの口コミ情報からホテルの評価表現を抽出し、その表現の類似性からグラフ構造を作り、そこからいくつかの実験(コレスポンデンス分析など)を行っている。
結果自体は裏付けまでできていて納得できた。ただ、予測モデルの構築というのがどこにあったのかがよくわからず、普通に口コミ情報からマイニングを行ったというよう感じた。聞き逃しただけかも…



テキストマイニングと応用(4G-1)
  11/5(土)11:00-12:15    座長:天笠俊之(筑波大学
ウェブのリンク構造と語の共起を利用したキーワード抽出に基づく情報検索結果の概念構造化
 吉永直嗣, 延原肇(筑波大学)

google検索のようにランク付けされたWebページを提示するだけでなく、そのWebページをキーワードの共起関係を用いて構造化し、ユーザに提示する。Webページの文字数が少ないときには、リンク先のページの類似度の高いものを選定する。
同じような話を筑波大学のほかの方から聞いたことがあるような気がする。陽にいっていなかったけど、レスポンスはどれくらいなんだろうか。構造化する部分で特徴語の共起関係を抽出しているが、ここでそれなりの時間を要するような気がして、仮にシステムに組み込むとして、ユーザが満足するスピードを実現できるのかが大きな壁な気がする。


論文賞セッション
  11/5(土)13:15-14:50    座長:中島伸介(京都産業大学

品詞n-gramを用いた著者推定手法 −話題に依存しない頑健性の評価−
 井上雅翔, 中島泰(早稲田大学), 山名早人(早稲田大学,国立情報学研究所)

品詞n-gramを用いて著者推定を行う。
背景として、同一ユーザの文章であってもカテゴリが異なると単純な手法では同一ユーザとして検出できないということがある。それが品詞n-gramを用いることで既存手法よりも高いパフォーマンスを発揮し、さらに様々な話題の変化において頑健であるという流れだったと思う。
発表を見る限りだと、推定精度・頑健性ともに向上しているけど、特に頑健性のプロットを見た時に、それほど頑健性が改善されているように見えなかった。もしかしたらこの分野では劇的な改善なのかもしれないのでなんとも言えないけれども…
個人的には、やはり話題によってユーザの文体が変化する部分も大きいと思うので、なかなか難しいのかなぁと思いました。

推薦システムにおけるユーザ関与とユーザ満足度に関する研究
 土方嘉徳, 甲斐裕樹, 西田正吾(大阪大学)
推薦システム構築の際には、これまでいかにユーザの手間を掛けさせないでユーザ満足度を向上させるかということが考えられていたが、最近になってユーザに事前にアンケートなどのユーザ関与を行う手法が提案されており、その関連性を実験により明らかにしたというお話だったと思う。
ユーザの介入によってユーザ満足度が向上するというのは、非常に面白かった。聞き逃したかもしれないけど、どの程度の介入がベストなのか、また、推薦システムの内容(本・お見合いなど)によってこのあたりの満足のが変わるのかというのもぜひ見てみたいなぁと思った。
ユーザが持つ属性のような情報が陽にわかると様々な分析に使えそうなので、ユーザが介入しているようなシステムが今後多く生まれてくるといいなぁと思う。

ネットワーク機能コミュニティ抽出法の提案
 伏見卓恭, 斉藤和巳(静岡県立大学), 風間一洋(NTT)

先輩の発表。NW内のユーザの機能に注目しクラスタリングする手法の提案。
細かい部分を聞いたことがなかったので、ほぼ初見に近かったけど、ありそうでなかったというか、普通に面白いなぁと感じた。やはり自分の興味のある分野であるし、今後もいろいろ教えていただければなぁと思う。各ユーザのフィーチャーにPagerankの影響度曲線を使っている。高度なことをしているわけではないのだけれど、目の付け所がいいなぁ。

全体的な感想としては、少し興味の分野がずれていたかもしれないという感じ。初日は今分析している内容に近いものがあったのでぜひ見たかったが、外せない用事があったので仕方なし。

来年は僕も出せるように頑張らなければ…!

優秀な先輩と先生がいて幸せです。