Exploring Social Influence via Posterior Effect of Word-of-Mouth Recommendations(WSDM2012)読んでみた…

アブスト
口コミは商品を促進させる効率的な戦略として示されてきた。既存研究では、口コミ推薦が、ユーザの事前確率(期待?)を押し上げ、それゆえ本を買ったり、映画を見たりする際に、信頼できる新しいものを採用することを推奨することを証明してきた。
しかし、口コミ後の影響をに関する研究はそれほど行われていない。たとえば、口コミ推薦がユーザののちの評価に影響をあたえるかに対する答えは、バイラルマーケティングに重要。
そこで、本研究にて口コミ推薦が推薦を受けたユーザののちの評価に関係することを示す。
最後に、フォロワーののちの評価からユーザの影響度を調査する手法を提案し、78%の強い影響量を持つ友人を確認することに成功した。

データ
商品購入(レビュー?)サイトのDoubanとGoodreadsを利用。"recommend"ボタンを押すと友達に紹介できるらしい。

・基本的な評価

1.高いレートつけたユーザのrecommendがある場合とない場合でのユーザのレートを見ると、recommendがある場合の方が高くなる傾向。

2.口コミ推薦された数が多くなるとcollection数も増加、レートも口コミ推薦されたものが最も高く、他人の推薦や推薦なしのものより低い。


・次に事後評価モデルを構築(ベイジアンネットワーク)

f:id:A_Koide0519:20120221200736p:image

c:共通因子の組み合わせ(?)
r:レート
m':友人の推薦のあるなし

後者がベーシックなモデルに推薦ユーザのレートが与えられたパターン。
r':推薦したユーザのレート

m'=1のときは、推薦ユーザのレートをr'にし、m'=0のときは、各ユーザに推薦したことのある友達からランダムに選択してr'とする。

m'に0と1を与えたとき、r'の値によりp(r|m'=1,r')p(r|m'=0,r')の確率分布の違いが有意であるかについて、統計的仮説検定を利用して考察する。t検定とKS検定を利用。

有意水準\alpha=0.05とする。

ここで、データ点の分割数に応じて棄却率の変化をみると、分割数が増える頬度、検定の棄却率が増加する。どちらの検定、データ共に高い棄却率。

3.ユーザののちの評価は、友達が事前に推薦したアイテム関係に依存している

・影響力の強い友人とは

4.出次数の高い友人と、本論文で定義されているsensitive:Sが高いユーザが影響の強いつながり

この2つのFeatuerを使った影響力の強いユーザを発見するモデルを構築

R_{u,v}^{combined}=(R_{u,v}^{sensitive})^{\lambda}(R_{u,v}^{out-degree})^{1-\lambda}
ここで、u,vはedge(u,v)、0\leq\lambda\leq1とする。

5.この\lambdaの値を変化させることで、最大78%の精確さで影響力のある友人を予測できる。


こんなに読めてないものをさらしてもいいのかって気持ちが大きくなってきたけど…気にしない。
最初のうちは納得しながら読めていたのに途中から置いてけぼりになった。あといつも思うのが、表の読み取りがうまくできてないから、たぶんだいぶ解釈が違うはず。この論文はいろんなところで正規化しているけど、何をどんなふうに正規化しているのかいまいちわかっていないかも…

今回のように明らかにフォロワーに向けて推薦していることがわかるデータがあると、いろいろやりやすいなぁと思う。

フォロー関係がある中で、推薦とかレーティングがあるっていうこのサービス自体も面白い。

データ可愛いよデータって感じですね。