読んだ:Community Gravity: Measuring Bidirectional Effects by Trust and Rating on Online Social Networks(WWW09)

http://www.cse.cuhk.edu.hk/irwin.king/_media/presentations/community_gravity_measuring_bidirectional_effects.pdf

 

概要

オンラインコミュニティサイト上でのユーザ(購買者)のふるまいを理解するために,ユーザの相互の関係は重要な側面となる.本稿では,e-commerceサイトの分析に加えて理論的モデルを提案する.まず,@cosmeを分析して,ユーザのTrust,評点予測を予測する際の顕著な特徴をを見つけた.さらに,”Community Gravity”という,ユーザがどのくらいそのコミュニティに魅せられているかを測る指標を提案する.

 

前回読んだものの参考文献から引っ張ってきた.

 

@cosmeを利用したTrust予測,評点予測

Trustはユーザのお気に入りネットワークのリンク予測でいいのかな?

 

まず,コミュニティが強力なCommunity gravityを伴いながらどのように成長するのかを理解するために,製品の評点とユーザ間の信頼の間にある相互関係をモデル化する.

 

モデルは論文を.

 

このモデルにおけるパラメータは,製品やユーザの特徴に依存するので,まずはその特徴として貢献しそうな特徴量を分析する.

 

●Trust Prediction

 

特徴量

・Profile:ユーザのプロファイル

・Rateing:製品の評点(ユーザから製品に関する特徴量:Allレビュー,Goodレビュー,Badレビューそれぞれで特徴量作成,製品自体の特徴量:総合レビュー数など)

・Trust:Trustネットワーク:隣接ユーザ数,共通ユーザ数,共通ユーザの類似度(Adamic,jaccard,cosineなど)

 

実験はランダムに信頼関係のあるユーザペアを選び,関係のないユーザとのTrustが次の時間でどうなっているかを予測する.

識別機には線形カーネルSVMを使用

 

・結果

全Feature(Profile,Rating,Trust)を使用するのがもっとも分類精度がよい.

ユーザがTrustしている数,Trustされている数が,Featureとして重要(多くのユーザ方TrustされていればTrustされやすいし,多くのユーザをTrustしていればTrustしやすい)

あとは,隣接ノード集合のJaccardとか,製品のレビュー類似度(Cosine)とか

 

●評点予測

・特徴量

RatingとTrustについては,Brandと製品についてのFeatureを計算する

 

・実験

細かい評点予測ではなくGoodかBadかの予測をする

 

・結果

Rating+Trustが最も精度がよかった.Allも同じくらい.

製品のレビュー数,レビューされたユーザ数が重要な特徴量.また,ユーザのブランドへの評定平均,Trustしているユーザの評点平均も重要.

 

この結果で得られたHigh weighted Featureを利用して,3章で作ったモデルのパラメータを求める.

->求めた

 

●Community Gravity

前章で求めたパラメータの値は,全製品を考慮しているが,ブランドごとで値は変わるはず.特に,このパラメータの値が高くなる→Community Gravity→ユーザの相互の影響,効果大である.

 

そこで,各ブランドごとにCommunity Gravityを計算する

 

・評価

Community Gravityが高いブランドに関して,Leskovecらが提案したRecommendationネットワークを使って評価

ユーザBがTrustしているユーザAがレビューした商品をユーザBが購入したときにReccomend関係(有向リンク)を構築する(たぶん)

 

・結果

Community Gravityが高いブランドはRecommendationネットワークが非常に密で最大連結成分が大きい.連結成分数も少ない.

Community Gravityの高さとRecommendationの成功率には正の相関がある.

Community Gravityが高いブランドは割と自分でも知ってるものだった.

 

●議論

・Evolutionモデルへの言及

・Epinionデータセットでも分析→大体同じ結果が出る

 

手持ちのデータセットで試せないかなぁと考えている.