JSAI参加してないメモ

学会には当分参加できそうにないし、論文読んで気分だけ味わう。

とりあえず気になるセッションの目に入った論文を読む

・ソーシャルメディアを用いた支持獲得に関する分析と提案

AKB総選挙を題材とし、Google+のアクションを使ってファンの傾向を分析

1.G+上でのファンの人数と選挙の順位には相関がある
2.多くのユーザは多数のAKBのメンバーのファンであり、順位が低いAKBメンバーのファンはその他大勢のメンバーのファンでもある
3.ファンユーザの類似度を使ってABKメンバー同士のつながりを可視化
‐>Jaccard係数を使って閾値0.3以上でエッジを張る
‐>AKB同士、NMB同士で類似しやすい.さらにその中でコアノードがみられる
4.ファンの遷移を遷移ネットワークとして可視化
‐>投稿間隔が一日以上離れた投稿に関するアクションに着目してファンの反応の順番をファンの遷移と考える
‐>遷移ネットワークをみると、ファンの多いメンバーは出次数(ファンの流出)も多い
‐>ファン数が大きくても出次数0のメンバーもいる

これらを踏まえて支持獲得の戦略を考える
1.の結果から、投稿あたりの平均ファン数を増やすことが目的
○最も支持者を獲得できるような競合ユーザを求める問題(その競合ユーザと一緒にメディアに露出するなどの戦略が考えられる)

あるメンバーの支持者を調べたい‐>競合メンバーの選出‐>支持者の遷移ネットワーク作成(遷移人数を重みとした有向エッジ)‐>ある競合ユーザから、対象ユーザへの支持者の遷移がx倍された時の対象ユーザのページランクを算出.→ページランクの増加効果が最も大きい競合者を選択

実験では、提案手法を用いて実際にあるメンバーの競合者を求め、評価として、AKBファン6人、芸能関係者4人にアンケート。
比較として、G+上でのファンの多いメンバー、ファンの類似度が高いメンバー、など4つの指標と比較
結果として、提案手法はAKBファンからの評価が高く、芸能関係者からの評価はあまり良くなかった。この結果は、芸能関係者からは分からない、ファン視点の戦略として行けせる可能性があることを示唆している.

                    • -

遷移ネットワークの作成過程はこれでいいのかな.メンバーの投稿頻度やイベントに依存しないのかが気になる.提案の評価はもっと大人数のファンで実施したらどうなるだろう…後は実際にメンバーが使ってくれたら面白い!


・集合注意の創発とRTネットワークのダイナミクス
ツイートストリームの定常と非定常の差に着目してTwitter上の集合注意を定量的にとらえる

一日のツイートを30分単位で分割してツイート頻度の確率分布を作成。一年分の確率分布も作成して、この分布の差を使う.
差の定量化を行うため、JSダイバージェンスを用いる。
JSの値を確率変数とした分布がガウシアンに従うと仮定し、3\sigma以上大きなJS値を取った日を集合注意が行われた日として出力する.

データは2011年と2012年の約5億のツイートを利用

60件の事象を観測。東日本大震災等の自然災害がJS値が大きくなりやすい
スポーツイベント(なでしこ優勝)などもみられる


RTをもちいて集合注意にかんしてさらに分析
・JS値が大きいような事象はRTネットワークに大規模なコアや連結成分ができやすい
・集合注意の創発と関連キーワードのバーストに相関

類似研究であるバースト変化に着目したものと比較して、この手法では非バースト的なものや分散的なツイートパターンを持つ事象に関しても検出できる

                    • -

不勉強で、集合注意という概念がよくわかっていない。
バースト検出の研究をやってきたけど、確かにこの提案手法では、非バースト的なものも検出できそう.ただ、その具体例みたいなものは示されてない(?)


・Twitterにおける情報フローネットワークの提案と分析

Twitterの情報伝搬経路を用いた情報フローNWと単純なフォローNWの比較とか
同じURLをつぶやいたユーザを情報伝搬経路としてエッジを張る(フォロー関係とは逆向き)
また、各URLには意味的情報という名のN次元ベクトルが付与される.

情報フローネットワークは、全ての情報伝搬経路重ね合わせた多重グラフとして構築される.その際、任意のユーザ間の隣接行列は、意味的情報ベクトルを足し合わせたものになる。

フォローネットワークの次数による順位とフローネットワークの重み付き次数(?)の順位相関を取る。フローネットワークの隣接行列の重みはベクトルになっているので、任意の単位ベクトルとの内積を取ってスカラに。

今回はニュースサイトの4つのカテゴリのURLを使い、URLの意味的情報は所属カテゴリの有無で1,0の値を付与した4次元ベクトルを考える。各カテゴリ間の次数の順位相関をみる。

結果として、フォローネットワークの次数と各カテゴリのフローネットワークの次数にはそれほど相関がない。スポーツカテゴリとアートカテゴリは他のどのカテゴリとも相関が低く、独特な拡散経路が構築されていると言える。

‐‐‐‐‐‐‐‐‐
知識不足なのか、ありがたみが完全には分からなかったかも…今回は意味的情報ベクトルを非常に簡潔に考えているので応用が気になる。