読んだ:Adscape:Hervesting and Analyzing Online Display Ads(WWW2014)

Adscape:Hervesting and Analyzing Online Display Ads
ディスプレイアドに関する多角的な分析。特にターゲティング広告に関する分析になっている。
Adscape:ゲーム内に広告を配信する技術を開発している会社。大正義G社によって買収。
今回の論文ではデータの収集部分にもかなり力が入っており、クリエイティブ(広告の制作物)やランディングページ(広告のクリック先のページ)に関しても収集する。
分析の結果、ターゲティングは広く利用されているが、配信される広告がユーザのプロファイルに依存しない多くの例があることがわかった。
さらに、ターゲティングが使われる際に、特定のタイプのアドはユーザのプロファイルの詳細や、ユーザの訪問パターンと一致することがわかった。

※adscapeの考え方
ユーザu(t)がWebページw(t)に時刻tでアクセスする。w(t)の配信者はアド集合a(t)u(t)にみせる。さらに配分関数f_w(t):u(t) \rightarrow a(t)を定義。この関数は、以下のものに依存。
1)ユーザのデモグラ
2)サイトwの内容
3)時刻t、ユーザの過去の行動やwの過去のコンテンツ
4)アド集合a()
5)インセンティブや市場の状況
最終的な目標は、これらをクローリングして追跡することでユーザターゲティングの様相を理解すること。

データの収集の方法がかなりしっかり書かれていた。(カット)

●データの収集
314Webサイト(主要Webサイト)と340カテゴリ(Google独自の技術)を準備。
2日間でおよそ80万のimpsと17.5万のアドを収集。3700の広告主と106のアドサーバから成る。

●分析
・Webページとプロファイルの重要性
ユニークアドの90%は、世の中の2%のWebページで表示されている。(GとかYとかBとか)
・ページに対する広告数
1pageに対して大体2-4くらい広告がつく。そしてその広告はたいてい異なった広告主で構成される。
・各ページのターゲティング比率
50%以上のWebサイトが80%の広告の在庫をプロファイルターゲティングに使用している。その中でも性別と年齢を属性として利用しているサイトが多い。
・カテゴリに対するimps数
金融関係の広告が一番多い。ショッピング、コンピュータ、ビジネスと続いて行く。
・プロファイルとアドのカテゴリの関係
impsを使ってプロファイルとカテゴリの相関関係をヒートマップ化
1)ゲームや健康、ショッピングはプロファイルとアドのカテゴリが一致する傾向がつよい。
2)いくつかのプロファイルは関連性のあるカテゴリからターゲティングされていて、美と健康のプロファイルはショッピングやトラベルと、ペットは家と関係が強い。
3)アート、エンターテイメント、ビジネス、コンピュータ、ショッピングのカテゴリの広告はターゲティングされる傾向が小さい。どのプロファイルにも平均的に広告が配信されている。
注:2と3の結果に若干の矛盾を感じる...ショッピングはターゲティングされていないと言っているのに...
4)興味深いことに、プロファイルのついていないimpsはレストランカテゴリの広告がよくあたっている

いくつか面白いものもあったけど、衝撃的な発見!という感じではないっぽい。こういうのを先頭切ってやるって言うのが大事な感じがする。