読んだ:Modeling and Predicting the Growth and Death of Membership-based Websites(WWW2014)

Modeling and Predicting the Growth and Death of Membership-based Websites

FacebookやHuffington Postのようなインターネットのスタートアップが成功する要因を突き止めるために、成功、失敗の成功メカニズムを解明する。22のメンバーシップベースのwebサイトのデイリーのユーザ数(DAU)を6年間にわたって収集。
サイトの成長・衰退パラメータと、成長法(口コミ・メディア)についてのパラメータを用意してモデル作成。

※定義(tは任意の時刻)
A(t)...アクティブユーザ(DAU)
I(t)...ノンアクティブユーザ
U(t)...メンバーでないユーザ
C...WebSiteのキャパシティ(A+I+U)
\alpha...アクティブメンバーの影響力パラメータ。ノンアクティブユーザをアクティブへ遷移させる率。
\beta...衰退率。アクティブユーザがアクティブでなくなる率。
\gamma...口コミによる新規ユーザの加入パラメータ。アクティブユーザの行動により新規ユーザがサービスにjoinする。
\lambda...メディアやマーケティングによる新規ユーザ加入パラメータ。加入済みのユーザ以外の情報によりサービスにjoinする。

これらの動作をふまえたアクティブユーザとノンアクティブユーザの増加数を以下のように定義
\frac{dA(t)}{dt}=-\frac{1}{C}A^2(t)\gamma+\frac{1}{C}I(t)A(t)(\alpha-\gamma)+C\lambda-A(t)(\beta+\lambda-\gamma)-I(t)\lambda
\frac{dI(t)}{dt}=A(t)\beta-\frac{1}{C}I(t)A(t)\alpha

4つのパラメータが持つ意味
\alpha > \beta...DAUが長期にわたって継続して存在する状態(成功)
\beta > \alpha...DAUが時間の経過とともに衰退(失敗)
\lambda \gg \gamma...初期の段階から順当にユーザ数を増やし、ある程度の段階で落ち着く
\gamma \gg \lambda...最初は全くユーザ数が増えないが、時間の経過とともに急激に増加する

上記の式とパラメータを、各WebSiteのDAUに対して調整していく。パラメータの推定にはレーベンバーグ・マーカート法を利用。学習に利用するデータは最初の3-6ヶ月の間。

※結果
\alpha\betaの値から各サービスを成功と失敗に分類。ここで言う成功とは「持続性がある」こと。
代表的なものだとlinkdinやfacebookなどがここに属する。失敗だと、memolane,12seconds(知らない)などがここに当てはまる。
続いてこれらのSiteの成長についてみてみると、多くのサイトがユーザの口コミで成長していることがわかる。mediaの影響を大きく受けている中にはebayなどがあった。
上記の結果から、成功パターンと失敗パターンを以下のようにパラメータを調整して長い期間で予測する。

    • -

成功:\gamma \gg \lambda, \frac{\alpha}{\beta} > 1
持続型かつ口コミによって成長する
f:id:A_Koide0519:20140407014651p:plain

失敗1:\lambda \gg \gamma, \frac{\alpha}{\beta} < 1
持続性がなく、主にメディアによって成長する
失敗2:\gamma \gg \lambda, \frac{\alpha}{\beta} < 1
持続性がなく、主に口コミによって成長する
f:id:A_Koide0519:20140407014703p:plain

酷いイメージ図だ・・・

すると、サイトにもよるが多くの場合数年レベルでのDAUの予測がそこそこうまく出来ている。データの中には大きなイベント(アメリカ大統領選)が含まれているものもあり、さすがにそれを予測するのは難しい。

貢献としては、DAUという情報のみを利用して、その予測がうまくできるモデルを提案している点。
実際に結果を見てみると、うまく予測できているとしている部分もなかなかに外している所もある...
サービスレベルでここまでやった論文は見たことないので、その部分も貢献も大きそう