さくペラ

さくっとぺらいちというサイトのつづき

SBM研究会vol2(午後の部その2)

ついにはてなの伊藤さんが語りますぜ!

はてな 伊藤さん 「はてなブックマーク2」

■統計で見る現状

  • ユニークユーザーが300万/月(アクティブはわからない、Googleアナリティクスで計測)。ネットレーティングスだと130万/月ぐらい
  • ユーザー登録数20万6千
  • 20万になったのが今月に入ってから。
  • だんだん二次関数的な伸びに
  • はてぶと競合サイトのブックマーク数比較

主要なメディアのページの新着記事比較

  1. はてブが75%のシェア
  2. ライブドアが15%ぐらいのシェア
  3. yahooはfc2より少ない
  • 国外だとdiggがすごい。デリシャスのブックマーク数が6000万弱、はてブは8000万強
  • 視聴者性別:男60%(まんべんなく)、女40%(20代が多い)
  • カテゴリ別のアクセス
  1. IT
  2. ゲーム
  3. エンタメ
  4. 過去ログ


■リニューアル直後の数字

  • ユーザー純増数:一日で640増、一気に跳ね上がった日がある。上昇傾向
  • ユニークユーザー:リニュ後からかなり上がっていて3115000ぐらいまできている。
  • ブクマお気に入り数:リニュ後から増加傾向にある。ここの機能を作り直したそうです。
  • 目標は半年で2倍になるように!


■リニューアルの動機と裏側(本論)

■■リニューアルまでの裏側

  • ユーザー数は15万⇒30万目標
  • UU300万⇒600万目標(大手新聞社メディア並みの数)
  • システム的な理由が大きかった
  1. 検索、テキスト分類、お気に入り機能の作り変えなどなど⇒システムがレガシー過ぎて、拡張できなかった。合宿で3日で作ったものだそうで。
  2. 既存のユーザーの使い勝手を第一に+新しさを加えていく「ドラクエをドラクエ2にしたら成功だけど、FFにしたら失敗!」
    1. 音楽がポップに、パーティになる、グラフィックもきれいに、でもドラクエらしさは失わなかった⇒同じような形のリニューアル
  • 2月にリニュを思い立ち、4月まで伊藤さんだけ、そこからデザイナーを一人アサイン、そのあとプログラマを4人とか追加して開発。
  • ポストイットで管理
  • プリファクト・インフラストラクチャーPFI)さんと共同開発した
  • 初期:基本的なコードベース、コアの部分を伊藤さんが作った。メンテナンシビリティを考慮した設計。スタブ?モジュールをつくる。
  • 中期:モジュールを元に、プロトタイプを設計。新しい機能の整理、方針固め
  • 後期:スケジュール管理して進行。はてなユーザーをアサインして、ユーザビリティテストを行う。
  • システムの刷新は成功した
    • 検索、テキスト分類、お気に入り機能
    • チーム体制ができてこれまでの10倍ぐらいの開発力になった。
    • はてなアイデアに寄せられた意見を一ヶ月で120件も実装した

■■はてなブックマークの3軸「メディア(発見)」「コミュニティ(意見)」「機能(使い勝手)」

  • 今回注力したのは「機能」
  • まずは、使い勝手を向上させてから、次にいく。
  • 衆愚問題「ワイドショー化しつつある」:わかりやすくて簡単に笑いが取れる記事にトラフィックが集まってしまう⇒ワイドショー化するのは避けられない。そうじゃない人も楽しめるようなつくり。

そのために「お気に入り」機能の強化を行う。

  • ぜんぜん便利さが実感できなくて、1割ぐらいしか使われていなかった
  1. 一人の人のブックマークで埋もれてしまう危険。
  2. お気に入り機能に対するインセンティブを感じているユーザーが少ない

⇒自然と増やしたくなるような施策を打っていく

  • お気に入り機能の利用率が向上し、ソーシャルグラフがはてぶ内にできつつある。それを有効活用できるようなサービスは今後。

外部のグラフを利用しよう。twittermixi(今度公開する)。

  • グループ分け:伊藤さん「プログラマの方と、大学の友人を分けて管理したい」⇒グルーピングができるように。
  • お気に入り関係をつかった機能の強化
  • 検索、テキスト分類、関連エントリ
  • 従来の欠点
  1. 最新の情報ばかりにフォーカスが集まるようになっている
  2. ロングテールのようなアクセス傾向
  3. 過去におもしろかった、あるいはじわじわ記事が埋もれてしまう

⇒ここをうまく取り出せるような改修

  1. 記事に対して誰がフォローしているかを明示するように。区ローラーによるレコメンドじゃないんだよということを視覚的に明示
  2. 検索エンジンはSedueベース:圧縮検索、CSA、分散ファイルシステムという特徴をもっている。
  3. PFI側ではインデクサ、サーチャー担当
  4. はてなではUIなど
  5. アルゴリズムは共同開発、「はてなRank」

⇒古典的なアルゴリズムと、はてなのメタデータの組み合わせ、あとヒューリスティクスな観点で調整

  • 検索の精度はまだまだ、誰が何を検索しているかというクエリのログをためていって、検索を強化していく
  • 1000万エントリーのブックマーク、小さなクラスタからのリンクを解析していって、たとえば今検索しても引っかかりにくい芸能人とかのワードでもうまく引っ掛けていけるようにしようとしている。
  • カテゴリ
  1. テキスト分類エンジンBDog:complement naive bayes(BCatがうまくいかなかったので、BDogにした)
  2. この単語はこのクラスに含まれなかった、という観点で学習していくアルゴリズム。
  3. もともとのカテゴリ精度が低かった
  4. カテゴリわけがキーワード向けだった⇒ジャンルの分類に変更
  5. コンピュータに偏りがちな話題を、他の話題にリーチできるように
  1. これまでの利用傾向から「8種類」に。そうしないと、人気エントリーリストが作れないので。

⇒サブカテゴリの存在がはっきりした。デザインでも、PCだけじゃなくて、服とかもあったり。
⇒お役立ち系とか(いわゆるライフハック)作っていく感じ

  1. カテゴリごとの新着を出るように、あとトピックスページを全カテゴリを俯瞰できるようなページにしていきたい。
  • PFIと共同開発した、関連エントリーエンジンBSim
  1. タグの意味を考えないで類似度を算出するエンジン。前回等広大の人が話したものと同じ。PFIさんがすでにそういうものを持っていたので利用。
  2. 誰が何をブックマークしたか:精度は中
  3. ページのキーワードの類似度:精度は低
  4. タグの類似度:精度が高くて、これを採用した。
  • なぜ内容に踏み込むのか?
  1. ブックマーク数だけでは評価が限界
  2. テキストを扱う企業としては当然としてのと陸海
  3. 内容に踏み込まないと次のステップにいけない。


■今後の予定

  • 品質向上
  • コミュニティ
  1. お気に入りのつながりを強化
  2. 非表示機能によるフィルタリング
  3. コミュニティの分散
  4. はてなブックマーク市民の導入:画像の変更機能とか、ルールがわかっているユーザーのみに使わせたい機能。あるいは機能のFBをお願いする。
  • フィルタリング
  1. 表現の自由は原則維持
  2. ただ見たくないものは見えなくてすむような
  3. 男前の人には全部見せる
  4. NGワードは設定しない
  5. 削除ガイドラインにのっとって削除する
  6. 自分に都合のいい意見しか残らないんじゃないの?⇒たこつぼ化?⇒いやいや、逆だよ。逆にシニカルなコミュニティになってしまうよ。⇒なので、そういった取り組みを行っていきます。
  • 予想されうる問題に対しての対策
  1. 手の込んだスパム:ヒューリスティックスベースのスパムフィルタを作る対応が一番有効

などなど

  • 2009年上半期にやること:上記のほか、デザイン機能の強化、モバイル版のリニュなど
  • 課題はコミュニティとメディア