SBM研究会vol.2(午前の部)
今日はソーシャルブックマークに関心のある人たちで集まったSBM研究会に来ています。
夏のvol1に引き続き、vol2です。
第2回SBM研究会プレゼン資料公開+ライブ中継用URL: Tomo’s HotLine
今日はその模様をだらだら書いていこうと思いますw
国立情報学研究所 大向さん
■自己紹介
⇒サイト推薦機能、クリップ機能(入れたのに注目されなかった)
- セマンティックwebを通して、メタデータが大事だよという提案を書いたり
■コミュニティの偏りをどう知るか?
- はてな村は偏っているといわれる、どう世間から偏りが発生しているのか?
- 偏りがないと意味を成さない仕組みの有効性を検証する
■協調フィルタリングのSBM推薦は有効か
- 10000件につき4件クリックされた…
- amazon的なものを入れてもぜんぜんユーザーに受け入れられない
■どうするか?
- 協調フィルタリングを短い時間で繰り返せば、有効なリンクが推薦されるが、リソースが大変
- コミュニティが偏っているなら、それを利用できないか?αブックマーカとフォロワの興味関心が変わらないという仮設をベースに、イノベータの情報をフォロワに推薦すれば良いのでは?
- それって似ているユーザの情報を推薦すれば?
■そもそもイノベータっているの?
- 各コンテンツの1getterだけを抽出
- その人が何回登場するか?
⇒数パーセントのユーザーがコミュニティを引っ張っていることがわかった
■ユーザーが入力するタグの回数から、ユーザーの関心が長期的なのか、そうでないのかを計算したりもしている。
- 新しいタグがつかないコンテンツ:ネット系の話題、そのコミュニティがずっと関心がある話題
- 新しいタグがつくコンテンツ:それ以外
■SBMコミュニティには偏りがある
- コミュニティの内部の情報から偏りをあぶりだすのが、いつものテーマとなっている。
- 偏りを利用すれば、推薦の精度も上がるし、リソースも食わないのでリーズナブル。
■何のためのSBM?
- アナロジーに説明できなくなってきている。親に説明できないwそれはSBMが多機能になってきているから。多面性を持っているから
- ターゲットを絞って機能分化の可能性があるんじゃないの?
■現実を眺める
- 情報共有したいのに、見るかどうかはその人しだい
- コミュニティはいろいろある
⇒このあたりを最適化したサービスって考えられないか?
■4dk(よんどけw)
- あーこの人が作ったんだ4dkって…
- なんかネガティブイメージをもってしまったんだよな、強制的なので。
- でもFYIメールの代わりには確かに使えそうだ。個人利用というよりはイントラネットでのナレッジ共有で使うようなもの。
- 2人グループとかが多くて、少人数で使われているケースが多い。
- 濃い情報をやりとりしているので、後悔している人はあまりいない。はてブとかあるし
- 視聴率機能がついている。
■4dkのまとめ
■まとめ
- 偏りを理解することでのSBMコミュニティ研究
- 情報を伝えることに特化したSBMサービス開発
をやっていきますとのことでした
清澄日記
慶応大学 上野さん
■やっていること
■研究内容
- 目的外の情報が引っかかったり、高い検索リテラシーが必要になったりもするし、RSSりーだーだと定期的なチェックが必要
- 高度な情報リテラシーが不要でなSBMデータベースを利用した情報検索を研究している。
- ただ、ほっとエントリーだけどんどんブックマーク数が増える
- ブックマーク数が多ければ有効かというとそうではない
- そういった問題をクリアしつつ、検索できるようなものを考えている。
■ブクマ数と時間の関係
- 一時的にブクマされるページ:一時的に必要な情報(type1)
- 一時的にブクマもされるが、その後長期的にブクマされているページ
- 急激に増える時期はなく、長期的にブクマされ続けるページ:長期的に必要な情報(type2)
■type1の内訳
- ニュース、話題25%
- 議論、日記17%
- サービスツール紹介:16%
■type2の内訳
- webサービス
+
- まとめサイト
⇒内容がまったく異なる。
■つまり、ブックマークのコンテンツをtype1,2で分けることにより、より精度の高いページの推薦ができるのではないか?
⇒セレクトブクマの開発
■セレクトブクマの精度をgoogleと比較
「JAVA」で検索すると
■はてブのブクマ数順との比較
- 一時的なページがフィルタリングされている
- セレクトブクマだと、まとめサイトや長期的に活用するようなサイトが多く引っかかる。
■考察
- ブックマークの多いワードに関しては、一単語検索で有用
- 一時的なページをフィルタリングできるので、googleよりも良いページが推薦できている。
■課題
- 時間のしきい値が1日でいいのかどうか
- 最適な日付係数は2でいいのか、いまだと古いページのほうが優先度が上がってしまう
- タグ付けという行動について、より深い考察が必要
- はてブ以外のデータも必要
- サービスに対する評価が足りないので、調査が必要
■セレクトブクマは公開されています。
セレクトブクマ
日付を絞って表示ができるセレクトストリームが近日公開。
■そのほかのサービス
MixClips ソーシャルブックマーク横断サイト:複数のSBMを横断してホットエントリを表示する機能がある
これはRSS登録しなければ!