2005年08月19日

はてなブックマーカーランキング - Ceekz Logs

国内のソーシャルブックマークは、はてながシェアトップだと思うのですが、そのユーザーのがんばり度をランキングにしてみました。

をみて何か物足りないなぁと思ってたわけですよ。

そう、がんばってる人のランキングが見れるんなら、その頑張る人達の集めたクリップを見たい!
小難しくいうと「人気の出るURLをいち早く察知する事が出来る人たちから、より多くブックマークされるURLは人気が出やすい」という理論を実践するサイトがあると面白そうって事で
Alpha Clipper Clips(以下ACC)なんてサイトを作ってみました。
やっていることは単純で、その日の内にアルファクリッパーに多くクリップされているURLをランキングして並べているだけです。

それだけじゃつまらないので、各URLに対して予測人気指数という指標を設けて、はてなブックマークのユーザーの中で人気が出そうなURLを早い段階で察知出来る仕組みも作りました。
数値の元ははてブでのホスト名の偏り - Ceekz Logs

以下が、はてなブックマークの人気エントリーのホスト名ランキングです。人気エントリーとは、以前からの定義どおり、20以上のオープンユーザーがブックマークしているエントリーです。

のデータを拝借しつつ、下記の条件を元に算出しています。

  • URLがはてなブックマークの人気URLへの掲載がされやすいかの割合

  • ACCがURLを検知してからの経過時間(鮮度)

  • URLをクリップしているアルファクリッパーの人数


要約すると「はてなブックマークのベイジアンフィルタ」って感じでしょうか。
過去の実績から人気になりやすいURLの特徴と、過去の実績から人気になりやすいURLを見つけることが得意な集団のコラボレーション(はてなブックマーク限定)
で、実際面白そうな記事が上位に食い込んでますね、IT系に偏りすぎだけど。

本家はてなとの差異は、こっちのは当日出たURLは当日中でしかランキングをしないので、前日などの超人気URLなどで新鮮な面白URLが埋もれないって事でしょうか。
人気になりそうなURLをいち早く発見するサイトっていうポリシーの方向なので。

実装方法ですがHatena Bookmarker Rankingを、5:30,17:30に巡回して当日の上位IDをかき集めます。
そして、かき集めたIDのatom feedを20分毎にとってきてDBにデータを格納しています。
後は、表示するだけです。

tagsの作成はHTML::TagCloudを使いました。
あとなんだろ、初めてClass::DBIを使ってみたのですが本当に生産性があがる感じですな、パフォーマンスは知らないけど。

あ、なんとなくrss/atomは吐いてないです。

Posted by Yappo at 2005年08月19日 14:06 | TrackBack | 私的サービスめも
Comments
Post a comment









Remember personal info?






コメントを投稿する前に↓の場所にnospamと入力してください。