2009年3月13日金曜日

広告配信システムのアクセスログをどう保持するか思案中。。。

OSSのopenXを使うことを考えていた自社サービスサイトでの広告配信で、
ユーザの属性などでターゲティングしたりアクセス解析できるようにということで内製することに。
そこで悩んでいるのがアクセスログの持ち方。

あとでいろんな視点からアクセス解析できるようにしたいと言うことは、
アクセスログをほとんど生ログの形で保持しないといけないわけです。
解析するからにはログファイルじゃなくてDBに持ってないといけないわけで、
つまりは 「1PV = 1レコード」 というわけ。

仮に広告を表示しているページが1日あたり10万PVだとしたら、
10日で100万レコード、100日で1000万レコードになってしまうわけで、
そんなペースで肥大化していくテーブルなんてあとで扱いに困るわけです。

今のところそのままデータを保持できる解決策が見つからんので、
やっぱり解析できる視点をある程度限定して、定期的(30分~一時間毎ぐらい)に
サマリしたデータを保持するしかないかぁ~。。。

0 件のコメント: