きんきょ〜

過去の出来事

Tue Mar 2003

  • iPod用ソフトがとある有名サイトで紹介されてから、ヒット数/日が最近はコンスタントに20以上になるようになりました。またMac系統の人も結構来るようになったためアクセス解析には様々なUAが補足されるようになり、現在のアクセス解析 NetSensorではそれを世間一般的なブラウザ名に変換する際に間違って変換されることが多くなってきました。ここで言うUA名とはたとえば「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)」のようなブラウザがサーバーにリクエストを出すときはき出すUser-Agentの文字列のことで、ブラウザ名とはそのUAをはき出すブラウザの一般的な呼ばれ方、この場合は「Internet Explorer 6」のことです。
    ここで問題なのは同じバージョンのブラウザでもUAが違ったり、IEエンジンやGeckoエンジンを使ったブラウザに特に多いのですがUAがそっくりなのに違うブラウザだったりすることです。また、ちょっと知識のあるユーザーならUAを自分の好きな文字列に書き換えることも可能です。そのため機械的なUA->ブラウザ名変換はできません。UA内に入っているブラウザ名を特定する箇所はブラウザによってまちまちであり、その都度ケースバイケースで対応してやる必要があります。そんなことしなくても、UA内に「Netscape」があればブラウザ名はNetScape、「Opera」があればOperaという風にすれば非常に楽です。実際OS名は特定の文字列があるかで判断してますが、ブラウザは何百と種類があり、それらがはき出すユニークなUAをすべてチェックするのは現実的ではありません。また将来新たにブラウザが誕生した場合もプログラムをアップデートするしか対処がありません。できればUAから一般的にUAからブラウザ名を取り出せるようにしたいのです。
    機械的な変換は無理と書きましたが、一部のブラウザにはUAに法則性があります。Gecko系のブラウザは「Mozilla/5.0 (*;*;*;*;Geckoエンジンのバージョン) Gecko/ビルド日時 ブラウザ名/バージョン」というUAをはき出します。そのため正規表現を使ってブラウザ名を一般的に取り出すことができ、プログラムのアップデートなしで未知のブラウザにも対応できます。それなりに長いことログを収集してきたおかげでだいぶサンプルが集まり、他にもいろいろ法則が見つかってきました。ここいらで一度NetSensorのUA名->ブラウザ名変換ルーチンを見直し、新しいブラウザにも対応したものに書き換えようかと考えています。。
  • じつはわたくし、まほろまてぃっくが結構好きです。アニメもMXやNYでコンプしてすべて見ました。しかし悲しいことに、まほろさんのコミックを買うことができません。うちは一人暮らしではないため、だれかが漫画を買ってくると家族がいつの間にか読んでしまうためです。あんな18禁すれすれな漫画を母親や兄弟に読まれてしまってはなんて言い訳すればよいのやら。でも今日発売のコミック6巻は初回限定でまほろさんのフィギュアがついてるからなあ。どうしたもんやら。

Archive

2010
7 / 6 / 5 / 4 / 3 / 2 / 1

2009
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2008
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2

2007
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2006
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2005
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2004
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2003
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4 / 3 / 2 / 1

2002
12 / 11 / 10 / 9 / 8 / 7 / 6 / 5 / 4