衣袋宏美のデータハックス

Pアドレスで住所や個人をどこまで特定できる? アクセス解析でわかること

IPアドレスのみで個人を正確に特定することはできません。1つのIPアドレスを複数のユーザーで共有する方法や、大きな会社などではプロキシサーバーを使うこともあるためです。アクセス解析においては、IPアドレスとユーザーエージェント名の組み合わせれば、ユーザーを判別する精度が上がります。ユーザーエージェント名にはユーザーがアクセスした端末のOSとブラウザの種類やバージョンが含まれるためです。
衣袋宏美のデータハックス

質問:IPアドレスでユーザーを特定できると聞きました。IPアドレスでどこまで正確にユーザーを特定できるのですか?

答えIPアドレスで、“正確に”ユーザーを特定することはできません。個々のユーザーを判別するための方法はいくつかあり、その中の1つが「訪問者のIPアドレスで区別する」という方法です。しかし実際には、個人を特定することは簡単ではありません。

解説現在のIPアドレスは、地球上の全人口1人1人、PC1台1台に割り当てるには数が足りません。よって、複数の人(複数のPC)で1つのIPアドレスを共有する仕組みが用いられています。

IPアドレスとは、インターネットで通信をする際に、個々のパソコンを特定するための住所のようなものだと思ってください。IPアドレスは0から255までの数字を4つ組み合わせた文字列です。「202.218.13.218」などというふうに、3つのピリオドで区切られます。理論的には、256の4乗=4294967296(約42億)のIPアドレスを割り振ることができます。現在、地球の人口は約60億人ですので、1人が1台パソコンを持ってインターネットにつなぐことは理論上不可能です。そこで、IPアドレスを複数の人で効率的に使う仕組みが必要になってきます。

ユーザーがパソコンを介してインターネットに接続する時は、普通契約しているインターネット接続サービスプロバイダ(以降ISPと表記)を経由してインターネットに接続しています。固定のIPアドレスを割り当てられていない普通のユーザーがISPに接続した際に、ISPがもっているIPアドレスの中から1つを選んで、接続したユーザーのPCにIPアドレスを動的に割り当てます。そしてそのユーザーがインターネット利用を終了したら、そのPCに割り当てていたIPアドレスは解除し、別のインターネット接続ユーザーに割り当てます。つまりISPが限られたIPアドレスの資源を有効利用するために、IPアドレスを多くのユーザーに使い回しているわけです。

また大きな会社では、社内ネットワークから会社の外に出るところにプロキシ(代理)サーバー(ゲートウェイサーバー)をおいて、対外的なやり取りはそのプロキシサーバの1つのIPアドレスで行っているといったケースもあります(社内ネットワーク側では、内部用アドレスで内部PCの通信を管理しています)。この場合、Webサーバーからみると、その会社からのアクセスはすべて同じIPアドレスに見えてしまいます。

もうお分かりですね。これらのケースで考えれば、同じIPアドレスでも別の人が使っていることが多々あるため、IPアドレスだけであるユーザーを一意に特定することはできないのです

そこで考え出されたのは、別の情報とIPアドレスの組み合わせることで、ユーザーを判別する精度を高めようという試みです。最近のサーバーログ型のアクセス解析ツールでは、IPアドレスとユーザーエージェント名の組み合わせが使われることが多いようです。

ユーザーエージェント名とは、ユーザーがWebサイトを閲覧した際にサーバーログに記録される、ユーザーのソフトウェアやOSの種類のことです。下記はApacheというサーバーに記録されるコンバインドログ形式のアクセスログの記録の1レコードです。

IPアドレスはどこまで正確にユーザーを特定できるのですか?

前から順に、アクセスしたブラウザのIPアドレス、認証ID、転送日時、メソッド、リクエストされたファイル名、プロトコル、ステイタスコード、転送容量、参照元、ユーザーエージェントです。この例では、Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)がユーザーエージェントになります。大雑把に言えば、ユーザーが使っているパソコンのOSとブラウザの種類やバージョンなどがわかります。

もちろん前述の大きな会社の例で、皆同じような仕様のPCを使っているような場合は、ユーザーエージェントも皆同じであることもありますから、ユーザーを一意に特定するのは、この方法でも完全ではありませんが、IPアドレスだけで区別するのに比べれば、だいぶ精度は上がるでしょう。

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

ロイヤリティ
第三者が保持する権利に対して金銭を支払うこと。権利使用料。一般的には、特許権、著 ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]