橋本大也の“帰ってきた”アクセス向上委員会 #003 ~Googleを 勝手に研究する
橋本大也の“帰ってきた”アクセス向上委員会 #003
毎回、視点を変えてアクセス向上を考えるコラム、今回のキーワードは「Googleを勝手に研究する」。
ページランクは、話題や興味の対象としての人気には関係がないかも?
橋本大也
日本では二番だが世界の定番Google
日本の検索エンジンのシェアは、およそ5:3:1だ。5はYahoo! JAPAN、3はGoogle、1がMSNである(残る1はその他)。世界市場でのGoogleのシェアは6割〜7割である。多くの欧米諸国でGoogleは圧倒的シェアを持つ。韓国での大苦戦(5%)ほどではないにしても、日本で首位を取れない苦戦の理由は、「初心者が多いから」とも「日本人は検索しないから」とも言われる。本当のところはよくわからないが、確かに中級者以上で検索ばかりしている人にGoogleは人気が高そうだ。
「Googleパーソナライズ」には、自分が検索した回数や単語の集計グラフを表示する「Search History」機能がある。私はだいたい1日に100回〜200回検索していることがわかった。Yahoo!もサービスならばよく使うのだが、検索についてはGoogleのヘビーユーザーである。
Googleはいったい何ページを検索できるのか
毎日、使っていて気になるのはGoogleにはいったい何ページが登録されているのか?ということ。Googleの公式技術解説ページには80億ページ以上を検索できる云々という記述があったりするが、検索結果数が80億を超える検索語はすぐみつかる。「a」とか「the」がそうだ(Googleで「+a」や「+the」と入力して検索するとわかる)。
はてな人力検索に「最も検索結果数が多くなる検索語を教えてください」という質問を投げかけてみた。たくさんの答えが集まった。結論は「www」が250億件超で検索結果数が最多になった。wwwで始まるサーバー名やリンク文字列が多いから、この数字はかなりGoogleの分母に近い数字といえるかもしれない。
早稲田大学の山名教授の研究によると世界にはおよそ396億ページが存在しているそうだ。Googleで検索できるがwwwを含まないページが数割あるのだとしたら、Googleはすでにウェブページのほぼ全部を検索できていることになる。その一方でインターネット上のページ数はその数百倍も多くて、検索できるのは氷山の一角に過ぎないという研究者もいる。DeepWeb、InvisibleWeb、Dark Internetなどで検索すると見つかる。
深層ウェブ
DeepWebについての研究論文の和訳検索エンジンから分析エンジンへ
山名先生のオピニオン
Googleのページランク10のサイトとは?
そして気になるのがページランクだ。最近のページランク更新で私のブログは5から6に上がった。個人サイトとしては結構高い数字だと思う。インプレス ウォッチのトップページと同じである。ちなみにYahoo! JAPANやYouTubeは8、ミクシイ、アマゾン、朝日新聞社、日立製作所、ソニーは7である。9や10は極めて稀にしか存在しない。
「SEOブログfrom SEO塾」に、ページランク10のリストがある。
ページランクの頂点に立つ10のサイトは、日本では慶應大学だけである。なぜ慶應なのか? それは、同じく10のサイトであるWorld Wide Webコンソーシアムに古くから加盟していたため、ネット技術の重要文書にkeio.ac.jpへのリンクが多数あるからだと言われる。
マイクロソフトやアドビ、リアルネットワークスのページが10なのは、ブラウザやPDFリーダー、動画プレイヤーの配布リンクがあらゆるページから張られているためではないかと言われる。その他のサイトもアップルやインテルなどIT産業に偏っているように思える。
こうしてみるとページランク10のサイトというのは、必ずしも話題や興味の対象として人気があるというわけではないようだ。ページランク10のサイトを毎日見るユーザーはあまりいないだろう。世の中の仕組みや歴史経緯がリンクを大量発生させた結果としてページランク10というモンスターサイトが生まれているのである。
※この記事は、『Web担当者 現場のノウハウvol.3』 掲載の記事です。
ソーシャルもやってます!