Aggregator

検索エンジンのクローラーにとって良質なシードサイトとは?

15 years 11ヶ月 ago
Seo by the Seaから、SEOマニアにちょっと気になる話題を。検索エンジンのロボットがあるページ上のリンクを起点として広大なネット上のウェブ情報を辿っていくことは知られていますが、ではどういったサイトを検索エンジンはリンクを辿る起点のサイトとして考えているのでしょうか?そんな気になる話題をYahoo!の特許を元に考えます。 — SEO Japan 検索エンジンは、ツイッターやフェイスブックのようなサイトからクロールを始めたほうが良いのだろうか? ウィキペディアやマハロはどうだろうか?DMOZもしくはヤフー!のディレクトリの場合はどうだろうか? 毎日ように新しいページが追加され、古いページは削除されていく。そして、ブログ、新しいサイト、そして、その他のジャンルのページから言葉が溢れだしている。ウェブは猛スピードで更新を繰り返しているのだ。Eコマースのサイトは、新しい製品を展示し、古い製品を消去する。そして、新しいサイトが生まれ、古いドメインの期限が切れていく。 検索エンジンは、ウェブのインデックスを出来るだけ新鮮に保とうと試み、新しいサイト、および更新された変更点を探し、そして、行方不明のサイトを調査するため、クローリングプログラムを送りこむ。 この取り組みをさぼると、検索エンジンは流れについていけなくなり、削除済みのページや上書きされたコンテンツを人々に提供することになる。そして、インデックスは遅れ、新しいサイトを見落としてしまうだろう。 検索エンジンがウェブをクロールする際、選んだシードサイトのURLを追い、その他のページおよびドメインを調査することから始める場合が多い。しかし、検索はこのようなシードサイトをどのように選出するのだろうか? シードサイトは、各種の話題および地域の広範なサイトにリンクを張り、含めるサイトの選出を自ら行うサイトであり、オープン・ディレクトリ・プロジェクトやヤフー!のディレクトリのようなサイトが当たる可能性がある。 しかし、検索エンジンは必ずしもこのようなサイトを手始めに利用するわけではなく、その他のサイトを選ぶ可能性もある。 シードサイトの選択は、検索エンジンの質、そして、インデックスで異なるトピックと地理的なエリアを網羅する仕組みに大きな影響を与える。 シードサイトの選択が不十分なら、検索結果の質が低くなり、検索結果に表示されるウェブスパムの数は増加の一途をたどるだろう。 検索エンジンがシードサイトとして用いるサイトを選び、ウェブ上のその他のページへのURLを発見する仕組みを解明する特許がヤフー!から申請されている。 ウェブクローラーのホストベースのシード選択アルゴリズム 考案 : パベル・ドミトリエフ Yahoo!に委託 米国特許申請番号 20100114858 公開 : 2010年5月6日 申請 : 2008年10月27日 要約 ホストの質、重要性、そして、生産力のポテンシャル等の要素を参考にして、ホストの文書をシードとして決めるホストベースのシード選択プロセス。 ホストの重要度、ホストに対する新しい文書の予想される生産力、そして、ホストが所属するマーケットの好みに応じて、多数のホストの一部が特定される。 特定された一部のホストの各ホストに対して最低1つのシードが生成され、少なくとも1つのシードはリンクが張られた文書のデータベース内の文書を示唆する。生成されたシードはデータベースのクローラーがアクセスすることが可能な形式で提供される。 同じシードサイトを定期的に訪問しているだけでは、新しいURLを数多く見つけることは出来ないだろう。そのため、ヤフー!の出願中の特許は、検索エンジンがシードサイトの候補を比べ、選出する仕組みを少し説明している。 この特許によると、特定の選択したシードが以下の場合、シードサイトの選択プロセスが改善されるようだ: 以前見つけられなかった比較的多数の文書が、見つけられ、処理されるようになる場合。 より重要性の高いホストおよび文書のクローリングが比較的増え、重要性の低いホストおよび文書のクローリングが比較的減る場合。 マーケットまたはサイトのカテゴリーの分布が望ましい割合になっている場合。 候補のシードサイトが以下の基準によって評価される場合: 質 重要性 ホストの潜在的な利益 潜在的なシードサイトのサイトとしての質(もしくは質の欠落)は以下のようなサイトの特徴によって判断されるだろう: 被リンクの数が少ない スパムページ、もしくはスパムページへ導く被リンクを持っている わいせつなコンテンツを掲載している この特許は、質の高いサイトが、クロールの開始点であるシードサイトの候補として選ばれることが多いと記している。質の低いドメインからクロールを始めると、さらに多くの質の低いページがクロールされることになる可能性が高いためだ。 シードサイトの重要性は“ホストの信頼性”スコアまたは評価、もしくはホストに関連するその他の特徴を基に決められるだろう。ホストの重要性は以下の要素の目安となる: 人気 信用性 信頼性 質 ホストのその他の特性 ページランクは、ホストの信頼性のスコアの一つのタイプと考えられるが、その他の要素も考慮される可能性がある。 ホストにおける文書の潜在的な力、または新しいURLを見つけてもらえるポテンシャルは、ホストに過去のクロールによって集められたスタッツによって計算されるだろう。 マーケットを地理で区別することが出来ると言われているため、多くの新しいURLを生成しようと試みるシードサイトの選択プロセスは、検索エンジンが各国および各地のURLを見つける上で役に立つ地理を基に異なるシードサイトを探している可能性がある。 異なるマーケット(もしくはその他の異なる特徴によっては)のシードサイトに対しては異なる閾値が選ばれる可能性がある。なぜなら、マーケットによっては占有率が低い場合もあり、ホストの数、そして、“重要な”ホストの数が少ない可能性もあるからだ。これは比較的独占的なマーケットがあまりにも強い影響力を持つことを避け、“占有率の低いマーケットではシードサイトがほとんど、もしくは全く選ばれない”事態を回避する効果がある。 結論 私は今まで特許もしくはホワイトペーパーの中で、検索エンジンがクローリングプロセスにおいてシードサイトを選択する際に何を探しているのかに関する詳細な考察を見た覚えがない。 検索エンジンによるウェブのクローリングに関する議論が行われると、ヤフー!ディレクトリやDMZのようなサイトが、ウェブで新しいページをクロールするため、そして、発見するための開始点として例に挙げられる。 そのため、検索エンジンがこのようなディレクトリ以外にシードサイトを特定するために利用する基準を調べる価値があるはずだ。ウィキペディアは良質なシードサイトの条件を備えているだろうか?ツイッターやフェイスブックはどうだろうか?私には断言出来そうもない。 ご存知のように、検索エンジンは、ユーザーにタイムリーな情報を提供している点を感じ取ってもらうため、インデックスにツイッターようなサイトからコンテンツを早く組み込むことに焦点を絞っている。検索エンジンは、このようなサービスのリンクを辿り、シードサイトとして扱い、新しいページや新しいコンテンツを過去のページで見つけているのだろうか?これが正しいとするなら、何を意味するのだろうか? この記事は、SEO by the Seaに掲載された「What Makes a Good Seed Site for Search Engine Web Crawls?」を翻訳した内容です。 なかなか興味深い記事でした。シードサイトの抽出と選定自体も検索アルゴリズムで行うという考え方が面白いですね。制限なく拡がり続けるウェブにおいて、ジャンル別で起点となるシードサイトを見つけることで、より多くの新規かつ良質の検索結果を返していくことが可能になることは十分想像できます。今後はこういった技術に分面でもあるようにソーシャルネットワークやツイッターがどういう影響を持ってくるのかも興味深いです。 — SEO Japan

アドネットワークの現状と今後、代理店のあり方とは?―ad:tech san francisco 2010 参加レポート(2)

15 years 11ヶ月 ago
今後もアドネットワークの利用は伸びていくと予想される。それに伴い代理店がデータの活用を迫られる、クリエイティブの質が問われるなどの傾向が続くであろう。従って、いかにアドネットワークを活用するかが代理店の課題のひとつとなり、代理店の腕の見せどころとなるのである。

2009年の韓国の携帯インターネット利用率は52.6%

15 years 11ヶ月 ago
2010/7/12のKISAの2009 Survey on the Wireless Internet Usageから。http://isis.nida.or.kr/eng/board/index.jsp?pageId=040100&bbsId=10&itemId=311&pageIndex=1http://isis.nida.or.kr/eng/board/fileDown.jsp?pageId=040100&bbsId=10&itemId=311&athSeq=1携帯ユーザが若者に偏っているためか、無線インターネット利用は若者の利用率が高い。
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

2010/7/10の週の豪検索エンジンシェア、Googleが92.52%

15 years 11ヶ月 ago
2010/7/10の週の豪HitwiseのData Centerから。http://www.hitwise.com/au/datacentre/main/dashboard-1706.html検索エンジン・シェアは過去4週データ。関連リンク:2010/7/3の週の豪検索エンジンシェア、Googleが92.70%2010/6/26の週の豪検索エンジンシェア、Googleが92.77%2010/6/19の週の豪検索エンジンシェア、Googleが92.83%2010/6/12の週の豪検索エンジンシェア、Googleが92.87%2010/6/5の週の豪検索エンジンシェア、Googleが92.84%2010/5/29の週の豪検索エンジンシェア、Googleが92.72%2010/5/22の週の豪検索エンジンシェア、Googleが92.57%2010/5/15の週の豪検索エンジンシェア、
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

サッカーW杯日本戦、試合終了直後に活発化したWeb視聴

15 years 11ヶ月 ago
2010/7/12のビデオリサーチインタラクティブのリリースから。http://www.videoi.co.jp/release/20100712.html1.対カメルーン戦(試合開始日本時間6/14(月)23時~) 2.対オランダ戦(試合開始日本時間6/19(土)20時30分~)3.対デンマーク戦(試合開始日本時間6/25(金)3時30分~)が行われた、前後のWeb全体の視聴状況をそれぞれ見てみると、オランダ戦においては、試合が行われた時間帯のWeb接触者数は、前4週平均と比べると少なくなっており、インターネットユーザーがこの時間帯にテレビ観戦に専念している様子が伺われます。一方、決勝トーナメント進出がかかったデンマーク戦では、深夜のTV中継に関わらず、30%を超える世帯視聴率を記録しましたが、Web接触者数が前4週平均に比べ多くなっていることを見ても、この時間帯での起床在宅率が高
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

サッカーW杯日本代表、ネットの口コミは本田に集中

15 years 11ヶ月 ago
2010/7/12のネットレイティングスのリリースから。http://www.netratings.co.jp/New_news/News07122010.htm試合ごとに話題になった選手をみると、本田圭佑選手は常に代表の中で注目を集めていました。特に得点を決めたカメルーン戦、デンマーク戦では代表選手に対する全口コミの30%以上を占めています。初戦のカメルーン戦では本田圭佑選手のゴールをアシストした松井大輔選手が2番目のシェアを占め、次いで、岡田武史監督、ゴールキーパーの川島永嗣選手と続きました。2戦目のオランダ戦は惜しくも敗れましたが、惜しいシュートを放った岡崎慎司選手や、何度もピンチを救った川島永嗣選手を話題とした口コミが多く、途中出場した中村俊輔選手の話題も増加しています。デンマーク戦では、1ゴール1アシストの大活躍だった本田圭佑選手が再度30%以上のシェアを獲得。得点を決めた
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

当ブログを最大限有効に活用する方法

15 years 11ヶ月 ago
当ブログは月間で投稿数は100件~200件、年間で1,500件~2,000件と膨大な数になります。検索で引っ掛かって、あるデータに出会えたとしても、その裏にある膨大なデータベースに気がつかないことと思います。そんな方もリピータの方も当ブログを最大限有効活用するための方法を、利用フェーズに合わせて提案します。具体的には下記3つの方法からお選びください。・ブックマークとサイト内検索を活用する・RSSによる購読・メルマガの購読1.当ブログのコンテンツについて当ブログはインターネットやパソコン関連などデジタル・デバイス、サービスに関連した市場規模や出荷台数などの統計データや、ユーザーの利用動向などの調査データを紹介しています。私はアクセス解析業界の人間なので、アクセス解析ツールやアクセス解析手法などに関するテーマも投稿しています。マスコミの多くは原典を紹介しないため、様々なデータを紹介
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

メルマガを始めます

15 years 11ヶ月 ago
当ブログは月間で投稿数は100件~200件、年間で1,500件~2,000件と膨大な数になります。このため1日見過ごすだけで、Twitterのタイムラインのように過去に埋もれてしまうことも多いのではないでしょうか。RSSでの配信も行っていますが、溜まった記事は見る気がしないものです。そこで1週間の投稿をカテゴリー別にまとめてご紹介するメルマガを発行することにしました。加えて私の1週間の活動を振り返って、アクセス解析などについての記事も加えていきたいと思います。 Insight for WebAnalyticsの頭文字を取って週刊IFWAです。登録フォームはこちら↓ですhttps://1lejend.com/stepmail/kd.php?no=68667解除フォームはこちら↓ですhttps://1lejend.com/stepmail/delf.php?no=68667メルマガサンプル0
Hiromi.Ibukuro@gmail.com (衣袋 宏美(いぶくろ ひろみ))

自分のブログを15億円で売った若者の話

15 years 11ヶ月 ago
ジョーンズ・ウーという人を知っている日本人はほとんどいないでしょう。若干22歳で始めた金融ブログ「Bankhaholic」を最近15億円弱で売却したことで知られるアメリカのネット界ではかなりの有名人です。今回はSEO Bookによる彼のインタビュー記事を紹介します。何かヒントになることがあるかも? — SEO Japan ジョーンズ・ウー氏以上に魅惑的なインターネット界のサクセスストーリーはめったに見られない。 2006年、まだ神経科学の学部研究生だった頃にジョーンズはBankaholic.comと名付けたWordpressブログを始めた。トラフィックと収益の確立のためにSEOおよびSEMにフォーカスしたアプローチはジョーンズの独断場だった。それからたった3年後に、彼はBankaholicをBankRateに売却したのである。その価格は1490万ドルと報告されている。 その時彼は22歳だった。 私たちは最近ジョーンズと話をすることができた。現在彼は世界中を飛び回れることを楽しんでいるため、これはちょっとしたチャレンジだった。ジョーンズは彼の成功や今日数百万ドルのウェブサイトを作るために必要なものについていくつかの質問答えるのに十分な時間を快く割いてくれたのだ。 あなたのような人を神経科学からSEOの世界に導いたのは何だったのでしょう? 最初にインスピレーションを受けたのはAnand Lal ShimpiとAnand Lal Shimpiだったよ。中学生の頃、彼が高校生の時にどうやってメディア王になったのかについて取り上げたニュースを見てからというもの、私はオンラインメディアに魅了されるようになった。大学では、もともとメディカルスクールに進もうとしていたけれど、科学について深く学ぶうちに、自分がそれを嫌いだってことに気付いたんだ!その一方でコンピュータとビジネスのクラスをいくつか受けていて、2005年にthebulltrader.comという株に関するブログを始めた。私はブログやサイト運営を楽しんでいて、2006年にはBankaholicを始めることになった。初めてアドセンスで50ドルを儲けた後、もっと多くのトラフィックを稼ぐことに興味を持ったんだ。その後のことはご存じの通り! オンラインアフィリエイトは金融と直接的または密接に関係しているエリアでうまくいく傾向があります。あなたが築きたいエリアやニッチを考えた時、金融への接近性は評価しますか? 全くしない。インターネットは広大でそこには素晴らしいニッチが山のように存在するのだから。 価値のある市場で競争に勝つためには局所的な専門知識が必要ですか? 確実に役には立つが、100%必要とされるものでもない。 局所的な専門知識の代用になるかもしれないと思えるような特定のことは何がありますか? インターネットに精通することは絶対的に役に立つ。もっと具体的に言うと、SEOやSEMがどのように働くのか理解することは、たとえ競争相手がもっと局所的な専門知識を持っていたとしても、あなたのビジネスを成長させあなたにチャンスを与えてくれるだろう。 熱い競争がある市場を好みますか? それとも少ない情熱を持って人々がアプローチしてくる傾向のある市場を好みますか? 私はいつも競争の激しいニッチを避けている。常に。そんなにたくさんのお金はないのだから、着メロやオンラインポーカーのような飽和状態の可能性のないニッチを追いかけて時間を無駄にすべきではない。 あなたがどうやってBankaholicを成長させたのかについて少し話を聞かせてください。このサイトの当初のビジョンとは何だったのですか? 2006年は金融バブルの絶頂期だった。銀行はマーケティングにとても積極的だったため、新しい顧客に簡単にサインアップボーナスを払っていた。それを巧みに利用すれば1カ月に数百ドルを儲けることはセキュリティナンバーを持っている普通の人なら誰でもできたのだ。 私のゴールは、最良の取引を情報集約して、もっぱら銀行取引に専念したSlickDeals/Fatwalletのようなサイトを作ること、そして、私のビジョンは、最新取引のために私のサイトに毎日来るような“bankaholics(銀行中毒)”のオンライン信者を作ることだったんだ。 ところで、素晴らしいドメイン名ですね。金融部門内のダイレクトマッチまたはキーワードリッチなドメインを使用することに反して、独特なブランドにフォーカスした名前を作ったのはなぜですか? ドメイン名を選ぶのはものすごくもどかしいこと。なぜなら(想像できる通り)良い名前は全部取られてしまっているからだ。私は“Bankaholic”という言葉を思いついた日のことをはっきりと覚えているよ。神経科学の研究室で実験が終わるのを待っているところだったので、いくつか名前のアイディアを出すためにコンピュータに向かいNameBoy.comを開いたんだ。そこで“Bankaholic”という言葉を見て、これは良さそうだぞと思ってすぐにGoDaddyでドメインを登録したよ。 売却額の大きさ(1490万ドル)を考えると、あなたは迅速にそんなにも大きなマーケットのレバレッジを築き上げることに焦点を絞り、かなり野心を持っていたように思われます。あなたは常にそのレベルでの成功に焦点を絞っているのですか? もちろん。大学卒業後はBankaholicが私の人生だった。私は自分が金山の上に座っていることやそれが一旗あげるための人生の一発勝負であることも分かっていたので、自分のビジネスをいかに成長させ発展させるかにこだわることに全ての時間を費やしとても真剣に取り組んでいた。 成功を促進させるために何かオフライン戦略は採用しましたか? 私が採用したオフライン戦略はBankaholicのTシャツを作って配ったことだけだ。散々なROIだったから、2度とこんなことしないけど! あなたの成功に意味のある形を貢献したと感じている特定の優先事項はありましたか? 測定と最適化。測定しないものを最適化することはできない。 あなたは今でも定期的にサイトに書いていますか?(現在の執筆者の1人が、あなたがごちそう好きなことを明かしているようですが) ハハハ!売却後数カ月間は書き続けていたけれど、トランジションの後Bankrateは完全に引き継がれたよ。 ソーシャルメディア環境はBankaholicの成長として姿を現していたが、今日ではもっと強い存在になっている。これによって、あなたが新しいアイディアやプロジェクトにアプローチする方法は変わりましたか? 正直に言うと、私はソーシャルメディアが嫌いだ。それが力を持っていることは認めるが、あまりにも予測不可能でコントロール不可能なため、私のオンライン戦略にとってはむしろ補足部にすぎない。個人的には、予測可能で測定可能で、100%役に立つ(最も重要)SEOに時間をかける方がずっとよいと思っている。 そうは言っても、TwitterとFacebookは、新しいターゲット層への接触を可能にしてくれるため、価値のあるツールではある・・・。その点から言うと、あなたのニッチやビジネスモデルに基づいてSMMである程度雄弁であることは重要なことだ。 リソースも限られたそのニッチの新参者の場合、大きくて困難な市場にどう立ち向かえばいいのでしょうか? 経験が全てだ。失敗から学び、トップの座に出ることにしくじることを恐れないことだ。 あなたのようなサクセスストーリーは誰にでもできることだと思いますか?それとも何かが違うのでしょうか? ただ単に誰もができることではないが、できる人はたくさんいる。アフィリエイトマーケッターとして成功するには、何でも屋になる必要がある。創造性、デザイン、ビジネス、プロジェクト管理といった多くの分野を巧みに操り秀でていないとダメだ。 競争の激しいウェブサイトを始めた若いウェブマスターにとって最も価値のある資産を1つだけ選んでください。(全てのものが奇跡的に等しかったとして): 投資するキャピタル 対象への情熱 対象に関する専門知識 SEOの精通 技術/グラフィック/コンテンツ開発のスキル 確実に専門知識だ。あなたが本当にそのニッチのオーソリティーで素晴らしいコンテンツを作れば、ウェブサイトが自然とリンク、広告主、ビジネスの発展のチャンスを引き寄せるだろう。 お金は、あなたが新しいビジネス界にアプローチする方法にどのように影響を与えましたか? 私はドメイン買収に意欲的に取り組んでいる。なぜならそれが私のお金をつぎ込むのに最高の場所だからだ。プレミアムなドメイン名は私の状況にぴったりだと思うのだ。他の誰よりもインターネットについてよく理解しているため、どの評価が魅力的か知っている。ドメインを買うことは、私に将来さらにウェブ開発を進めるという選択肢も残してくれるのだ。 あなたは努力によって素晴らしい“立身出世”のストーリーを作り上げた。このことがあなたの今後の挑戦への見通しにどんな影響を与えていますか? 残念なことに、最近モチベーションが低くなっている。成功へのハングリー精神はかなり減ってしまったけれど、それはそれでいいんだ・・・そのうちインターネットマーケティングに復帰するつもりだよ。 ジョーンズ・ウーの今後は? 最近はずっと旅行とリラックスをしているだけ。私のシステムから旅行バグが取り除かれたなら、ドメイン買収と開発に向かって走り続けることは間違いない。 お時間どうもありがとう。あなたの旅の無事と成功を祈っています! この記事は、SEO Bookに掲載された「An Interview with Johns Wu」を翻訳した内容です。 競合が多いジャンルでなければ15億円で売れない気もしますが、「専門知識が最重要」という意見には賛同です。SEOのテクニックだけがあっても肝心のコンテンツを産み出す力が無ければ、トラフィックのマネタイズも難しいでしょうし、ファンやリピーターもつかないでしょうし、検索経由のトラフィックだけに頼るブログは限界があるでしょう。ブログに限らずアフィリエイト全般にいえると思いますが。日本でブログが高値で売れたという話は聞いたことありませんが、数千万~1億程度の値がつきそうなブログは幾つかある気もします。この辺は英語圏と日本語圏の市場の差もありますかね。とはいえ、彼の成功は夢がある話であることには間違いありません。 — SEO Japan

人気記事トップ10

人気記事ランキングをもっと見る