Aggregator

クロスドメイン URL の選択 - 複数のドメイン間の重複コンテンツの正規化について

14 years ago
このブログでも何度か 重複コンテンツ に関して取り上げてきました。重複コンテンツとは、同じコンテンツが複数の URL(同一のドメインにある/なしを問わず)に存在することを指しています。Google では、コンテンツが重複するページ グループを発見した場合、アルゴリズムに従ってコンテンツを代表する URL を 1 つ選択します。ページ グループには、同じサイトからの URL も、別のサイトからの URL も含まれます。複数のドメインが含まれるグループから代表 URL が選択された場合、この選択は「クロスドメイン URL の選択」と呼ばれます。簡単な例を挙げると、a.com からの URL と b.com からの URL が含まれる同じコンテンツのグループで、b.com から代表 URL が選択された場合、a.com の URL はそれ以降 Google の検索結果に反映されず、検索からのトラフィックが減ることがあります。

ウェブマスターは、rel="canonical" 属性 301 リダイレクト などを適切に設定することで、アルゴリズムに選択すべき URL を伝えることができます。アルゴリズムによる選択は、ほんとんどの場合こういったウェブマスターの意図が正しく反映されています。しかし時折クロスドメイン URL の選択を不適切と感じたり、不適切な場合の対処法が分からない、といった声を耳にすることがあります。

そこで Google は、クロスドメイン URL の選択の透明性を高めるために、ウェブマスター ツールに登録された URL ではなく外部 URL がアルゴリズムによって選択された場合、それをウェブマスター ツールにメッセージとして表示し始めました。このメッセージの詳細については、クロスドメイン URL の選択 を参照してください。今回のブログ記事では、クロスドメイン URL のよく見られるいくつかのケースについて取り上げ、不適切な選択を修正する方法についてお話しします。

不適切なクロスドメイン URL の選択がされる主な原因
クロスドメイン URL の選択が適切になされるようアルゴリズムに伝える方法は数多くあります。

実際ほとんどの場合、Google のアルゴリズムはウェブマスターが代表 URL を示すために設定したシグナルに基づいて選択を行います。たとえば、ウェブマスターがサイト移転時の ガイドラインベスト プラクティス (英語) に従っていた場合は、新しいウェブサイトの URL が代表 URL であることを Google のアルゴリズムに正しく伝えていると言えるでしょう。ウェブサイトの移転中にウェブマスター ツールで今回実装された新しい通知メッセージを受信した場合、Google のアルゴリズムがサイト移転に気付いたと見なすことができます。

その一方で、アルゴリズムが代表にしたくない URL を選択した場合はどうすればいいのでしょうか。クロスドメイン URL の選択が不適切 (ウェブマスター側の希望と異なる) であった場合、いくつかの方法で状況を改善することができます。以下に、意図と異なるクロスドメイン URL の選択が行われる一般的な原因と、その修正方法をご紹介します。
  1. 複数リージョン向けウェブサイトを含む重複コンテンツ:多くのウェブマスターの方が、ときには不注意で、そしてときにはユーザーの所在地によってコンテンツを提供するために、同じ言語でほぼ同一のコンテンツを複数ドメイン上で公開しています。たとえば、ウェブマスターが example.com と example.net の両方で英語の同一コンテンツを用意したり、example.de、example.at、example.ch で 1 つのドイツ語のウェブサイトをホストしたりすることは珍しくありません。

    ウェブサイトの性質やユーザーに応じて、現在サポートされている正規化の方法のうちいずれかを用いて、代表 URL をアルゴリズムに通知することができます。詳細については以下の記事を参照してください。
  • 設定ミス:一部の設定ミスによって、アルゴリズムが誤った選択を行うことがあります。例として以下のようなものがあります:
    1. 正規化の間違い正規化 の設定の際に誤って外部ウェブサイトを指定してしまうと、アルゴリズムがその外部サイトの URL を検索結果への表示用に選択してしまうことがあります。これは、ウェブマスターが導入したコンテンツ管理システム (CMS) や CMS プラグイン の設定に間違いがある場合に発生します。

      こういった状況が発生している場合は、ウェブサイトで使用する URL を誤って正規化している部分 (rel="canonical" 属性や 301 リダイレクトの不適切な使用) を見つけて、修正します。
    2. サーバーの設定ミス:時折、サイト a.com のコンテンツが b.com の URL に返されるという、ホスティングの設定ミスが見受けられることがあります。また、2 つの無関係なウェブ サーバーが同一の ソフト 404 エラー を返すと、Google がエラー ページと判断しないことがあります。いずれの場合も、同じコンテンツが異なる 2 つのサイトから返されたと見なされ、アルゴリズムが a.com の URL を b.com の正規化と判断して選択してしまうことがあります。

      こういった場合は、ウェブ サーバーのどこに誤りがあるのか調査する必要があります。たとえば、サーバーがエラー ページに対して HTTP 200 (成功) ステータス コードを返したり、同一サーバー上でホスティングされている別のドメインへのリクエストを取り違えたりすることがあります。問題の原因が分かり次第、サーバー管理者と協力して設定を修正してください。
  • 悪意のあるウェブサイトへの攻撃:ウェブサイトに対する攻撃の中には、勝手に正規化を行うコードを生成するものがあります。たとえば、サイトに HTTP 301 リダイレクト を返させるものや、HTML や HTTP ヘッダーにドメインをまたがった rel="canonical" リンク属性 を挿入するものがあります。この場合は悪意のあるコンテンツをホスティングしている外部 URL を指すことが一般的です。このような例では、攻撃を受けたウェブサイトの URL ではなく、悪意のある URL やスパム URL がアルゴリズムに選択されてしまうことがあります。

    このような場合、サイトがハッキングされた、またはマルウェアに感染した場合のガイドライン に従い、再審査リクエストを送信します。ウェブマスター ツールの Fetch as Googlebot 機能を使用すると、Googlebot に見えているようにコンテンツを表示し、クローキング された攻撃を検出できます。
  • また、まれにではありますが、あなたのコンテンツをあなたから許諾を得ることなく使用している外部サイトの URL が選択されることがあります。著作権に違反して、他のサイトにコンテンツを複製された場合、そのサイトのホストに連絡を取って削除を依頼してください。また、DMCA (デジタル ミレニアム著作権法) に基づく要求を提出する ことで、権利を侵害しているページを検索結果から除外するよう Google にリクエストすることもできます。

    この記事について詳しい情報は、ヘルプ記事「クロスドメイン URL の選択」をご覧ください。コメントやご質問は、ウェブマスター ヘルプフォーラム までお寄せください。

    2011Q3世界の携帯機器出荷、対前年同期比5.6%増、スマートフォンは42%増 など

    14 years ago
    2011Q3世界の携帯機器出荷、対前年同期比5.6%増、スマートフォンは42%増
    2011/11/15のGartnerのリリースから。

    http://www.gartner.com/it/page.jsp?id=1848514

    スマートフォン導入済み企業は1年前から拡大し16%に
    2011/11/15のジーエフケー マーケティングサービス ジャパンのリリースから。

    http://www.gfkjpn.co.jp/update_file/pdf/284.pdf

    2015年世界の無線契約の10%がLTEに
    2011/11/15のiSuppliのリリースから。

    http://www.isuppli.com/Mobile-and-Wireless-Communications/News/Pages/LTE-to-Account-for-10-Percent-of-Global-Wireless-Subscribers-by-2015.aspx
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    bestbuyとebayは検索語「iPad」を広告で集客、walmartは100%オーガニック検索で集客 など

    14 years ago
    bestbuyとebayは検索語「iPad」を広告で集客、walmartは100%オーガニック検索で集客
    2011/11/15のcompeteのブログから。
    http://blog.compete.com/2011/11/15/tis-the-season-to-up-the-ante-on-your-ipad-seo/

    2011/11/12の週の米検索エンジンシェア、Googleが64.94%http://www.hitwise.com/us/datacenter/main/dashboard-23984.html

    2011/11/12の週の英検索エンジンシェア、Googleが90.59%http://www.hitwise.com/uk/datacentre/main/dashboard-7323.html

    2011/11/12の週の豪検索エンジンシェア、Googleが93.55%http://www.hitwise.com/au/datacentre/main/dashboard-1706.html
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    消費者が企業ソーシャルサイトに求めるもの、割引(61%)という実利で、コミュニティのメンバーであること(22%)ではない など

    14 years ago
    消費者が企業ソーシャルサイトに求めるもの、割引(61%)という実利で、コミュニティのメンバーであること(22%)ではない
    IBMのFrom social media to Social CRMから。
    http://public.dhe.ibm.com/common/ssi/ecm/en/gbe03391usen/GBE03391USEN.PDF
    http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-social-crm-whitepaper.html

    2011/9メキシコ、YouTubeでの月間動画利用は5時間に
    2011/11/15のcomScore Data Mineから。
    http://www.comscoredatamine.com/2011/11/viewers-in-mexico-watched-5-hours-of-video-on-youtube-in-september/

    米メールマーケディング、コロンブスデイのピークは10/7
    2011/11/15のRetail Email Blogから。
    http://www.retailemailblog.com/2011/11/season-finale-columbus-day-2011.html
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    2011年中国のPC出荷台数、1億台突破と予想を上方修正 など

    14 years ago
    2011年中国のPC出荷台数、1億台突破と予想を上方修正
    2011/11/14のDisplaySearchのリリースから。
    http://www.displaysearch.com/cps/rde/xchg/displaysearch/hs.xsl/111114_displaysearch_raises_2011_china_pc_shipment_forecast_to_100_million_units_despite_weak_global_demand.asp

    国内ハードウェアサポート市場、2010年~2015年の年平均成長率はマイナス5.0%
    2011/11/15のIDC Japanのリリースから。
    http://www.idcjapan.co.jp/Press/Current/20111115Apr.html

    非コンピュータによるデジタルトラフィック、タブレット利用などに分散
    2011/11/15のcomScore Voicesから。
    http://blog.comscore.com/2011/11/the_rise_of_digital_omnivores.html
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    フルタイムで1人のアナリストを雇えない、1億円以上の貢献がサイトから見込めないなら、ただのツールを使うべき など

    14 years ago
    フルタイムで1人のアナリストを雇えない、あるいは1億円以上の貢献がサイトから見込めないなら、ただのツールを使うべき
    2011/11/15のMeasuring Successから。

    http://www.advanced-web-metrics.com/blog/2011/11/15/should-you-pay-150000-for-your-web-analytics/

    野村総合研究所がTRUE TELLERテキストマイニング Ver.8.0を発売
    2011/11/15の野村総合研究所のリリースから。
    http://www.nri.co.jp/news/2011/111115.html
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    2人のGoogle社員が10+2個のホットトピックに回答 at #PubCon Las Vegas 2011

    14 years ago


    PubCon Las Vegasで行われた2人のGoogle社員によるQ&Aセッションのレポート。1人はおなじみのマット・カッツ、もう1人は米Googleの検索品質チームのトップ、アミット・シンガル氏。Googleで今いちばんホットなトピックに2人が回答した。

    - 2人のGoogle社員が10+2個のホットトピックに回答 at #PubCon Las Vegas 2011 -

    Posted on: 海外SEO情報ブログ - SuzukiKenichi.COM

    「ソーシャルメディア進化論」を読んだ

    14 years ago
    デジタルハリウッド大学院で「アクセス解析実践」の授業をやっている当日に出版セミナーがあるというので、筆者の話を聞いてみて面白そうだと思ったので、本も買って読んでみたという経緯だ。セミナー当日は私の授業と時間的には少しダブっていたので、話が始まって30分くらい経ったところから聴き始めた。

    コンサルの人がよくやる2軸、4象限での解説をしていたので、またこのパターンかと思いつつも、「このエリアもあのエリアもダメでした、ソーシャルって簡単じゃない」みたいな話だったので好感を持てた。というのが、本も読んでみようかなと思わせたことでもある。

    さて本の方に話を移そう。付箋はかなり付いた方だろう。まあコミュニティを作って運営したことなんかないので、これやっても駄目だし、あれやっても駄目みたいな話は、確かにそうだろうなあと思いつつ、何故うまくいかないかといったポイントには次々に付箋がついたという次第だ。

    ただ、第1章と第2章に関しては、僕には全く不要だった。今更、インターネットの成り立ちみたいな歴史を紐説く部分や、世界は6人で繋がっているみたいな話は、もういいやということで、いつになったら本題が始まるのか正直いらいらした。ちなみにここまでで80ページを費やしている。

    まあでも、インターネットの本質である「繋がる」ということの意味や歴史を一般の人にじっくり伝えるということは意味があると思うので、この部分がないとストーリとしてまとまらない本になっていた可能性がありそうだ。

    で本題は第3章から第6章ということになるだろう。冒頭に紹介した2軸は、関係構築-情報交換、価値観-現実生活というものだ。4つのエリアそれぞれにおける、コミュニティの問題点をまず明らかにしたのが第3部。

    第4部ではその中で企業が活用するエリアがあるのかということに言及。結局、企業のコミュニティとして成り立ちえるのは「関係構築」&「価値観」のエリアにしかないという。「企業と顧客が価値観で共鳴し合う関係構築の場」を作るしかないという。そこでネットワークのハブになるサポーターをしっかり育てることが大事だという。第5-6部は実例紹介という流れになる。

    ある程度の規模以上の企業で、オンライン上にコミュニティを展開してみたいという担当者にはうってつけの本に違いない。参考文献リストを見る限りでは、本を書くにあたって読んだのかはわからないが、広範囲に亘って本を読んでいて勉強していることはわかった。

    <目次>
    序章:冒険に旅立つ前に
    第1章:見える人と見えない人
    第2章:インターネット・クラシックへの旅
    第3章:ソーシャルメディアの地図
    第4章:企業コミュニティへの招待
    第5章:つながることが価値になる・前編
    第6章:つながることが価値になる・後編
    終章:希望ある世界



    発行:ダイヤモンド社
    著者:武田 隆
    定価:1,800+税
    約330ページ

    関連リンク:
    書評ページをまとめた
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    「かってに解析は、了解を得て書いているのですか」という問に答える  [週刊IFWA 2011/10/17]

    14 years ago
    定期メルマガの巻頭コラムのアーカイブです。メルマガの登録はこちら↓からどうぞ。
    http://ibukuro.blogspot.com/2010/07/blog-post_12.html


    ■「かってに解析は、了解を得て書いているのですか」という問に答える

    「有名サイト、かってに解析は、掲載対象サイトの了解を得て記事書いているのですか」とよく質問されます。よくありそうな疑問だろうと思い、それにお答えしたいと思います。

    これは記者の取材記事の執筆とも共通する話ですが、原稿を取材先に最終確認をとるとか、チェックをしてもらうというようなことはしないのが原則です。昔日経BP社に居ましたが、日経パソコンでソフトウエアのレビューをするのに、ピックアップしたソフトの会社に許諾を受けてから記事にする、書いた記事をチェックしてもらうなどというのは多分しません。編集記者、編集部はそのネタを旬だと思うからピックアップします。

    もう一つの議論に編集と広告の問題があります。基本的に編集と広告の独立性がないと、広告主に気兼ねしてしまい、本来のジャーナリズムからかけ離れてしまいます。

    ということで、どのサイトを取り上げるのも私の「勝手」でやっていますし、サイト運営者に「了解」をもらうことも、書いた記事を「チェック」してもらうこともしません。ただ取り上げて欲しいという自薦・他薦は受け付けています。もちろん全て取り上げるという保証はしません。逆に広告的に使われてしまうということを避けるためです。

    メディア企業に居たこともある自分の中では、この行動規範は普遍的なものなのですが、意外とそういう行動規範は皆さん知らないのだなあということに気づかされます。しかしそんな良心的なメディアが少ないのも事実で、自分でもTwitterでメディア批判していますね。3種類ある毎日呟く一言を掲載して終わります。何か自己矛盾を感じながら。。。

    「メディアの言う事には目的がある。記事は常に主観的で、罪深く、一人歩きする。記事に客観など無い。主要メディアが一斉に反対することには、ステークホルダーの一部に大変不利益を与える事象ではないかを疑おう。そしてその報道がどう主観的なのかを見抜こう」
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    正しいユーザーインターフェースがある訳ではない  [週刊IFWA 2011/10/10]

    14 years ago
    定期メルマガの巻頭コラムのアーカイブです。メルマガの登録はこちら↓からどうぞ。
    http://ibukuro.blogspot.com/2010/07/blog-post_12.html


    ■ 正しいUIがある訳ではない、我々が慣れていくしかない場合も

    またGoogle アナリティクスネタになりますが、10月7日にバージョン5の画面の変更がありました。その直後にはバグがあったのか不明ですが、元のインターフェースに2-3日戻すよというアナウンスが公式ブログであり、画面が旧来のものに戻っています。

    恐らくこのメルマガが発行される10日の朝は、元に戻ったままか、新しいインタフェースにまた変更されているか微妙なタイミングだと思いますので、皆さんの多くはこの騒動を知らずに過ごされるかもしれません。

    アクセス解析ツールの画面構成は大体、上方に大メニュー的な管理タブがあって、左側に各種レポートメニューが並んでいるといった構成が多いように感じます。ソフトウエアであれば、上方に多くのプルダウンメニューを配置するような形が多いでしょう。

    慣れの問題や好き嫌いの問題もあって、ソフトウエアやウェブサイトのユーザーインタフェースに正解というものがある訳ではありません。ところで、先週の木曜日に書いた「かってに解析!」はユニクロのサイトを取り上げてみました。

    詳しくは記事を読んで頂きたいのですが、個人的にはこのトップページは慌ただしくて、好きになれませんが、皆さんは如何でしょうか。
    http://web-tan.forum.impressrd.jp/e/2011/10/06/11267

    まあこの記事は私の好き嫌いの話をするためのものではなく、こんな風に感じるユーザーもいるのだということをご参考にして欲しいというのが狙いです。あくまでもこんな意見もあるのだということです。

    で、Google アナリティクスに話は戻るのですが、バージョン5のインタフェースは、レポート部分にもタブがあり、上にグラフ、下に表が配置され、それぞれにグラフモードを選択することができたり、様々な場所のプルダウン型のメニューが隠されているといいますか、配置されています。

    ソフトウエアでもそうですが、大きなバージョンアップがあると、どうしても従来のインタフェースをゼロクリアして、大きく変更せざるを得ない場合があります。GAのバージョン5は結構大きな変更に感じます。

    こういうデータを見るツールでの標準的な見せ方や選択肢などは、各ツールで今後も試行錯誤が続いていくのでしょう。正解がないだけに、我々もこういうツールとともに進化していく必要があるのでしょう。進化は止まることを知らないので、頑張ってついていきたいと思います。
    noreply@blogger.com (衣袋 宏美(いぶくろ ひろみ))

    CSS Nite in MIYAZAKI, Vol.3が終了しました

    14 years ago

    2011年11月12日(土) 宮崎産業経営大学にてCSS Nite in MIYAZAKI, Vol.3を開催し、90名ほどの方にお集まりいただきました。

    ツイートは下記にまとめました。

    次のブログで取り上げていただきました。ありがとうございます。

    人気記事トップ10

    人気記事ランキングをもっと見る