国内&海外SEO情報ウォッチ 「海外SEO情報ブログ」の鈴木 謙一氏が、日本と海外の検索マーケティング情報をさらっとまとめて毎週金曜日にお届け。
海外&国内SEO情報ウォッチ

膨大な低品質ページをインデックスからすみやかに削除する4つの方法

ページ

海外のSEO/SEM情報を日本語でピックアップ

膨大な低品質ページをインデックスからすみやかに削除する4つの方法
★★★★☆ 冒険的な方法もあり (AMA on reddit)

パンダアップデートの対象になるような低品質なページを非常に多く抱えていたとして、それらを効率よくインデックスから削除するにはどうしたらいいか?

この質問に、米国の腕利きSEOコンサルタントであるAJ・コーン氏が回答した。

  • 方法1

    特定のディレクトリ配下のページをインデックスからからすべて削除する場合は簡単。robots.txtでそのディレクトリのクロールをブロックして、URL削除ツールでディレクトリを指定するだけ。ディレクトリ内のページを一度に速く削除できる。

  • 方法2

    特定のディレクトリ配下の大多数(たとえば90%)のページをインデックスから削除する場合は、1つ目と同じように、ディレクトリ全体をrobots.txtでブロックしURL削除ツールを使ってディレクトリレベルでインデックスから削除する。そして数週間その状態を保つ。

    その後、不要なページを削除するかnoindex robots metaタグを記述し、robots.txtのブロックを解除する。良いページが再びインデックスされるのを待つ。 危険度が非常に高いので、パンダアップデートにやられたりしてもう何も失うものがないときだけに使う。

  • 方法3

    普通に、noindex robots metaタグを記述し、グーグルがクロールするのを待つ。ただし時間がかかるし、インデックスから消えるまでの時間はクロール頻度に依存する。

  • 方法4

    裏ワザ的な方法。インデックスから削除するためにnoindex robots metaタグを記述したページの一覧をリスト化したページを作成する。ウェブマスターツールのFetch as Googleの「インデックスに送信」機能を使い、そのページとそのページからリンクが張られているページのクロールをリクエストし、noindexをすぐに認識させる。

    うまくいくかどうかはわからないが、害になることはないはず。

  • その他の方法

    ページを削除して404を返してもいいが、特に大規模サイトでは大量の404ページがあることは悪い評価に繋がるかもしれないので、好きではない。

    またカテゴリレベルのページヘのリダイレクトも数が多いとグーグルは嫌がる傾向にあるので、勧めない。

方法2は、おもしろい方法なのだが、AJ氏が言うように冒険的な要素を含む。方法4は、筆者も相談を受けたときに提案したことがある(残念ながら結果までは聞いていない)。

外部サイトへのリンク切れはSEOにマイナスなのか?
★★★★☆ ユーザー体験の観点からはマイナス (Google Webmaster Help Forum)

ツールを使って外部サイトへの発リンクをチェックしたところ、すでに存在しなくて404エラーを返していたり、リダイレクトされていたりするページをたくさん発見しました。

404になるリンクは修正しました。リダイレクトはそのままです。

この対処で問題ないでしょうか。

グーグルの公式ヘルプフォーラムに投稿された質問だ。

グーグルのジョン・ミューラー氏が、次のようにアドバイスした。

そういったことを見つけたら、私なら第一にユーザーのために修正する。そうすればユーザーにサイトを完全に使ってもらえる。自分のサイトのSEOを目的にするようなものではないと考える。ユーザーのために行うような他のメンテナンスと同じようなものだ。

外部サイトへのリンクがリンク切れしていたり、違ったページにリダイレクトされていたからといって、通常は評価に悪影響を与えるようなことはないであろう。しかし、リンクをクリックしたら404エラーのページだったり、予測とまったく違うページに連れて行かれたりしたら、ユーザーは困惑するはずだ。

SEOではなくユーザー体験という観点から、適切な処置をすればいいということになる。

トルコの大手ニュースサイトにグーグルが一斉スパム制裁
★★☆☆☆ 非公式情報 (Search Engine Roundtable)

グーグルは、トルコのいくつかのニュース系サイトに一斉に手動で対策したようだ。大手のニュースサイトもなかには含まれる。コンテンツスパムやキーワードの乱用が理由らしい。

この記事の元になったツイートでは、具体的にニュースサイト名を挙げて状況を伝えている。

トルコの大手ニュースサイトがグーグルの検索結果から消えた。Hürriyet、Milliyet、CNNTürk、Radikal、Habertürkなどだ。

もっとも、グーグルはこの件に関して公式には何もコメントしていない。

しかしながらトルコは悪質なスパムが多い地域だ。前回ピックアップした日本独自のウェブスパム対策同様に、国や言語に応じた処置を実施したとしても不思議なことではない。

WebPの画像もグーグルはきちんとインデックスする
★★☆☆☆ ウェッピーはグーグル製の画像フォーマット (John Mueller (JohnMu) on Twitter)

グーグルの画像ファイルフォーマットWebPに関連するSEO的な情報がほとんどありません。何か知っていますか?

ツイッターでこのように尋ねられたグーグルのジョン・ミューラー氏が、次のように返答した。

WebPは画像検索できちんと扱われる。「inurl:webp」で検索すれば、WebPの画像が見つかるだろう。

WebP(「ウェッピー」と発音する。拡張子は、.webp)は、グーグルが開発した画像のフォーマットだ。ウェブで幅広く使われているJPEGやPNGよりも圧縮率が高く、同等の画質を小さなファイルサイズで提供できるという優れた特徴を持つ。

WebPフォーマットの画像をグーグルはインデックスできるとミューラー氏は言っている。

ただしすべてのブラウザがサポートしているわけではないので、環境によっては表示できないのが現状では難点だろうか。

WebPのドキュメントによると、サポートしているブラウザは次のとおりだ。

  • WebP lossy(JPEG相当)をサポートしているブラウザ
    • Google Chrome(デスクトップ版) 17以降
    • Google Chrome for Android バージョン25以降
    • Opera 11.10以降
    • Android 4.0以降のネイティブWebブラウザ
  • WebP lossy(JPEG相当)とlossless & alpha(PNG相当)ををサポートしているブラウザ
    • Google Chrome(デスクトップ版) 23以降
    • Google Chrome for Android バージョン25以降
    • Google Chrome for iOS バージョン29以降
    • Opera 12.10以降
    • Android 4.2以降のネイティブWebブラウザ

なおミューラー氏は、「inurl:」検索を提案しているが、これだとドメイン名やディレクトリ名、ファイル名に「webp」が入ったURLが含まれるので、ファイルの種類を指定する「filetype:」検索のほうが適切だろう。

「いぬ filetype:webp」の検索結果
画像検索で「filetype:webp」を追加して検索するとWebPの画像ファイルだけでフィルタリングできる。

App Indexについての質問をグーグルが受付中
★★☆☆☆ 日本語で尋ねても答えてもらえるかも (Mariya Moeva on Google+)

日本語にも対応したApp Indexingをあなたもすでに導入したかあるいは導入検討しているかもしれない。実装や機能について疑問はないだろうか? もしあればこちらで質問してみるといい。

グーグルのマリヤ・モエヴァ氏が、App Indexingに関するウェブマスターからの質問を募っている。ハングアウトオンエアを利用したオフィスアワーで後日回答する予定だ。

英語で質問すべきだろうが、マリヤさんは(漢字も含めて)日本語を理解するので、ひょっとしたら日本語で質問しても答えてもらえるかもしれない(もちろん英語のほうが良いのだろうが)。

SEO JapanSEO Japanの
掲載記事からピックアップ

先週に続いて、SEO Japanブログを運営するアイオイクス社の社員さんが参加したContent Marketing World 2014カンファレンスのレポート記事をピックアップ。

ページ

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

インデックス
検索エンジンがWebページをデータベースに保存しているデータベース。データベース ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]