多言語サイトSEOのベストプラクティス ―― コンテンツの翻訳・シグナル・hreflang編
この記事は、3回に分けてお届けしている。国際的SEOに伴うccTLDとサブディレクトリの問題や、ローカルIPアドレスとローカルホスティングなどの問題について説明した前回に続き、2回目となる今回は、多言語でサイトを制作した場合、どの言語や国をターゲットとしているのかを検索エンジンに伝えるシグナルについて考えみよう。前回をまず読んでおく
サイトのコンテンツをどう翻訳するべきか
国際SEOの実施でまず問題になるのは、ターゲットとする国の言語にサイトのコンテンツを翻訳することだろう。
プロの翻訳者(または翻訳会社)を使うのが普通の感覚だが、常識がなく、次のような方法に頼りがちな人々もいる。
- 自動翻訳サービス(特にグーグル翻訳)
- コンテンツを翻訳する対象の言語をたまたま知っている社員
まず後者はバカげている。プロの翻訳者は、翻訳する言語を何年も勉強し、ニュアンスを知っていて(翻訳者がバイリンガルならより良い)、それでも普通は外国語から母国語への翻訳であって、その逆ではない。
前者の自動翻訳は公式に反対されている。質の悪いシグナルがグーグルに送られるとの考えからだ(これは正しい)。グーグルの翻訳ツールはこの目的のために作られたとはいえ、ページから混乱したメッセージが送信されるようなので、翻訳サービスはほかを探すほうがいいだろう。
プロによる翻訳は、キーワード探しの最良の味方になる。
たとえば、スペイン語が使われるラテンアメリカの市場において「自動車 売る」といった検索の上位に入りたいとしよう。グーグル翻訳(あるいはBabylon、WordLingo、Bing Translator)を使うと、表現は1つしか出てこないだろう。しかし、「スペイン語」といっても世の中にはさまざまなスペイン語圏があり、それぞれ使われる可能性があるさまざまな表現がある。たとえば次のようなものだ。
- Venta de coches(スペイン)
- Venta de carros(メキシコ)
- Venta de auto(アルゼンチン)
- などなど……
翻訳ツールを使った場合に、さらにまずいことがある。よその国の人は、「公用語/標準語」ではなく、地方ごとに独自の方言が発達した国があることにも気づかないだろうし、そのような国では英語を使った言い回しとそれに対応する母国語の両方が使われていることにも、おそらく気付くことがないだろう。イタリアの例を挙げると、「voli low cost」と「voli a basso costo」は、どちらもとても一般的な表現であり、どちらも「格安便」という意味だ。
僕の場合、サイトを外国語で最適化するときは、翻訳者にキーワードの詳細なリストを提供する。翻訳者はこのリストを次のように用いる。
- ターゲットとする言語で適切なものに翻訳
- サイトの翻訳に活用
サイトの翻訳が完了したら、訳出されたキーワードを僕がコピー&ペーストして、Google AdWordsのキーワードツールにかける。手順は次のとおりだ。
- キーワードと推定トラフィック量のリストを作る
- 「トピックに関連する」キーワード候補をグーグルが提案する
- そのキーワード候補について、Google Trendsで情報の収集と分析を行う。
- 翻訳したキーワードのリストだけではなく、翻訳されたページそのものをキーワードツールにコピー&ペーストすれば、もっと洗練されたキーワード候補をより多く得られる。
- 最初のキーワードのリストを改良する。キーワードを分析した結果から翻訳を変える必要がある場合は、翻訳者に変更を依頼する。
プロからのアドバイスさらに僕の場合、得られたキーワードのリストをSEOmozのKeyword Difficulty Toolにかけて、これからサイトが競い合わなければならない競合相手と難易度をしっかり把握する。
ここまでに説明してきたような作業を、自動翻訳サービスでできるだろうか?
正確な翻訳は、サイトが発信するとりわけ強力なジオターゲティングのシグナルになる。その言語が複数の国で話されている場合はなおさらだ。そして、ユーザビリティの戦術(コンバージョンの向上と相関関係にある)として極めて重要でもある。人は、自分と同じ言葉を話すサービス提供者を信頼する傾向があるからだ。
さまざまなシグナル
典型的なジオターゲティングのシグナルとして、ほかにその国の通貨、住所、電話番号の利用がある。これらを使うのは実に常識的なことだが、やはりこうした分野が得意ではない人たちもいる。
とはいえ、特定の国ではなく全世界を対象に1つの言語をターゲティングする場合には、苦労があるかもしれない。矛盾する目的を抱えており、地域を示すさっきのシグナルはもちろん使えない。ではどうするか。僕は次のような手順を使っている。
- 対象の言語にバリエーションがある場合には、教育の場で標準とされる訳語を使うようにする。そうすれば、その言葉が話される各国で理解され、受け入れてもらえる。
- ターゲットとする言語が使われている国にオフィスがないとしても、その言語による顧客サービス部門ならあるかもしれない。現地の正規の電話番号を「購入」して、そこから実際のフリーダイヤルに転送するようにしよう。そしてサイトの「問い合わせ先」ページには、現地の電話番号を掲載する。
- ローカルリスティングやバランスの取れたリンクビルディング戦略など、その他のシグナルをより重視しよう。
「rel="alternate" hreflang="x"」の実装方法をめぐる
ネバーエンディング・ストーリー
これまでに述べてきた内容をよく考えれば、「ページにおける国際的SEO」が「ページにおける国内SEO」とそれほど違わないことをしっかり認識しているはずだ。
しかし、話が複数の国を対象とする多言語サイトのタグについてとなると、些細な違いが持ち上がる。そして、この話をめぐって、(この2年間、グーグルが矛盾したメッセージを発していたせいもあって)多くの混乱がある。
ジオターゲティング用のHTMLタグは、地域を限定したグーグル検索で間違ったURLが表示されるのを避けるために必要とされる。典型例は、Google.co.ukで米国のサイトが英国のサイトより上位にくるというもので、これは通常、ページやドメイン目地のオーソリティの違いに起因する。ジオターゲティング用のタグには、これ以外の機能はまったくない。
一見すると、実装はかなりシンプル
他の国からアクセスした場合、ページA(米国版)と同じ内容が、ページB(スペイン語)、ページC(フランス語)、ページD(ドイツ語)でも見られるなら、B~Dのドメイン名が同じであろうが異なっていようが、ページAでは残り3つのURLについて、それぞれがターゲットとする国のグーグルの検索結果ページで表示しなければならないURLだと教えてやるべきだ。
そのためのタグはhead要素に書く。具体的には次のようになる。
<rel="alternate" hreflang="es-ES" href="http://www.domain.com/es/page-B.html" />
この中で、「es-ES」は「ロケール」と呼ばれる情報で、対象とする地域と言語を示している。「es」はターゲットの言語をISO 6391-1形式で、「ES」はターゲットの国をISO 3166-1 Alpha 2形式で指定したものだ。
たとえば同じ英語でも米国向けの場合は「en-US」だし、英国向けの場合は「en-UK」になる。日本ならば「ja-JP」だ。
サイトマップで言語に関する情報を提供することも可能だ。サイトのコードに負担をかけないためにはこれが最良の選択で、ピーター・ハンドリー氏がtheMediaFlowの記事で論じているように、実に有効に機能している。そのほかに、「rel="alternate" hreflang="x"」をsitemaps.xmlファイルに組み込むツールがすでにあり、theMediaFlowでも提供されている。
それほど難しい話ではないと思うのだが、どうだろう? 残念ながら、SEO担当者はこれまで、ひどい不信にとらわれて尻込みしてきた。特に、言語を同じくする国々にまたがって国際的SEOを試行する場合は。
こうした不信の理由は何だろう? それは、こうしたサイト(またはサブディレクトリ)にありがちな(実質的に)重複したコンテンツへの心配と、「rel="canonical"」の適切な利用だ。
たとえば、多言語サイトにおいて、オンラインストアの米国版を
www.example.com/store/
に、オーストラリア版を
www.mysite.com/au/store/
にするとしよう。どちらも同じ製品を販売していて、製品ページは実質的に同じだ。
ご存じのように、重複コンテンツや実質的に重複するコンテンツは、パンダアップデートでペナルティ対象になった代表的な要素の1つだ。それでは、米国のストアをオーストラリア版ストアの正規ページに指定する必要があるということなのだろうか? 答えはノーだ!
グーグルはその理由を2つ挙げている。
「rel="canonical"」は、そのページが「正規」コンテンツの完全な重複である場合に限って、そのページ自体のURLと異なるURLを示すべきである
製品ページは、通貨、問い合わせ先の電話番号、所在地、(文章をローカライズしている場合は)一部の単語のつづりなど、わずかに違いがあり、完全な重複ではない。
このケースについては、グーグルのピエール・ファー氏が8月にGoogle+で書いている通りだ。
「rel="alternate" hreflang="x"」というのは、2つのページは実質的にはほぼ同じコンテンツだが、その小さな違いが重要だというということを、グーグルのアルゴリズムに知らせようとするものだ。
はっきり言うと、その小さな違いが特定の言語(と国)のユーザーにとって問題となる場合に使うものだ。同じ理屈で、title要素も異なる場合がある。
したがって、canonicalを使って別のURLを指定すると、有用で重要な情報が載っているかもしれないページをユーザーが見られないことになる。
Bingの場合はどうか
Bingは、「rel="alternate" hreflang="x"」を採用していない。ドゥエーン・フォレスター氏が書いているように、Bingは一連のシグナルを頼りに判断しており、最も重要なのは「content-language」を表すmeta要素で、次のようなものだ。
<meta http-equiv="content-language" content="x-X">
この記事は、3回に分けてお届けしている。最終回となる次回は、国際的SEOとリンクビルディングおよびインバウンドマーケティングについて考えてみる。
ソーシャルもやってます!