多言語ウェブサイトの作成について | Google ウェブマスター向け公式ブログ

このページは、外部サイト Google ウェブマスター向け公式ブログ の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「多言語ウェブサイトの作成について」 からご覧ください。
多言語のウェブサイトとは、複数の言語に向けてコンテンツを提供するウェブサイトです。多言語のウェブサイトの例には、日本語に加えて中国語と韓国語で公開されているアジアをターゲットとした企業のサイトや、ヨーロッパのサッカーチームのファンサイトを日本語とそのチームの母国語で公開している場合など様々なサイトがあります。

通常、多言語のウェブサイトを作成する意味があるのは、ターゲット ユーザーの使用する言語が複数にわたっている場合です。ヨーロッパのサッカー チームのブログが日本にいるそのチームのファンに向けたものであれば、日本語のみで公開しても問題ないでしょう。しかし、世界中のそのチームファンにも読んでもらいたいと考えるなら、英語やそのチームの母国語のコンテンツも用意すると役に立つことでしょう。

Google の言語認識
Google はページごとにその主となる言語を判断しています。言語を認識しやすくするために、ページごとに使用する言語を統一すること、そして原文と訳文を一緒に表示しないことをおすすめします。1 ページについて複数の言語を認識することも可能ではありますが、ページ内のすべての要素(ヘッダー、サイドバー、メニューなど)の言語は統一して使用することをおすすめします。

Google では「lang」属性から文書型定義(DTD)まで、コードレベルの言語情報はすべて無視します。一部のサイト制作ソフトでは、これらの属性が自動的に作成されるため、ウェブページの言語を判断する際にこうした情報はあまり信頼できないためです。

一般的に Google である言語で検索を行う場合、ユーザーは検索した言語に最適化された検索結果が表示されることを期待しています。そこで、サイトの多言語化を図る際には、検索結果に表示されるスニペットや URL などにも気を配る事が重要となります。以下にそのためのヒントをいくつか紹介します。

多言語のサイトの分析: URL 構造
多言語のウェブサイトを作成するときに、特別な URL を用意する必要はありません。とはいえ、URL を見て自分がウェブサイトのどのセクションにいるのかを把握できればユーザーにとって便利です。たとえば、次のような URL が使われていると、ユーザーは自分がこのサイトの中の英語用コンテンツにいることが把握できます。

http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html

一方、次のような URL であれば、同じページをフランス語で表示していることがわかります。

http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html

また、このような URL 構造を使うと、多言語コンテンツのインデックス状況が分析しやすくなります。

非英語文字が含まれる URL を作成する場合は、必ず UTF-8 エンコードを使うようにしてください。UTF-8 でエンコードされた URL であれば、コンテンツ内からリンクされた場合も適切にエスケープされます。手動で URL をエスケープする必要がある場合は、オンラインの URL エンコーダ を利用するのが簡単です。たとえば、次の URL を英語からフランス語に翻訳するとします。

http://example.ca/fr/mountain-bikes.html

翻訳後の URL は次のようになります。

http://example.ca/fr/vélo-de-montagne.html

この URL には非英語文字が 1 文字(é)含まれているので、ページ内のリンクで使用するために適切にエスケープすると次のようになります。

http://example.ca/fr/v%C3%A9lo-de-montagne

多言語のウェブサイトのクロールとインデックス
まずはじめに、自動翻訳したページをインデックスの対象としないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。また、自動翻訳されたコンテンツは、しばしばユーザーにとって理解できなかったり、不自然に感じることがあります。そのようなコンテンツを多言語のウェブサイトとして作成するのは、ユーザーにとって有益ではありません。

多言語化を行う場合は、Googlebot がサイトのすべての言語バージョンをクロールできるようにしてください。また、ページ間で相互にリンクすることをおすすめします。つまり、同一コンテンツを異なる言語で掲載したページ間をリンクします。ユーザーにとってもこのリンクは非常に便利です。先ほどの例を使って説明すると、たとえばフランス語を使うユーザーが http://example.ca/en/mountain-bikes.html にアクセスしてしまった場合、ワンクリックで http://example.ca/fr/vélo-de-montagne.html に移動して同じコンテンツをフランス語で表示することができます。

サイトをよりクロールされやすくするために、ブラウザの言語設定による自動的なリダイレクトを行わないようにしてください。このようなリダイレクトを行うと、ユーザー(と検索エンジン)がサイトのすべての言語バージョンを見られなくなる場合があります。

最後に大切なこととして、各言語のコンテンツには別々の URL を使用してください。つまり、多言語間で同一の URL を使って Cookie でコンテンツを切り替えるような構造は避け、それぞれの言語ごとに URL を設定しましょう。

文字コードの使用
Google は、HTTP ヘッダー、HTML ページ ヘッダー、コンテンツから文字コードを直接判定します。文字コードに関して注意していただきたいのは、コンテンツとヘッダーの間などで情報が矛盾していないか注意することです。Google ではさまざまな文字コードを認識できますが、可能であればウェブサイトでは UTF-8 を使用することをおすすめします。

多言語のウェブサイトの作成についての説明は以上です。この記事に関するコメントやご質問は、ウェブマスター ヘルプフォーラム までお寄せください。

Written by Xavier deMorales, Google Search Quality
Original version: Working with multilingual websites
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

アクセシビリティ
広義には、障害者、高齢者を含むすべての人間が、同じレベルでサービスや機器、施設を ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]