インバウンドSEO対策。「GTranslate」WordPressプラグインの検索エンジンへのインデックスの仕組みはどうなっているのか?

こんにちは。ケイソンです。今回はWebサイト制作や運用、多言語対応を担当している方へ向けて、検索エンジンのインデックスの関係について、できるだけわかりやすく解説します。
WordPressで多言語サイトを作るとき、手軽に導入しやすいプラグインとしてよく使われるのが「GTranslate」です。導入しやすく、多言語化もスピーディーなので、実際に使っている方も多いと思います。
ただ、運用を始めると、よく出てくる疑問があります。
- Improve Translations を開いても、一部のテキストしか出てこない
- 修正したい文章が管理画面で見つからない
- 翻訳データは、いつ作られているのかよく分からない
- 海外のGoogleには、いつ翻訳ページが登録されるのか不安
こんな悩みもあるかもしれません。
「管理画面に翻訳テキストが出てこないということは、そのページはまだ翻訳されていないのでは?」
「誰かがその言語でページを開かないと、検索エンジンにも認識されないのでは?」
結論から言うと、GTranslateでは、ページが実際に表示されてはじめて翻訳データが作られる、という理解が基本です。
その「表示する人」は、サイト運営者や一般ユーザーだけではありません。Googleなどの検索エンジンのクローラーが多言語ページにアクセスした場合も、そのタイミングで翻訳が生成されることがあります。
ただし、この仕組みを正しく理解していないと、次のような問題が起こります。
- まだ修正していない機械翻訳が、そのままGoogleに登録される
- 重要ページの翻訳を直したいのに、管理画面に出てこない
- 海外SEOを狙っているのに、多言語ページがなかなかインデックスされない
そこでこの記事では、GTranslateの翻訳データが作られる仕組み、Improve Translations に出るテキスト・出ないテキストの違い、そして綺麗な翻訳状態で検索エンジンに登録させるための考え方を、制作・運用の現場向けにわかりやすく整理していきます。
1. GTranslateでは、なぜ最初から全部のテキストが表示されないのか?
まず一番大事なのは、GTranslateの仕組みです。
GTranslateは、WPMLやPolylangのように「最初からすべての翻訳ページをWordPress内に保存しておく」タイプとは少し違います。特に検索エンジンに対応する有料プランでは、ページが表示された時に、その場で翻訳を作る仕組みが使われています。
これをよく「オンザフライ翻訳」や「リアルタイム翻訳」と呼びます。
つまり、英語ページに誰かがアクセスした時に、GTranslateが元の日本語ページを読み込み、その場で英語ページを作って返している、というイメージです。
そのため、まだ一度も表示されていないページやテキストは、GTranslate側に翻訳データが存在しません。だから、Improve Translations にも出てこないのです。
ここが一番のポイントです。
- ページが表示される
- その場で翻訳が作られる
- 翻訳データがキャッシュされる
- Improve Translations に表示される
この順番で動いています。
オンザフライ翻訳とは?
通常の多言語プラグインは、言語ごとのページデータをWordPress内に持つことが多いです。たとえば日本語ページがあれば、英語ページ、中国語ページも別ページとして用意していく形です。
それに対してGTranslateは、ページが見られた時に翻訳を作ります。
そのため、WordPressのデータベースが重くなりにくく、多言語展開しやすい反面、「まだ見られていないページの翻訳は存在しない」という特徴があります。
Improve Translations は何を見ているのか
Improve Translations は、WordPress内のすべての文章を直接一覧表示しているわけではありません。
見ているのは、GTranslate側で過去に生成された翻訳データです。
つまり、まだ一度も翻訳生成されていないテキストは、管理画面で探しても出てきません。
これが、「修正したい文章が見つからない」原因です。
2. 検索エンジンはいつ翻訳ページを認識するのか?
では、人が一度も見ていない多言語ページは、検索エンジンに登録されないのでしょうか。
答えは、必ずしもそうではありません。
Googleなどの検索エンジンは、クローラーと呼ばれるプログラムでサイトを巡回しています。このクローラーが多言語用URLにアクセスした時も、GTranslateはその場で翻訳を生成します。
流れとしては、だいたい次のようになります。
- Googleのクローラーが英語URLにアクセスする
- GTranslateが日本語ページを読み込む
- その場で英語版HTMLを作る
- クローラーに英語ページを返す
- Googleがその内容を持ち帰ってインデックスする
- 同時に、翻訳データがGTranslate側に保存される
つまり、人間が先に見なくても、クローラーが最初のきっかけになることはあります。
ただし、ここに注意点があります。
その時点で翻訳内容をまだ直していなければ、機械翻訳のままGoogleに登録される可能性があるということです。
3. なぜ「自動でインデックスされるから大丈夫」とは言えないのか
ここで気をつけたいのは、「Googleが勝手に取りに来るなら放っておいてもよい」と考えてしまうことです。
実際には、そう単純ではありません。
機械翻訳のまま登録されるリスク
GTranslateの翻訳精度は高いですが、すべて完璧ではありません。特に日本語は、主語の省略や文脈依存が多く、直訳っぽくなりやすいです。
たとえば、次のようなものは不自然になりやすいです。
- キャッチコピー
- 敬語表現
- 業界特有の言い回し
- 商品名・サービス名
- 微妙なニュアンスを含む案内文
もし、こうした文章を直す前にGoogleが取りに来たら、その不自然な翻訳が検索結果に出る可能性があります。
すると、
- 検索結果で違和感が出る
- クリック率が下がる
- サイトの信頼感が下がる
- 海外ユーザーが離脱しやすくなる
といった問題につながります。
そもそもクローラーが見つけてくれないこともある
もう一つの問題は、Googleが必ずすぐに多言語URLを見つけてくれるわけではないことです。
多言語URLへのリンクが弱い、サイトマップが送信されていない、サイト全体の評価がまだ高くない、という場合は、クローラーがなかなか巡回しないこともあります。
その結果、
- 多言語ページがなかなかインデックスされない
- 公開したのに海外検索に出てこない
- Improve Translations にも何も出てこない
という状態が起きます。
つまり、放置していても上手くいく場合もあるが、重要ページは自分で先回りしておく方が安全です。
4. Improve Translations に出るテキスト・出ないテキストの違い
次によくある疑問が、「どんなテキストなら一覧に出てきて、どんなテキストは出てこないのか」という点です。
比較的出やすいテキスト
次のような、ページ内に普通のテキストとして書かれているものは出やすいです。
- 投稿本文
- 固定ページ本文
- 見出し
- 通常の段落テキスト
- テーマ内のフッターやサイドバーの文字
これらは、ページを一度表示すれば比較的キャッシュされやすいです。
出にくいテキスト
一方で、次のようなものは少し見つけにくいことがあります。
- 画像のalt属性
- title属性
- フォームのプレースホルダー
- 送信ボタンの細かい文言
- 普段あまり開かれない下層ページ
これらは翻訳されることもありますが、管理画面から探しにくい場合があります。
基本的にそのままでは出ない・翻訳しにくいもの
次のようなものは、GTranslateではそのまま扱いにくいです。
- JavaScriptで後から読み込まれる文字
- 画像の中に埋め込まれた文字
- 翻訳除外設定された要素
- PDFの中の文章
つまり、GTranslateは万能ではなく、HTMLとして見えているテキストが得意だと考えると理解しやすいです。
5. 綺麗な翻訳でインデックスさせるためにやるべきこと
ここからは実務です。重要ページをできるだけ綺麗な状態でGoogleに登録させたいなら、次の流れがおすすめです。
① 多言語サイトマップをSearch Consoleに送る
まずはGoogleに、多言語URLの存在をきちんと伝えます。
GTranslateの有料プランでは、多言語用のサイトマップが用意されることがあります。これをGoogle Search Consoleに登録しておくと、クローラーが多言語ページを見つけやすくなります。
② 重要ページは自分で先に表示する
特に次のようなページは、公開後すぐに自分で対象言語に切り替えて表示しておくのがおすすめです。
- トップページ
- サービス紹介ページ
- 料金ページ
- お問い合わせページ
- 会社概要ページ
これをやることで、翻訳データを先に作れます。
③ Improve Translations で不自然な部分を直す
キャッシュが作られたら、管理画面で翻訳を確認し、重要な部分を修正します。
特に直したいのは、
- キャッチコピー
- 商品名・サービス名
- フォーム案内
- 重要なCTA
- 会社紹介文
です。
④ そのあとでGoogleに再クロールを促す
修正が終わったら、Search ConsoleのURL検査を使って、インデックス登録をリクエストすると安心です。
これで、修正後の綺麗な翻訳をGoogleに見てもらいやすくなります。
6. インラインエディタを使うと作業がかなり楽になる
GTranslateの有料プランでは、実際のページを見ながら翻訳を直せるインラインエディタが使えることがあります。
URLの後ろに ?language_edit=1 を付けて開くことで編集モードに入れるケースがあり、画面上の文章をその場で直せます。
この方法の良いところは、どの文脈でその文章が使われているかを見ながら修正できることです。
管理画面の文字一覧だけでは分かりにくいものも、実画面上だとかなり直しやすくなります。
7. 固有名詞は notranslate で守る
会社名、ブランド名、商品型番、人名など、翻訳されたくない文字があります。
そういう時は、HTML側で class="notranslate" を使うことで、翻訳対象から外せる場合があります。
たとえば、
<span class="notranslate">Tokyo Web Creation</span>
のようにしておけば、会社名が変に翻訳されるのを防ぎやすくなります。
これは地味ですが、ブランド名を守るうえでかなり大事です。
8. よくあるトラブルと考え方
Q. 翻訳を直したのに、Google検索結果がすぐ変わらない
A. これは普通です。Google側が再クロールして更新するまで時間差があります。Search Consoleから再登録を促すと早まることがあります。
Q. 新しく書いた記事が Improve Translations に出ない
A. まだその言語ページが表示されていない可能性が高いです。自分で一度その言語で開いてみてください。
Q. 問い合わせフォームの完了画面・エラーが翻訳しにくい
A. URLが変わらないタイプのフォームだと認識されにくいことがあります。可能なら、完了ページを独立URLにすると扱いやすくなります。動的に出てくるエラー文も翻訳対象外になる可能性が高いです。
Q. 一瞬日本語が見えてから翻訳される
A. 設定やキャッシュの影響で、無料版に近い挙動になっている可能性があります。サブドメイン・サブディレクトリ設定やキャッシュ除外を確認した方がよいです。
9. まとめ
GTranslateでImprove Translationsに全部のテキストが最初から出てこないのは、不具合ではなく仕組みによるものです。
ポイントをまとめると、次の通りです。
- GTranslateはページ表示時に翻訳を作る仕組み
- 表示されていないテキストは管理画面に出ない
- Googleクローラーが最初のきっかけになることもある
- ただし、機械翻訳のまま先に登録されるリスクがある
- 重要ページは自分で先に開いて修正しておく方が安全
- サイトマップ送信やURL検査も活用するとよい
多言語SEOで大事なのは、プラグインを入れることではなく、翻訳が作られる流れを理解して、重要ページを先回りして整えることです。
GTranslateは便利なツールですが、仕組みを知らないまま使うと、「なぜ一覧に出ないのか」「なぜインデックスされないのか」で迷いやすくなります。
逆に、この仕組みを理解していれば、重要ページをしっかり直したうえで海外向け検索にも活かしやすくなります。
多言語サイトをきちんと成果につなげたいなら、まずは「翻訳データはいつ作られるのか」を押さえることが出発点です。