サイト運営をしていると、検索エンジンへのインデックスが必要ない、またはインデックスさせたくないコンテンツが出てきます。新しいコンテンツの中にnoindexタグを記述すれば、インデックスされなくなります。
このページでは、どのようなページにnoindexタグを入れるべきなのか、5つのパターンと使い方を紹介しています。
noindexタグと似て非なるもの、robots.txtファイルとの違いについても解説します。
それぞれを正しく使い、ユーザーに役立つ、使いやすいWebサイト作りを目指しましょう。
noindexタグとは
noindexタグとは、検索エンジンのデータベースにコンテンツ情報をインデックスさせたくない場合に記述するメタタグです。
検索エンジンは、インデックスしているデータの中から、アルゴリズムを元に検索クエリに最適なコンテンツを選び、検索結果画面に示させます。
新しいコンテンツを作成する際にnoindexタグを記述すると、クローラーが訪れて情報収集しても、検索エンジンのデータベースには登録されないため、検索結果画面に出てきません。また、すでにインデックスされているページにnoindexタグを記述した場合は、検索エンジンのデータベース上での情報が更新されず、クローラーが読み込んだ時点でインデックスされた情報が削除されます。
ただし、noindexタグを設置しても、内部リンクや外部サイトからの被リンクが設定されていれば、ユーザーはnoindexタグが記述されたページに辿り着くことができます。その他にも、お気に入り登録をしている場合や、ページのURLを知っていて直接入力をすれば、noindex設定されたページへのアクセスは可能です。
つまり、noindexタグを設定しても、ユーザーは検索エンジンを利用しない方法でコンテンツにたどり着くことができます。
SEO対策にも使われるnoindexタグですが、似たような機能を持つnofollowタグやrobots.txtファイルとは何が違うのでしょうか。
noindexとnofollowとの違い
noindex、nofollowは2つともメタタグであり、HTMLファイルに記述しますが、それぞれ使用目的が異なります。
- noindex このタグが記述されているぺージは検索エンジンにインデックス(登録)されません
- nofollow このタグが記述されているページからは検索エンジンのクローラーが移動しません
noindexタグを記述する目的は、検索エンジンにコンテンツをインデックスさせないためです。
一方、nofollowタグを設置するのは、リンク先へクローラーを移動させたくない場合です。
外部サイトから自社サイトへのリンクを設置する場合にも、nofollowタグを使うことがあります(プレスリリースなどの有料サイトからのリンクに使用することで、Googleガイドラインにあるスパムリンクとして判断されるリスクを減らせます)。nofollowタグは、リンク先ページと関わりを持ちたくない(持たせたくない)場合に使うタグでもあります。
nofollowタグはクローラーの動きは制御できるものの、ユーザーに影響はなく、リンクを使ってリンク先へ遷移できます。
nofollowタグについて詳しく知っておきたい方は『nofollow属性とは?SEOにおける役割や設定方法について』をご覧ください。
robots.txtとの違いと使い分け
検索エンジンへのインデックスを避ける方法には、他にもクローラーを制限するrobots.txtを設定することでも可能です。
そもそも、クローラーがコンテンツへアクセスし、ファイルの情報を収集できなければ、検索エンジンのデータベースに情報は届きません。
ただし、robots.txtファイルを使いインデックスを避ける場合は、「すでに検索エンジンにインデックスされているページ情報」は検索結果画面に表示されることを覚えておきましょう。
すでにインデックスされたコンテンツを検索結果画面に表示させたくない場合は、ページ内にnoindexタグを入力し、Google Search Consoleの「削除」からURLを入力してインデックス情報を消去する必要があります。
robots.txtの特徴や使い方は『noindexタグとは?正しい使い方や設定する際の注意点について』でご確認いただけます。
noindexタグを使うべき5つのパターン
あえて自社サイトのコンテンツを検索エンジンにインデックスさせず、検索結果画面に表示させないためのnoindexタグを設置する理由は、何が考えられるでしょうか。
以下の5つのパターンをご紹介します。
1.内容が重複・類似しているコンテンツ
1つ目は、自社サイト内に重複コンテンツがある場合です。
サーバーやシステムの影響でwww.の有無や、SSL化によるhttpとhttpsの両方のURLが存在する場合や、サイト内にコンテンツを作り続けていると、ページ内容が意図せず類似・重複するものが生成されることがあります。
出来る限り同じような表現の使用や使いまわしを避けても、ページ数が多く、どうしても内容が似てしまう場合は、noindexタグを使いましょう。
重複ページはコピーコンテンツとして判断される可能性があるため、そのリスクを避けられます。
重複コンテンツについて詳しく知りたい方は『重複コンテンツとは?基準や調べ方、回避する対策方法について』をご参照ください。
2.情報量が少なく低品質なコンテンツ
2つ目は、コンテンツ内容が薄くユーザーの役に立たない場合です。
ページの内容が薄く、情報量が少ないコンテンツはユーザーの役に立たず、検索エンジンから低評価を受けてしまう可能性があります。
ページだけでなく、サイト全体の評価を下げることにつながる可能性もあるため、noindexタグを使用し、あえて評価対象から外しておきましょう。
3.エラーページやサンクスページなど
3つ目は、内容が壊れているエラーページや、ただ挨拶だけが記述されたコンテンツです。
ページを作成したものの、フレームが崩れていて表示が乱れるページや、エラーが出てしまうページはnoindexタグを入れてインデックスされないよう対策をしておきます。修正が完了したら、noindexタグを外し、クローラーをリクエストしましょう。
また、ユーザーが資料請求や、問い合わせをした後に表示されるサンクスページも、ユーザーの役に立つコンテンツではなく、ただ挨拶のためだけのページになってしまうため、評価されないようnoindexタグを入れ、インデックスさせないよう対策しましょう。
4.HTMLサイトマップページ
4つ目は、HTMLサイトマップです。
サイトにアクセスしたユーザーが、サイト内のページ構成を把握し、目的のページにたどり着きやすくなるHTMLサイトマップページを作成した場合も、noindexタグを入れ、インデックスされないようにしておいた方が良いです。
ユーザーのためのHTMLサイトマップページは、サイト内すべてのページへの内部リンクが記載し、ユーザーが求めるページを見つけて移動しやすくするために作成するもので、検索による流入を目的としていないのでnoindexタグを入れておきましょう。
5.インデックスさせたくないページ
5つ目は、検索エンジンにインデックスさせたくないページに設置します。
例えば、インターネット上でどのように表示されるかを確認するために作成したテストページや、自社内限定または契約者限定などの非公開情報などを閲覧できるページが該当します。
テストページであれば、非公開設定やページの削除で対応可能ですが、一部のユーザー限定の情報をnoindexタグなしに公開してしまうと、一般のユーザーも情報を見れるようになってしまいます。検索結果に表示されると好ましくないページは、予めnoindexタグを使い、インデックスされないように対策しておきましょう。
noindexの設定方法について
サイト内にインデックスさせたくないページを見つけたときに、noindexタグを正しく使うにはどのように設置すれば良いのでしょうか。noindexタグの正しい使用方法について解説します。
HTMLファイルに直接タグを記述する場合
インデックスさせたくないページのHTMLファイルに直接、noindexタグを記述する場合は、以下をコピーしてヘッダー部分(<head>~</head>
)に以下を貼り付けます。
<meta name="robots" content="noindex"/>
name="robots"の部分をname="googlebot"に書き換えると、Googleからのクローラーのみを対象に変更できます(その他のクローラーも名称が分かれば指定可能です)。
WordPressの場合
CMS(Contents Management System)にWordPressを使っている場合、利用しているテーマ毎にメタタグの設定方法が異なります。
固定・投稿ページそれぞれに「検索エンジンにインデックスされないようにする」、noindexタグを入れる、などの選択肢があれば、それらをチェックすればOKです。
それらが見当たらないテーマを利用している場合は、プラグインのAll in one SEO Packを導入すると、ページ単位でno indexタグを入れるかどうか指定できます。
noindexを使用する上での注意点
noindexタグは使用する上で気を付けなければならない注意点もあります。
以下、noindexタグの使用時に避けるべきポイントをご紹介します。
過度な使用はしない
noindexタグを使えば、新しいページであれば検索結果画面に表示されず、すでにインデックスされたページは情報更新されません。
見られたくないページの有効なSEO対策なのですが、noindexタグの乱用には注意しましょう。本来、ユーザーのアクセス数を増やせるはずのページであるにもかかわらず、noindexを使ってしまうことで検索エンジンにインデックスさせないのはもったいないです。
検索順位を上げることが出来ず、アクセス数が増えないページだからと、インデックスを消去してnoindexタグを入れるのもNGです。対策キーワードでは上位が取れていなくても、他の関連キーワードでアクセス数につながっている可能性もあります。
noindexを設定する前に、Google Search Consoleを使い、どのような検索クエリで順位が取れているかを確認してみましょう。
noindexタグとrobots.txtが重複しないように注意する
検索エンジンへのインデックス調整のため、「robots.txtによるクローラー制御」、「noindexタグを使ったインデックスコントロール」対策をする場合、同一ページにrobots.txtとnoindex、2つの対策が重複しないよう注意しましょう。
noindexタグが入ったページをrobots.txtで指定すると、クローラーが回ってこないため、noindexタグ情報がそのものが読み込まれません。noindexタグが無効なまま、検索エンジンが認識できないために検索結果に表示され続けてしまいます。
また、サイトを設置してあるサーバーへのアクセス権を持っていなくても、noindexタグはCMS(WordPressなど)を使ってページそのものに入力し、インデックス制御ができることを覚えておきましょう。
まとめ
noindexタグは、検索エンジンのデータベースにコンテンツ情報をインデックスをさせないよう制御できるため、低品質な記事やエラーが出ているコンテンツなどに使います。
SEO対策にもつながるnoindexタグですが、使い過ぎにはくれぐれも注意しましょう。作成したコンテンツが上位表示されない場合、noindexタグを入れてしまうのではなく、Search Consoleを使って問題点を見つけ、改善させましょう。
ページの修正や、新規ページをテストするためにnoindexタグを設定したら、更新後の消し忘れがないよう注意してください。
そのほか、SEOで重要なタグについては以下のページでご紹介していますので、ご確認ください。