重複コンテンツとは、異なる複数のページにおいて、内容が酷似しているコンテンツのことです。
ユーザーが読んだことのある内容と同じ情報が掲載されたコンテンツは、情報の繰り返しとなり役に立ちません。コンテンツを作成する場合は、ユーザーが求める内容かつ情報の差別化を心がける必要があります。
しかし、ECサイトやwebサイトを運営していると、1つの商材やお役立ち情報に対し、内容が重複するページがシステムで自動作成されることがあります。また、SEO対策を進める際に、ユーザーの検索意図が似ている対策キーワードがあると、掲載する情報が類似してしまうこともあります。
本ページでは重複コンテンツの定義やSEOに与える影響、さらには調べ方や重複を回避する対策方法について解説します。
また、重複コンテンツとよく似た言葉の「コピーコンテンツ」との違いについても詳しく解説していきます。
この記事でわかること
重複コンテンツとは
重複コンテンツとは、異なるURLのページにおいて、全く同じ内容もしくは、ほぼ同じ内容が存在するコンテンツのことを指します。
実際Webサイトを運営していると、意図的でなくとも重複コンテンツに該当するケースがあり、例えば以下のような場合に発生します
- wwwあり/ wwwなし/ http / httpsなど、システム的に異なるURLをもつページ
- パラメータやセッションIDを付与している動的なURLをもつページ
- PCやスマホ、タブレットなど様々なデバイスに対応するために作られたページ
- Amazonや楽天のようなECサイトにおける、商品のカラーやサイズごとに作られたページ
- 同じ製品情報が異なるURLで紹介されているページ
- noteやはてなブログなどに、自社サイトで作ったページを他サイトに寄稿したページ
まず、いつの間にか重複コンテンツができてしまっている例として、「wwwの有無」や「httpとhttps(SSL化)」が挙げられます。また、パラメータやセッションIDなどを付与した動的なURLも重複コンテンツに該当します。
また、同じ商品でカラーバリエーションがある場合やサイズバリエーションがある場合や、スマホやタブレットでサイトを閲覧するユーザー向けに、パソコンページとモバイルページを別々に作成した場合も重複コンテンツに該当します。
他にも、アクセス増加のためにnoteやはてなブログなど、メディアプラットフォームに寄稿したコンテンツも重複コンテンツになりがちです。
本ページの後半には、重複コンテンツを発見した場合の回避方法をご案内していますので、上記にお心当たりのある方は是非最後までご一読ください!
続いては、重複コンテンツよく似た言葉の「コピーコンテンツ」について詳しく解説していきます。
重複コンテンツとコピーコンテンツの違い
重複コンテンツとコピーコンテンツはよく同じ意味として捉えられている場合が多いですが、厳密には異なる概念です。
コピーコンテンツとは、他サイトやページから無断でコンテンツを盗用して作成したコンテンツのことです。
これは、意図的に他者の文章や情報をコピーし、自サイトのオリジナルコンテンツとして掲載する行為であり、著作権侵害や不正行為に当たることが多いです。
Googleは、検索品質を維持するために「スパムに関するポリシー」を公開しており、その中でコピーコンテンツについて、「スクレイピング」という項目で取り上げています。
本ページでは、スクレイピング(=コピーコンテンツ)に該当する例をご紹介します。
【スクレイピング】
- 他のサイトのコンテンツを、元のソースを引用もせず、独自のコンテンツや価値を加えずに転載する
- 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えたうえで転載する
- ユーザーに対してなんらかの形で独自のメリットを提供することなく、他のサイトからのコンテンツ フィードをそのまま掲載する
- ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだり編集したりしているだけのサイトを作成する
引用元:https://developers.google.com/search/docs/essentials/spam-policies?hl=ja#scraped-content
このように、「他サイトのコンテンツを許可なくコピーし、それを独自のものとして掲載する行為」をスパムとみなすことが明記されています。
つまり、コピーコンテンツはスパムに該当する行為であり、スパムと判定されたら、検索順位が大幅に下がるだけでなく、最悪の場合は検索結果に表示されなくなる可能性もあります。
SEO対策を進めるときに、ユーザーの検索意図を把握したり、言い回しや表現を参考にする際、上位表示している外部サイトを調査することは重要ですが、外部サイトのコンテンツの書き方や言い回し、内容を意図的にコピーすることはNGということを押さえておきましょう。
コピーコンテンツとして判断されないためにも、コンテンツを作成した後にコピー率をチェックし、一致率が高い場合は一致してしまっている箇所を変更してからページを公開しましょう。
一方で、自サイトのコンテンツがコピーされている場合もコピーコンテンツと見なされる可能性があります。
このような場合には、該当サイトへの削除依頼やGoogleへの申告するようにしましょう。
重複コンテンツとコピーコンテンツの違い | ||
---|---|---|
項目 | 重複コンテンツ | コピーコンテンツ |
定義 | 同じサイト内または異なるURL間で、ほぼ同じ内容が存在するコンテンツ | 他のサイトやページから無断でコピーしたコンテンツ |
意図 | 意図せず発生することが多い | 故意に他のサイトのコンテンツを盗用する |
SEOへの影響 | SEO評価が分散し、検索順位が下がる可能性がある | Googleのスパムポリシーに違反し、ペナルティを受ける可能性がある |
主な原因 | サイトの仕様やCMSの設定によるURLの重複、類似ページの作成 | 他のWebサイトのコンテンツをコピー&ペーストして流用する |
対処法 | canonicalタグやnoindex、リライトでの差別化など ※詳しくは本ページの後半で解説しています。 |
該当サイトへの削除依頼やGoogleへの申告 |
続いて、自社サイト内に重複コンテンツがあった場合、SEO評価にどのような影響を及ぼすのか確認しましょう。
重複コンテンツが及ぼすSEOへの影響
ここまで、重複コンテンツとコピーコンテンツの違いをご説明しました。
続いては重複コンテンツがある場合に、SEO対策にどのような影響があるのかご紹介します。
- コンテンツ評価や被リンク評価が分散する
- クローラビリティが悪化する
- UX(ユーザーエクスペリエンス)が低下する
それぞれ詳しく解説します。
コンテンツ評価や被リンク評価が分散する
1つ目は、コンテンツの評価が分散してしまうことです。
Googleは、サイト内にある重複コンテンツを別々のコンテンツとして比較し、「どのコンテンツがユーザーにとって最適か」を考え、評価します。また、外部サイトからのリンクも同様に、内容が同じAというコンテンツにリンクが貼られる場合もあれば、Bというコンテンツにリンクが貼られてしまう場合があります。
このように、重複コンテンツは、Googleからの評価が分散してしまうだけでなく、外部サイトからのリンクなどによる評価も分散してしまいます。評価の分散が起きると最悪の場合、どのコンテンツも評価されず、検索結果にも表示されないなんてことにもなりかねません。
クローラビリティが悪化する
2つ目は、クローラビリティの悪化です。
検索エンジンは、クローラーと呼ばれるロボットを巡回させ、URLごとに各Webサイトの情報を収集しています。そのため、サイト内に重複コンテンツがある場合、クローラーは同じ情報を何度も繰り返し収集することになってしまいます。
クローラーは、クロールバジェットという1サイトあたりに対するクロールできるページ数の上限を持っています。それにより、重複コンテンツがあることで、クロールバジェットを浪費してしまうことになり、本来クロールされるべきページがクローリングされないという状態になってしまいます。
クローラビリティが悪化すると、インデックス登録されるまでの時間が長くなったり、検索順位が上がらなかったりしてしまうことも少なくありません。
UX(ユーザーエクスペリエンス)が低下する
重複コンテンツがあると、ユーザーは他のページで既に読んだ情報を繰り返し見るという不便性につながります。
また、求めている情報を探している最中に同じようなコンテンツが表示されると、サイトの価値に疑問を持ち、信頼性の低下につながることも考えられます。
サイトのUX(ユーザーエクスペリエンス)が低下すると、訪問者の満足度が下がり、直帰率の増加や回遊率の低下につながります。結果的に、検索エンジンの評価も悪化し、SEOの観点からも大きなデメリットとなります。
重複コンテンツのチェック方法
ここまで重複コンテンツによるSEOへの影響について解説してきました。
本ページを読んでいる方も、自社サイトにどのくらいの重複コンテンツがあるか、気になるのではないでしょうか。ここからは、重複コンテンツの有無を調べる方法についてご紹介します。
Google Search Console(サーチコンソール)を使って調べる
自社サイト内の重複コンテンツは、Google Search Consoleを使って確認できます。
サーチコンソールにログインし、メニューの「インデックス作成」から「ページ」を選択すると、サイト内に重複しているコンテンツがあれば表示されます。
是非、チェックしておきましょう。
チェックツールを使う
新しいコンテンツを作成し、参考にした外部サイトと内容が重複していないか、確認したいときには下記のようなチェックツールを試してみましょう。
sujiko.jp
引用元:http://sujiko.jp/
sujiko.jpは、作成したコンテンツと、作成にあたり参照したコンテンツや、表現が類似しているコンテンツがどれくらい重複しているか、確認できる無料ツールです。2つのURLをそれぞれの窓に入力し、判定すると文章や構成(HTML)などの類似点を確認できます。
あらかじめ似ているかも、と思われるページがあった場合のチェックに最適です。ただし、1日の使用上限が5回までとなっているのでご注意ください。
CopyContentDetector
引用元:https://ccd.cloud/
CopyContentDetectorは、作成するコンテンツが、その他のサイトと重複していないか、確認できる無料ツールです。
新しいコンテンツに記載するテキストを貼り付け、「規約に同意してコピペチェックする」をクリックします。重複している内容があれば表示されるので、類義語での置き換えなどの対策をしましょう。
EmmaTools
引用元:https://emma.tools/
EmmaToolsは、当社が運営するAI×SEOライティングツールです。
作成したコンテンツに対し、「コピー率チェック」機能を利用することで、Web上に公開されているコンテンツとのコピー率を確認することができます。
また、独自のプロンプトと独自のロジックで高品質なSEOコンテンツが短時間で作成することができます。
是非、これらのツールを駆使して重複コンテンツのチェックを行っていきましょう。
既に重複コンテンツがあった場合の対策とこれから回避する方法
ここまでに紹介した重複コンテンツの確認方法のいずれかで重複コンテンツがあった場合、適切な対策があります。
また、現時点では重複コンテンツがなかった場合でも、これから作成するコンテンツが重複しないように回避する方法を解説します。
- canonicalタグを使う
- 301リダイレクトを行う
- レスポンシブデザインに対応する
- リライトで差別化する
- ページを削除する
- noindexタグの設置
- 定型文の使用を避ける
- 該当サイトへの削除依頼やGoogleへの申告
canonicalタグを使う
まず、既にサイト内で重複してしまっているコンテンツがあった場合の対処法1つ目は、canonicalタグの使用です。
URL表記が異なるが、同じデザインや内容のページを表示させる場合は、canonicalタグを使ってURLの正規化を行います。
www.の有無や、httpまたはhttps、ECサイトで商品のバリエーションを紹介するページはcanoicalタグで1つのURLへ正規化しておきましょう。
canonicalタグの使い方については『【必読】canonical(カノニカル)タグとは?意味や書き方、SEOにおける必要性を解説』で紹介しています、ぜひご参照ください。
301リダイレクトを行う
2つ目の対処法は、301リダイレクトの設定です。
上記で紹介しているURL表記の違いによる重複コンテンツ以外で掲載している内容が似ているかつ情報が薄くユーザーの役にあまり立ちそうにないページがあった場合は、他のページへ転送させるのも1つの対策方法です。
301リダイレクトをかけ、関連しているページへ転送することで重複コンテンツと判断されるリスクを避け、自社サイトの評価が下がることを防げます。
また、301リダイレクトを設定する際は、管理リストを作って転送元および転送先ページがどこになっているか、確認できるようにしておきましょう。
301リダイレクトの設定方法を詳しく知りたい方のため『301リダイレクトとは?必要な理由や設定および確認方法を解説』を用意していますのでぜひご覧ください。
レスポンシブデザインに対応する
3つ目の対処法は、レスポンシブデザインを採用することです。
レスポンシブデザインとは、Webサイトを閲覧する端末の画面サイズに応じて、デザインやレイアウトを最適化する仕組みのことを指します。例えば、パソコン、スマートフォン、タブレットなど、異なるデバイスで同じURLのページを適切に表示できるようにすることで、デバイスごとに異なるURLを生成する必要がなくなり、重複コンテンツを回避できます。
また、レスポンシブデザインを導入することで、サイトの情報を1つのページで一元管理できるため、更新作業の効率が向上するメリットもあります。
さらに、Googleはレスポンシブデザインを推奨しており、適切に対応することで検索エンジンの評価が向上しやすくなる点も見逃せません。Webサイトの管理負担を軽減しつつ、SEOにも良い影響を与えるため、重複コンテンツ対策として積極的に取り入れるべき方法の一つです。
レスポンシブデザインについては、『レスポンシブデザインとは?端末サイズに合わせた見栄えの良いサイトを目指す』で詳しく解説しています、ご参照ください。
リライトで差別化する
4つ目の対処法は、リライトによってコンテンツの内容に差別化を図ることです。
SEOにおけるリライトとは、単に文章の表現を変更するだけでなく、対策キーワードを見直し、ユーザーのニーズに沿った情報を追加することを意味します。これにより、検索エンジンからの評価を高めるだけでなく、ユーザーにとって価値のある情報を提供できるようになります。
例えば、「SEO対策」について 「初心者向けに基礎知識を解説するページ」と「上級者向けにSEO対策のトレンドを解説するページ」のように、異なる内容で記事をリライトすれば、自然と差別化されます。
このように、対策キーワードやユーザーニーズを適切に設定し、それぞれに応じた情報を盛り込むことで、重複コンテンツのリスクを回避できます。
SEOに効果的なリライトについては、『SEOで効果的なリライト方法とは?検索順位を上げるコツや注意点を解説』で詳しく解説しています、ご参照ください。
ページを削除する
5つ目の対処法は、重複するコンテンツの削除です。
最終的な手段として、コンテンツを作成したものの、ユーザーの検索意図にマッチせず、情報が薄い場合や今後リライトする予定がない場合は削除するのも選択肢の1つです。
ただし、注意点としてページを削除する前に外部サイトからの被リンクや内部リンクが貼られていないかチェックしておきましょう。削除しようとしているページにリンクが貼られているとSEO評価が下がります。削除前に必ずリンクを受けていないか確認する必要があります。
また、ページを削除する場合は、Googleにインデックスされている情報も削除しておきましょう。Google Search Consoleから、該当するページのインデックス情報の削除依頼を行うことができます。
noindexタグの設置
6つ目の対処法は、noindexタグの設置です。
noindexタグは、検索エンジンに対して特定のページをインデックスしないよう指示するためのメタタグです。検索エンジンがWebべージを認識する流れとしては、まず「クロール(クローリング)」によってページの情報が収集され、その後「インデックス登録(インデクシング)」を経て、最終的に「順位付け(ランキング)」が行われます。
- クロール(クローリング)
- インデックス登録(インデクシング)
- 順位付け(ランキング)
このうち、「インデックス登録」を拒否するために使用されるのがnoindexタグです。
このタグを設置すると、該当ページは検索エンジンのデータベースに登録されず、検索結果に表示されなくなります。そのため、重複コンテンツとして認識されてしまうページにnoindexタグを設定することで、検索エンジンに存在を認識させないことが可能です。
noindexについては、『noindexタグとは?正しい使い方や設定する際の注意点について』で詳しく解説しています、ご参照ください。
定型文の使用を避ける
7つ目の対処法は、定型文の使用を避けることです。
よく、自社サイト内の他のページで使った画像や文章、書き方などをそのまま使い回すことも考えられます。しかし、本来コンテンツごとにユーザーの検索意図や求められている情報は異なるため、適切なコンテンツ作成ではありません。
コンテンツを作成する際、自社や自社商材について定型文を作らないようにします。
コンテンツを作成する際は、ページそれぞれで想定される読者に寄り添った表現を使うようにしましょう。
重複コンテンツに関するFAQ
最後に、多くの方が疑問に思う重複コンテンツについてFAQ形式でご紹介します。
重複コンテンツに基準はありますか?
重複コンテンツがどの程度類似していると検索エンジンに重複と判断されるのかの基準について、Googleは明確な基準を公表していません。
そのため、重複コンテンツかどうかはご自身でチェックする必要があり、本ページでご紹介した調べ方にて確認しましょう。
重複コンテンツはSEOペナルティになりますか?
重複コンテンツ自体は、SEOのペナルティにはなりません。SEO対策を進める中で、意図せず重複コンテンツが発生することはよくあります。多くのWebサイトで自然に発生するものであり、Googleもこれを問題視してペナルティを課す可能性は低いと考えられます。
一方で、コピーコンテンツはGoogleのスパムポリシーに違反する行為であり、SEOペナルティの対象となります。したがって、重複コンテンツとコピーコンテンツは異なるものです。
もし今現在ペナルティを受けているか有無を確認したい際は、Search Console(サーチコンソール)を利用しましょう。
サーチコンソールにログインしたら、メニューから「セキュリティと手動による対策」を選び、その中の「手動による対策」を選びます。
「問題が検出されませんでした」と表示されたら大丈夫です。
AIで作ると重複コンテンツになりますか?
AIを活用して作成したコンテンツを何も修正せずに公開した場合には、重複コンテンツになり得る可能性があります。
AIはWeb上の情報をもとに文章を生成するため、情報源となる他のコンテンツと類似した表現や構成になる可能性があります。特に、一般的なトピックについてAIが作成したコンテンツは、多くのサイトと似通ったものになりやすく、検索エンジンに重複コンテンツと判断されるリスクがあるのです。
単にAIが作成した文章をそのまま掲載するのではなく、人間の手で編集を加えることが重要です。具体的には、AIが生成した文章に独自の体験談や事例を加えたり、最新の情報を反映させたりすることで、重複コンテンツの回避ができます。
AIはあくまで補助ツールとして活用しながら、人間の視点で最適化することが重要です。
robots.txtは重複コンテンツの回避に有効ですか?
robots.txtを使用して重複コンテンツを回避する方法は適切ではありません。
robots.txtは、検索エンジンのクローラーに対して特定のページへのアクセスを制限するためのテキストファイルです。そのため、robots.txtでクローラーのアクセスを制限すると、検索エンジンはそのページの内容を読み取ることができなくなり、それが重複コンテンツであるかどうかを判断できなくなります。
また、robots.txtはクローラーを完全に制御するものではなく、設定していても検索エンジンが意図せずページを発見することがあります。つまり、robots.txtでクロールを制限したとしても、検索結果にURLが表示される可能性があり、結果的に重複コンテンツの問題を解決することにはつながりません。
robots.txtについては、『noindexタグとは?正しい使い方や設定する際の注意点について』で詳しく解説しています、ご参照ください。
まとめ
本記事では、重複コンテンツについて、定義やSEOへの影響、回避の方法について解説しました。また、重複コンテンツとよく似た言葉のコピーコンテンツについても触れ、SEOへの影響度合を知ることが出来たと思います。
改めて、重複コンテンツは自然に生じるものなのでペナルティにはなりませんが、コピーコンテンツは悪意のある行為としてペナルティに該当してしまいます。
ペナルティにならないとはいえ、重複コンテンツをそのままにしておくとSEO評価が分散してしまい、クローラビリティも悪化してしまうため、canonicalタグや301リダイレクト、リライトを使って回避していきましょう。
最後に、SEO対策を成功に導くために、高品質なSEOコンテンツが作成できるツールをご紹介します。
EmmaToolsは、SEOに゙特化したAIライティングツールです。検索エンジンで上位表示している他社サイトを自動で分析し、コンテンツ内で使うべきキーワードと、その重要度を表示してくれます。
さらに、独自のアルゴリズムでコピー率チェックができるため、重複コンテンツを回避したライティングが可能になります。
これから質の高いコンテンツの作成に取り組んでいきたい方、もしくは一度書いたコンテンツが上位表示せずにお悩みの方は、無料トライアルを実施しているので、ぜひチェックしてみてください。