重複コンテンツとは、自社サイトおよび外部サイトに既にあるコンテンツと内容が酷似しているコンテンツのことです。(コピーコンテンツとも言われています。)
ユーザーが他のサイトで読んだことのある内容と同じ情報が掲載されたコンテンツは、情報の繰り返しとなり役に立ちません。コンテンツを作成する場合は、ユーザーが求める内容かつ独自性のある情報を掲載するよう心がける必要があります。
しかし、ECサイトを運営していると、1つの商材に対し、カラーバリエーション毎に内容が同じ重複ページがシステムで自動作成されることがあります。また、SEO対策を進める際に、ユーザーの検索意図が似ている対策キーワードがあると、掲載する情報が類似してしまうこともあります。
コピーコンテンツとも呼ばれる重複コンテンツは、SEOにどのような影響を与えるのでしょうか。重複コンテンツとみなされる基準や調べ方、重複を回避する対策方法について解説します。
この記事でわかること
重複コンテンツとは
重複コンテンツについて、Googleは以下のように述べています。
「ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じ、または非常によく似たコンテンツのブロック」
引用元:Google検索セントラル、重複コンテンツの作成を避けるより
重複コンテンツがあると、ユーザーは他のページで既に読んだ情報を繰り返し見るという不便性につながります。Googleは、意図的な重複コンテンツに対し、インデックス登録やランキングで適切な調整を行い、該当するサイトのランキングを下げ、インデックス削除を行うとしています。
続いて。自社サイト内に重複コンテンツがあった場合、SEO評価にどのような影響を及ぼすのか確認しましょう。
重複コンテンツが及ぼすサイトへの影響
意図的ではないものの、自社サイト内に重複コンテンツがある場合、以下2つの影響が考えられます。
- コンテンツ評価の分散
- クローラビリティの悪化
それぞれ詳しく解説します。
コンテンツの評価が分散する
1つ目は、コンテンツの評価が分散してしまうことです。
Googleは、サイト内にある重複コンテンツを別々のコンテンツとして比較し、「どのコンテンツがユーザーにとって最適か」を考え、評価します。また、外部サイトからのリンクも同様に、内容が同じAというコンテンツにリンクが貼られる場合もあれば、Bというコンテンツにリンクが貼られてしまう場合があります。
このように、重複コンテンツは、Googleからの評価が分散してしまうだけでなく、外部サイトからのリンクなどによる評価も分散してしまいます。評価の分散が起きると最悪の場合、どのコンテンツも評価されず、検索結果にも表示されないなんてことにもなりかねません。
クローラビリティが悪化する
2つ目は、クローラビリティの悪化です。
検索エンジンは、クローラーと呼ばれるロボットを巡回させ、URLごとに各Webサイトの情報を収集しています。そのため、サイト内に重複コンテンツがある場合、クローラーは同じ情報を何度も繰り返し収集することになってしまいます。
クローラーは、クロールバジェットという1サイトあたりに対するクロールできるページ数の上限を持っています。それにより、重複コンテンツがあることで、クロールバジェットを浪費してしまうことになり、本来クロールされるべきページがクローリングされないという状態になってしまいます。
クローラビリティが悪化すると、インデックス登録されるまでの時間が長くなったり、検索順位が上がらなかったりしてしまうことも少なくありません。
ペナルティを受ける危険性
重複コンテンツが及ぼすサイトへの影響の3つ目は、ペナルティを受ける危険性です。
コンテンツSEOを進めていると意図的ではないにしても内容が似通ってしまうものが出てきます。また、上位表示している外部サイトを参照しながら、情報収集や記事作成をしていると、気づかないうちに同じ表現を使っていることがあります。
重複コンテンツには、意図的ではなかったとしてもこうしたコピーコンテンツになってしまったものも含まれます。Googleにコピーコンテンツだと判断されると、ペナルティを受け、検索順位を大きく下がるだけでなく、インデックスから削除されることもあります。
内容が似通っているページを見つけたら、表現の変更や独自性のある内容へ変更、あるいはページの削除を行いましょう。
Googleが重複コンテンツだと判断する基準とは?
ここまで、重複コンテンツとは何なのか、重複コンテンツが及ぼすサイトへの影響について解説しました。
では、どのようなコンテンツがGoogleから重複コンテンツ(コピーコンテンツ)としてみなされてしまうのでしょうか。
自社サイト内で内容が類似しているコンテンツ
自社サイト内で重複コンテンツになりえるものは、以下のものが考えられます。
- wwwあり/ wwwなし/ http / httpsなど、システム的に異なるURLをもつページ
- パラメータやセッションIDを付与している動的なURLをもつページ
- 様々なデバイスに対応するために作られたページ
- Amazonや楽天のようなECサイトにおける、商品のカラーやサイズごとに作られたページ
まず、いつの間にか重複コンテンツができてしまっている例として、「wwwの有無」や「httpとhttps(SSL化)」が挙げられます。また、パラメータやセッションIDなどを付与した動的なURLも重複コンテンツに該当します。
これらの、URL表記が異なるもののデザインや内容が全く同じコンテンツは、301リダイレクトやcanonicalタグの設定ができていなければ、別々のコンテンツと認識され、結果重複コンテンツに該当してしまいます。
他にも、同じ商品でカラーバリエーションがある場合やサイズバリエーションがある場合、スマホやタブレットでサイトを閲覧するユーザー向けに、パソコンページとモバイルページを別々に作成した場合も重複コンテンツに該当します。
外部サイトのコンテンツと酷似している
外部サイトのコンテンツのコピーと判断されてしまうのは、以下のような点に該当します。
- 引用元を記載せず、独自の情報を加えずに転載している
- 語句を類義語に置き換えたような若干の修正のみで転載している
- ユーザーにメリットがない他サイトのコンテンツを掲載している
- ユーザーに付加価値を提供することなく他サイトの動画や画像などを転載している
SEO対策を進める際にユーザーの検索意図を把握するため、上位表示している外部サイトを調査することは重要です。また、1つの物事を説明する際に、他社サイトの言い回しや表現を参考にすることもあるかと思います。
しかし、自社サイトのコンテンツを作成する際に外部サイトのコンテンツの書き方や言い回し、内容を意図的にコピーすることはNGです。また、無意識のうちに、外部サイトと似たような表現になってしまうこともあります。
このような、意図的ではない表現の類似だとしても、Googleからはコピーコンテンツとして判断されてしまい、ペナルティを受ける可能性が高くなります。
コピーコンテンツとして判断されないためにも、コンテンツを作成した後にコピー率をチェックし、一致率が高い場合は一致してしまっている箇所を変更してからページを公開しましょう。
重複コンテンツのチェック方法
重複コンテンツによるSEOへの影響と、重複コンテンツとみなされる基準について解説してきました。
ここまでくると、自社サイトにどのくらいの重複コンテンツがあるか、気になるのではないでしょうか。ここからは、重複コンテンツの有無を調べる方法についてご紹介します。
Google Search Consoleを使って調べる
自社サイト内の重複コンテンツは、Google Search Consoleを使って確認できます。
ログインしたら、メニューから「セキュリティと手動による対策」を選び、その中の「手動による対策」を選びます。自社サイト内に重複コンテンツと判断されたものがあれば、表示されるので内容を確認しましょう。
重複コンテンツだと判断されているコンテンツがなければ、「問題が検出されませんでした」と表示されます。
また、重複コンテンツの中には上記のように手動ペナルティの対象ではないものもあります。
メニューの「インデックス作成」から「ページ」を選択すると、サイト内に重複しているコンテンツがあれば表示されます。
こちらのチェックもしておきましょう。
チェックツールを使う
新しいコンテンツを作成し、参考にした外部サイトと内容が重複していないか、確認したいときには下記のようなチェックツールを試してみましょう。
sujiko.jp
引用元:http://sujiko.jp/
sujiko.jpは、作成したコンテンツと、作成にあたり参照したコンテンツや、表現が類似しているコンテンツがどれくらい重複しているか、確認できる無料ツールです。2つのURLをそれぞれの窓に入力し、判定すると文章や構成(HTML)などの類似点を確認できます。
あらかじめ似ているかも、と思われるページがあった場合のチェックに最適です。ただし、1日の使用上限が5回までとなっているのでご注意ください。
CopyContentDetector
引用元:https://ccd.cloud/
CopyContentDetectorは、作成するコンテンツが、その他のサイトと重複していないか、確認できる無料ツールです。
新しいコンテンツに記載するテキストを貼り付け、「規約に同意してコピペチェックする」をクリックします。重複している内容があれば表示されるので、類義語での置き換えなどの対策をしましょう。
既に重複コンテンツがあった場合の対策とこれから回避する方法
ここまでに紹介した重複コンテンツの確認方法のいずれかで重複コンテンツがあった場合、適切な対策があります。
また、現時点では重複コンテンツがなかった場合でも、これから作成するコンテンツが重複しないように回避する方法を解説します。
canonicalタグを使う
まず、既にサイト内で重複してしまっているコンテンツがあった場合の対処法1つ目は、canonicalタグの使用です。
URL表記が異なるが、同じデザインや内容のページを表示させる場合は、canonicalタグを使ってURLの正規化を行います。
www.の有無や、httpまたはhttps、ECサイトで商品のバリエーションを紹介するページはcanoicalタグで1つのURLへ正規化しておきましょう。
canonicalタグの使い方については『【必読】canonical(カノニカル)タグとは?意味や書き方、SEOにおける必要性を解説』で紹介しています、ぜひご参照ください。
301リダイレクトを行う
2つ目の対処法は、301リダイレクトの設定です。
上記で紹介しているURL表記の違いによる重複コンテンツ以外で掲載している内容が似ているかつ情報が薄くユーザーの役にあまり立ちそうにないページがあった場合は、他のページへ転送させるのも1つの対策方法です。
robots.txtファイルを作成し、301リダイレクトをかけ、関連しているページへ転送しましょう。コピーコンテンツと判断されてペナルティを受けるリスクを避け、自社サイトの評価が下がることを防げます。
301リダイレクトを設定する際は、管理リストを作って転送元および転送先ページがどこになっているか、確認できるようにしておきましょう。
301リダイレクトの設定方法を詳しく知りたい方のため『301リダイレクトとは?必要な理由や設定および確認方法を解説』を用意していますのでぜひご覧ください。
ページを削除する
3つ目の対処法は、重複するコンテンツの削除です。
最終的な手段として、コンテンツを作成したものの、ユーザーの検索意図にマッチせず、情報が薄い場合は削除するのも選択肢の1つです。
ただし、注意点としてページを削除する前に外部サイトからの被リンクや内部リンクが貼られていないかチェックしておきましょう。削除しようとしているページにリンクが貼られているとSEO評価が下がります。削除前に必ずリンクを受けていないか確認する必要があります。
また、ページを削除する場合は、Googleにインデックスされている情報も削除しておきましょう。Google Search Consoleの削除ツールから、該当するページのインデックス情報の削除依頼を行うことができます。
続いて、重複コンテンツを避けるための回避策をご紹介します。
定型文の使用を避ける
1つ目の回避策は、定型文の使用を避けることです。
コンテンツを作成する際、自社や自社商材について定型文を作らないようにします。
よく、自社サイト内の他のページで使った画像や文章、書き方などをそのまま使い回すことも考えられます。しかし、本来コンテンツごとにユーザーの検索意図や求められている情報は異なるため、適切なコンテンツ作成ではありません。加えて、文章や画像を使い回していると、コピーコンテンツとして判断されかねません。
コンテンツを作成する際は、ページそれぞれで想定される読者に寄り添った表現を使うようにしましょう。
対策キーワードとコンテンツをリスト化し、類似コンテンツを作らない
2つ目の回避策は、対策キーワードとコンテンツをリスト化し類似コンテンツの作成を避けることです。
特定の商材に関するキーワードでSEO対策を進めていると、いつの間にか情報が類似してしまうコンテンツができてしまうことがあります。そのような、類似コンテンツの作成を回避するためにも対策キーワードとコンテンツをリスト化し、同じ内容のコンテンツを作らないよう心がけましょう。
ただし、対策キーワードは違うものの、ユーザーの検索意図が似ているキーワードを対策する場合は、「同一ページで複数のキーワードを対策する」あるいは「情報の粒度をコントロールし差別化」をするようにしましょう。
まとめ
重複コンテンツには、URL表記が異なるが同じデザインや内容が表示される場合や、コンテンツの内容が自社サイトまたは外部サイトのコンテンツと類似、重複している場合の2パターンがあることをご紹介しました。
ページ内容が同じなのに複数のURLがある場合や、自社サイト内に意図的ではない重複ページがある場合、Googleはペナルティ対象にはしていません。
しかし、意図的ではない重複コンテンツでも、そのままにしておくとSEO評価が分散してしまい、クローラビリティも悪化してしまうため、canonicalタグを使ってURLの正規化をしておきましょう。
一方で、外部サイトのコンテンツ内容をコピーしたページの作成は、ペナルティ対象になる可能性があります。サイトやページのランキングが下がるだけでなく、インデックス情報まで削除される可能性があるため、コピーコンテンツは作らないようにしましょう。
canonicalタグを使ったURLの正規化については以下のページで詳しく解説しています、お役立てください。