重複コンテンツとは、内容が「完全に同じ」あるいは「非常に類似した」ページが複数存在する状態です。
「重複」という言葉を聞いて、他サイトから無断複製した「コピーコンテンツ」をイメージした方も多いかもしれません。
しかし、SEOで問題視される重複コンテンツは、悪意のあるコピーコンテンツではなく、サイト運営で自然に発生してしまう重複を指す場合がほとんどです。
また「重複コンテンツ = ペナルティ」と思っているWeb担当者も多いですが、実際にはペナルティはありません。
このようにSEOにおける「重複コンテンツ」は誤解の多いテーマです。
重複コンテンツはSEOにも影響するものなので、適切に対処できるようWeb担当者はこの記事で理解を深めておきましょう。
- 重複コンテンツとは
- SEOで重複コンテンツはペナルティなのか?
- 重複コンテンツのSEO上のデメリット【対処すべき理由】
- 重複コンテンツへの対処法
- 重複コンテンツの調べ方
- 重複コンテンツとSEOに関してよくある質問
「重複コンテンツの基準は?」「定型文を使い回してもいい?」など、疑問をお持ちのWeb担当者は要チェックです。
現在、SEO内部対策に必須な82項目をまとめたチェックリストを無料配布中です。
フォームに情報入力・送信いただければ、資料をメールでお届けしますので、ぜひご活用ください。
SEOノウハウ|SEO内部対策82項目を大公開 -webma-
提供中のSEOサービス
- 「SEOコンサルティング」>> SEO対策全般をお考えの方に
- 「内部施策代行」>> サイト内部を最適化したい方に
- 「外部施策代行」>> 被リンクを獲得したい方に
- 「記事制作代行」>> 記事制作を依頼したい方に
目次
重複コンテンツとは
重複コンテンツとは、内容が「完全に同じ」あるいは「非常に類似した」複数のページのことです。
重複コンテンツは、自サイト内でも他サイトとの間にも生じる可能性があります。
Googleは重複コンテンツを以下のように定義しています。
単一のページに複数の URL でアクセスできる場合や、異なるページのコンテンツが類似している場合(たとえば、あるページにモバイル版と PC 版両方のURLがある場合)、Google はそのようなページを同じページの重複版と見なします。
簡単にいえば「異なるURLなのに、同じ(類似した)コンテンツが表示される」状態です。
冒頭でもお伝えしたとおり、Google の使う「重複」という言葉は通常、悪意を持って作成された「コピーコンテンツ」や「スパムコンテンツ」を意味しません。
なお、重複コンテンツは以下の3種類に分類できます。
- 完全一致の重複コンテンツ
- 部分一致の重複コンテンツ
- ドメイン間の重複コンテンツ
それぞれ解説します。
完全一致の重複コンテンツ
「完全一致」の重複コンテンツは、2つのページが100%同じケースです。
異なるのはURLのみです。
「www の有無」や「http と https」など技術的な要因で生じることが多いです。
不完全一致の重複コンテンツ
「不完全一致」の重複コンテンツは、2つのページ内容がわずかに異なるケースです。
テキストや画像、デザインなど一部のみ異なります。
たとえば、ECサイトの画像のみ異なる製品ページは、不完全一致の重複コンテンツです。
ドメイン間の重複コンテンツ
「ドメイン間」の重複コンテンツは、別々の Webサイトで同じコンテンツを掲載しているケースです。
たとえば、作成したコンテンツを他のメディア(Yahoo! JAPAN など)で配信している場合や、コンテンツが許可なく転載されてしまった場合などです。
SEOで重複コンテンツはペナルティなのか
結論からお伝えすると、検索結果を操作するスパム的な意図がない限り、重複コンテンツはペナルティにはなりません。
Googleは公式ドキュメントで、以下のように記述しています。
サイトにコンテンツが重複していることは正常であり、 Google のスパム ポリシーに違反するものではありません。
引用元:What is URL Canonicalization | Google Search Central
※弊社で翻訳。
重複コンテンツがある場合、Googleはどちらか一方を「正規版」として検索結果に表示させ、もう一方をなるべく表示させないようにします。
これはペナルティではなく、単なるアルゴリズムによる調整です。
「同じ内容のページが検索結果に並ぶとユーザーは不便だよね。だからどちらか一方に絞ろう」と調整をするわけです。
サイトの大部分が重複コンテンツなら問題ですが、通常のサイトで自然に起きうる重複コンテンツにペナルティは科されません。
「無断複製されたコンテンツ(=コピーコンテンツ)」はペナルティ対象です。独自の価値を加えずに、順位のためだけにコンテンツを量産するのはやめましょう。許可なくコンテンツ転載するのは、法的にもNGです。
テキストや画像の使い回しはOK?【重複はマイナスになるのか】
Webサイトを運営していると、画像やテキストの一部を使い回すことも多いですよね。
こうした重複も、ペナルティ対象やマイナスなランキング要因ではありません。
あるページのテキストを、トップページやその他のページで繰り返し使っても、それが原因で順位は下がらないということです。
参考:Google: Duplicate Content is Not a Negative Ranking Factor – Search Engine Journal
注意が必要なのは、重複の割合が多いとその分、ページ内のオリジナル要素が少なくなりやすいことです。
ご存じのとおり、Googleは独自性の高いコンテンツをより高く評価し、上位に表示します。
テキストや画像を部分的に流用したコンテンツでは「オリジナル要素が少なくなり、順位が上がりにくくなる」ことがあります。
「重複自体がマイナス評価になる」と考えるのではなく、「重複部分は無視されるので、重複部分以外の独自要素を増やすことが大切」と考えると良いでしょう。
重複コンテンツのSEO上のデメリット【対処すべき理由】
前述のとおり、重複コンテンツは Google の評価を下げる直接的な要因ではありません。
しかし、放置しておくとSEO上の不都合が生じてしまいます。
この章では、重複コンテンツに適切な対処を施すべき3つの理由をお伝えします。
- デメリット1.リンク評価が分散する
- デメリット2.クローラーのリソースが無駄遣いになる
- デメリット3.意図したページが検索結果に出ない可能性がある
デメリット1.リンク評価が分散する
1つ目のデメリットは、リンク評価が分散することです。
たとえば「ページA」と「ページB」が重複コンテンツになっていると想定しましょう。
この場合、「ページA」にも「ページB」にも被リンクがつく可能性があり、評価を分散させる原因になってしまいます。
どちらか一方を正規ページに指定すれば、リンクの評価をひとつに集約できるため、効率よくGoogleからの評価を高められます。
デメリット2.クローラーのリソースが無駄遣いになる
2つ目のデメリットは、クローラーのリソースが無駄遣いになることです。
SEOにおいては「新規コンテンツ」や「更新したコンテンツ」を早めにクロールしてもらうことが重要です。
しかし重複コンテンツのクロールに時間がかかると、こうした重要なページへの回遊が後回しになってしまうことがあります。
小規模なサイトなら問題ありませんが、大規模サイトでは本来回遊してほしいページのクロール頻度が下がり、インデックスに支障が出る可能性もあるので対処が必要です。
デメリット3.意図したページが検索結果に出ない可能性がある
3つ目のデメリットは、意図したページが検索結果に出ない可能性があることです。
Googleは重複コンテンツを発見すると、自動的に1つのページを「正規版」に決め、もう一方を検索結果に表示しないようにします。
意図したページを検索結果に表示させたいなら、「URLの正規化」をおこない、Googleに正規URLを伝える必要があります。
Googleから評価を受ける正規のURLを1つに決め、統合する処理。301リダイレクトやcanonicalなど。
重複コンテンツへの対処法
重複コンテンツへの対処の流れは以下のとおりです。
- 重複コンテンツを見つける
- 正規ページを決める
- 必要な対処をおこなう
重複コンテンツへの具体的な対処法として、代表的なものは以下の5つです。
- 対処法1.301リダイレクト処理
- 対処法2.canonialタグの設置
- 対処法3.アノテーション設定
- 対処法4.類似コンテンツの削除・統合
- 対処法5.コンテンツ配信先への対処依頼
どの方法でも良いわけではなく、重複の原因によって適切な対処法が異なります。
それぞれ確認して、自サイトでの重複状況に合った適切な対処をおこないましょう。
対処法1.301リダイレクト処理
301リダイレクトは、指定したURLへの転送処理です。
正規ページのみをユーザーに表示させたい場合に使用します。
たとえば、以下のような要因で重複が起きていているなら301リダイレクトで対処します。
- 「www」の有無
- 「http」と「https」
- URL末尾の「/index.html」の有無
- URL末尾の「 / 」の有無
「http://example.com」と「https://example.com」で重複が起きている場合、「httpページ(非正規)」 → 「httpsページ(正規)」にリダイレクトを向けます。
301リダイレクトの具体的な設定方法は以下の記事を参考にしてください。
URLの変更時に必要な301リダイレクトとは?SEOへの影響と正しく設定する方法 -webma-
対処法2.canonicalタグの設置
canonical(カノニカル)タグは、両方のページをユーザーに見せたい場合に使用します。
canonical タグを使うと、両ページを残しつつも、Googleに正規ページ(評価してほしいページ)がどちらなのかを伝えることが可能です。
たとえば、以下のような要因で重複が起きているときに使用します。
- ECサイトの類似度が高い商品ページ(色違いなど)
- PC版・モバイル版でURLが異なる
- URLパラメータの有無
- Webページの印刷用バージョンがある
非正規ページに rel=”canonical” を記述し、正規ページを指定します。
canonical タグの使用方法や設定方法について詳しく知りたい方は、以下の記事を参考にしてください。
canonicalタグとは?SEOの評価を最適化する記述方法を徹底解説 -webma-
対処法3.アノテーション設定
アノテーションとは、デバイスごとに別々のURLが存在することをGoogleに認識させる設定です。
PC版とモバイル版でURLが異なる場合、canonicalタグとalternateタグを設置しましょう。
具体的な方法は以下のとおりです。
- PC版には「alternate」タグを設置して、モバイル版があることを示す
- モバイル版には「canonical」タグを設置して、PC版が正規のURLであることを伝える
参考:モバイルファースト インデックスに関するおすすめの方法 | Google 検索セントラル
ただしGoogleは、デバイスごとにURLを持つのではなく、いずれにも対応できるレスポンシブデザインを推奨しているので対応を検討してみてください。
対処法4.類似コンテンツを減らす
類似コンテンツをいくつも作成してしまっている状況なら、以下の方法で減らすのも良いでしょう。
- 2つのコンテンツを1つに統合する
- オリジナルコンテンツを追加する
たとえば、旅行サイトで2つの都市を別々のページで紹介していてコンテンツが類似しているとします。
この場合、1ページで両都市をまとめて紹介するか、各ページにオリジナルコンテンツを追加して対処します。
対処法5.コンテンツ配信先への対処依頼
自サイトのコンテンツを外部メディアでも配信することを「コンテンツシンジケーション」と呼びます。
コンテンツシンジケーションによる重複は、配信先と事前に話をしておくことで防げます。
配信先に依頼して、配信先の記事に「noindex」タグを設置してもらいましょう。
「noindex にすると外部サイトで配信する意味がなくなるのでは?」と思う方もかもしれませんが、SNS経由あるいはメディア内のリンクからのアクセスを集める上では意味があります。
以前は配信先の記事に「rel=”canonical”」を追加してもらい、オリジナル記事を正規化することがベストな重複解消方法として推奨されていました。しかし2023年5月にGoogleはシンジケーションコンテンツに関するドキュメントを変更。canonicalタグを使わずに、配信先コンテンツのインデックスをブロックすることを推奨しています。
参考:正規化の問題を修正 | Google 検索セントラル
なおコンテンツシンジケーションの重複対策として、配信先より早くページをインデックスさせる、あるいは、そもそも配信をしないというのも効果的です。
もし許可を出していないのにコンテンツが無断で他サイトに掲載されている場合は、以下方法で対処してください。
Google に著作権侵害の申し立てができます。以下のフォームから申請してください。
著作権侵害の報告: ウェブ検索 – Google
重複コンテンツの調べ方
重複コンテンツは「Google Search Console(グーグルサーチコンソール)」 を使って確認できます。
1.管理画面左「インデックス作成」の下にある「ページ」をクリック。
2.重複コンテンツがある場合は「ページがインデックスに登録されなかった理由」にメッセージが表示されます。クリックすると、どのURLで重複が起きているかを確認できます。
※各メッセージの詳細については、Googleのヘルプページ 「ページ インデックス登録レポート」で確認可能です。
重複ページのURLを「URL検査ツール」で調査すれば、どのページがGoogleに正規ページと判断されているかも調べることができます。
重複コンテンツとSEOに関してよくある質問
重複コンテンツに関してよくある質問に回答しました。ぜひ参考にしてください。
1.重複コンテンツの基準になる割合は?
重複コンテンツの基準となる具体的な割合(%)はありません。
Google社員の John Mueller 氏は、Twitter ユーザーとのやりとりのなかで以下のように回答しています
質問者:重複コンテンツを表すパーセンテージはあるのでしょうか?例えば、自サイトの他のページと比較して、少なくとも72.6%がユニークなページであるように努めるべきでしょうか?Google は割合を測定していますか?
ミューラー氏:数字はありません(どうやって測定するのでしょうか?)。
※弊社で翻訳。
2.「規約」や「免責事項」は重複しても問題ない?
「規約」や「免責事項」などの定型文が重複していても問題ありません。
ECサイトにおける「配送情報」や「支払い情報」などの定型文も同様です。
Googleは、Webの世界でこうした定型文の重複が当たり前に発生することを理解していて、適切に処理できます。
「定型文だけで構成されていて、固有のコンテンツがない」というページが大量にあれば問題ですが、そうでなければ心配はいりません。
参考:How does required duplicate content (terms and conditions, etc.) affect search? – YouTube (2013)
3.異なるフォーマットで同じコンテンツを提供するのは重複?
「YouTube動画」と「ブログ記事」などフォーマットが異なるなら、内容が同じでも重複とは見なされません。
それぞれ異なるコンテンツとして評価されます。
フォーマットが違えば、あらゆる人に情報を届けられるため、Googleはむしろ別フォーマットでの横展開を推奨しています。
参考:Google: Same Content in Different Formats is Not Duplicate – Search Engine Journal
4.自社ECサイトと楽天で同じコンテンツを公開したら重複?
自社ECサイトを運営していて、楽天市場やAmazonでも全く同じコンテンツを公開した場合、重複コンテンツになります。
Googleの Matt Catts 氏は、2013年の講演で以下のように回答しています。
重複コンテンツになる。ペナルティではないが、どれかは検索結果に出なくなるだろう。
複数のサイトで同一商品を売る場合の重複回避策については、上記の鈴木謙一氏のブログを参考にしてみてください。
5.重複コンテンツ対策で noindex を設定するのはOK?
重複コンテンツを防ごうと「noindex」タグを使用される方がいますが、Googleは推奨していません。
なぜなら、noindexタグはページの評価をゼロにしてしまうからです。
たとえば「ページAで順位を上げたいのに重複したページBが上がっている」といった状況でBページに設置すべきなのは noindex ではなく、rel=”canonical” です。
そうすれば、評価をAページに集められます。
そのページの評価は一切要らないと確信できるなら重複コンテンツ対策に「noindex」を使ってもOKですが、あくまでも noindex は最終手段です。
【まとめ】重複コンテンツはペナルティではない!SEOで勝つために重複対策をしよう
重複コンテンツは悪意のあるコンテンツでない限り、ペナルティ対象にはなりません。
とはいえ、以下のような理由から、SEOにおいて好ましくない現象であることは確かです。
- デメリット1.リンク評価が分散する
- デメリット2.クローラーのリソースが無駄遣いになる
- デメリット3.意図したページが検索結果に出ない可能性がある
自サイト内に重複コンテンツを見つけたら、この記事で紹介したような方法で対処しましょう。
- 対処法1.301リダイレクト処理
- 対処法2.canonialタグの設置
- 対処法3.アノテーション設定
- 対処法4.類似コンテンツの削除・統合
- 対処法5.コンテンツ配信先への対処依頼
もし「重複コンテンツを解消しても順位が上がらない」とお困りの場合は、ぜひ弊社にご相談ください。
弊社の無料診断では、お客様のサイトの課題を特定し最適な施策をご提案いたします。
株式会社エクスコアのコンテンツディレクター・ライター。
1996年生まれ。大学で言語学専攻を卒業したのち、エクスコアに入社。2020年からオウンドメディア「Webma」の運営に従事し、コンテンツ制作・編集・SEO業務に携わる。累計100記事以上を執筆し、PV数・CV数400%超成長に貢献。