最近、仕事でちょっと重複コンテンツの処遇を論じ合う機会があったので、改めてまとめてみます。
みんなあれでしょ、イメージでなんとなくミラーサイトは単純に害悪みたいな認識持ってますよね。決めつけてすみませんけど。
結論からいうと、Googleからペナルティくらうってほどのもんじゃないです。ただし少しは気を使わないとデメリットもなくはないです。
この記事の目次 - Contents -
重複コンテンツってのは
<『ほとんど』以上『完全に』未満>で同じコンテンツのことです。
一般的には自社サイトのブログと無料ブログに同じ記事を載っけるようなイメージがありますね。
ただまあそれだけではなく、Search Consoleのヘルプから参照するに、例として
- PC向けとスマホ向けのページ両方を生成してる
- 複数の別々のURLで表示、またはリンクされる商品ページ
- 印刷用バージョンのWebページ
なんてのも含まれます。
あと翻訳ものを載せるなんてのも良い例みたいですね、噂によると。
では何がマズいのか
一時期Facebookなんかで猛威をふるった完全コピペして記事を作っていたバイラルメディア。あれなんかは悪の極地ですね。
あとその昔、同じコンテンツを複製して入り口を増やしトラフィックの増大を狙うという姑息な手段が、SEO的に効果があった時代がありました。
そんなのは検索を利用するユーザーからしたら、検索結果に同じコンテンツが並ぶわけですから迷惑千万なわけです。
そんな世間の声を汲みとって、Googleさんはそういうセコいことができないようにと同じコンテンツは複数表示させないようにしてくださいました。
なので今は、そういう意味では平和なのですが。
対策として
先に挙げた↑良い例を見てください、Search Consoleのヘルプにあった例とその前後のやつ。
そういう良い例のコンテンツまで、姑息な手を使ってると思われたらかなわないですよね。
ですが、そこらへんの区別は検索エンジンなんて所詮機械、理解できないようなのです。
なのでこちらで指令を出して「これ他にも同じ内容のページが存在しますけどスパムとかそういうのじゃないですよ」というのを教えてやらなければならないのです。
noindex
ご存知、Googleのインデックス(索引)にこのページは登録しないよというアレです。
WordPressの場合は、もうほぼ必須であろうプラグイン『All in One SEO Pack』でクリックひとつで対応できます。
canonical
canonicalを日本語にすると「公式の」とか「基準の」なんていう形容詞になります。つまり「このアドレスの内容が本物だ」という宣言になります。
WordPressの場合
管理画面→ 設定→ 一般→ WordPressアドレス、サイトアドレス
のところで設定したURLに自動で正規化されます。
マット・カッツさんも語ってる
Googleスパム対策チームの偉い人、マット・カッツさんはゲイリー・テイラーさんからの重複コンテンツに関する質問に答えています。
ものすごく大ざっぱにいうと「重複しているコンテンツはどうしても存在するもので、だから俺らはそれらをまとめてちゃんと順位を付け見やすくするだけだよ。」と。


最新記事 by 高橋 としあき (全て見る)
- 実店舗や自営業者の電子決済導入は損か得か? - 10/30/2017
- アイキャッチ画像の文字組みにも、ちょっとだけこだわってみる。 - 08/24/2017
- Web上で「他者と差別化する」ための、競合調査の手順 - 08/15/2017