ミラーコンテンツによるスパム認識を回避しよう
ミラーコンテンツ
ミラーコンテンツとは同じWebサイト内のコンテンツ、または別のWebサイトのコンテンツと全く同じか、非常に酷似したコンテンツのことを指す。
「重複コンテンツ」や「コピーコンテンツ」ともゆわれる。
同じような内容のコンテンツが書かれているWebページを検索結果の上位に表示させることはしない。
たいていの場合、似たようなWebページのうちのどれか1つ、原則としては最初にそのコンテンツが書かれた「オリジナル」のWebページのみを評価する。
自然に起こり得るミラーコンテンツ
Webサイト内に似たようなコンテンツが存在するからといって、全てのWebサイトのオーナーにスパム的な意図があるわけではない。
まったく意図しないうちに、自然にミラーコンテンツが発生してしまうケースがある。
靴の販売をしているショッピングサイトを例にあげると、Webサイトのオーナーは幅広いユーザーのニーズに対応するために、同じメーカーの同じデザインの靴であってもサイズ別、色別に紹介ページを分けようと考える場合がある。しかしここが落とし穴である。
意図があってサイズ別、色別に分けたWebページとはいえ、サイズと色が違うだけの酷似したWebページとして大量に発生してしまう。
ミラーコンテンツを回避する「canonical属性」
ミラーコンテンツを回避するために、Googleは「canonical」という属性を使用することを推奨している。
canonical属性は「URLが異なる、内容が同一または酷似したWebページが複数存在する場合に、その中で代表となるURLを指定することで重複問題を防ぐ」という役割を持っている。
対策として、同じような2つのWebサイトは「同一内容を掲載している」とタグ内に記述し検索エンジンに伝えることができる。
よってミラーコンテンツとはみなさなくなる。
しかし、ミラーコンテンツ対策以外の目的でcanonical属性を使用する際は注意が必要である。
重要なWebページにcanonicalタグを設定してしまえば、そのWebページが検索結果に表示されなくなってしまうため十分に注意しておきたい。