10/27『崖っぷちの首位攻防戦』
今週の空日記へ

ブログの重複コンテンツ・類似ページや類似記事はサイトの評価を下げる

パクリやコピーブログ関連

ブログに命を燃やしています!
どうも、あみさかです

 

僕のブログ運営1年目は困難が続いていました。

もちろん、1年目というのは誰でも探り探りで続けていきます。

様々な失敗をしながら学んでいくものです。

 

その中でも特に深刻だった問題は、途中からドメインパワーが全く上がらなくなってしまったことです

「サイトの評価はドメインパワーが全て」とは言い切れませんが、ブログの状態のバロメーターを表すものであり、掲載順位に比例することも確かでしょう。

 

そのドメインパワーが上がらなくなってしまった原因は当ブログの重複コンテンツ・類似記事でした

というわけで今回は、重複コンテンツや類似ページがサイトの評価を下げてしまうということと、ノーインデックスの使い方について紹介していきます

 

スポンサーリンク

サイトの評価を下げていた重複コンテンツ

最初に紹介しましたが、ドメインパワーが上がらなくなってしまったことには心当たりがありました

途中までは、ゆっくりですが確実にブログは成長していました。

それがピタッと止まってしまうのには何か理由があるからです。

 

その理由は重複コンテンツです。

ミラーサイト・ミラーコンテンツと言われることもあります。

ほとんど同じ内容の記事がネット上にたくさんあっても価値はありませんし、パクった記事に価値はありません。

 

それは、自分のブログの中でも同じことです。

1つのブログの中で同じような記事をたくさん作ると、不当な方法で記事数を稼いでいると判断されサイトの評価を下げられてしまうことに繋がります。

実際に当ブログでも、同じような記事がたくさん出来てしまったということが起こりました。

 

以前「野球観戦ブログ」と題して、僕がファンクラブに入っている大好きなロッテの試合内容について毎試合記事にしていました。

その記事は、ロッテの試合が終わったらすぐに投稿できるようにテンプレートを作成して書き上げていました

 

それぞれの記事のタイトルで違う部分は日付だけ、出てくる選手の名前も大体同じなのでどうしても内容は被ってしまいます。

「重複コンテンツとして判断されたらまずいのではないか?」という思いもありましたが、わずかでも検索流入を得たいとその記事を自らインデックスを登録をしてしまっていました。

 

しかし、それは大きな間違いでした。

試しに「その野球観戦ブログ」と題した記事をミラーサイト・類似ページのチェックツールというのを使って内容の違いを調べてみました。

その結果は、ほぼ同じ記事という判断が下されました。

タイトルも内容もHTMLコードも全て似ているという判断です。

 

プロ野球の公式戦は150試合近くあるため、タイトルと内容も似ている記事が150記事もあるということです

当ブログのドメインパワーが上がらなくなったのは、その記事を出し始めた頃でした。

重複コンテンツはサイトの評価を下げてしまうことになります。

 

ノーインデックス(noindex)で対策を

このように重複コンテンツでブログが満たされてしまうことは、絶対に良いことではありません。

検索エンジンの評価が上がらないことは、ブログにとって致命的です。

そうならないために「ノーインデックス(noindex)」を上手く活用しましょう。

 

本来であれば検索エンジンに登録するためにわざわざ自分からインデックス登録をリクエストすることもありますが、これはその逆です。

検索エンジンに登録されないようにするということです。

 

記事を消してしまうとだれもその記事を見られない状態になりますが、ノーインデックス設定をした記事は検索流入以外の方法で見ることができてそのブログには存在している状態です。

ノーインデックスを記事に設定しておけばその記事の内容を検索エンジンは認識することができないため、検索エンジンの評価の対象から外れることになります

 

重複コンテンツやあまり価値のない記事、質が低い記事などペナルティを受けてしまう可能性がある記事を評価されないようにしておくことで、ブログの評価を保つことができます。

はてなブログでノーインデックス設定をするにあたり、こちらの記事のコードを利用させていただきました。

 

この記事に書いてあるように、検索エンジンの評価対象から外したい記事の冒頭にHTMLコードをコピペさせて頂けばインデックス登録されないようにすることができます

そのHTMLコードは文章として表示されないため、レイアウトが崩れる心配もありません。

 

該当の記事が投稿する前やまだインデックス登録されていない状態であれば、そのコードを設置している限りインデックス登録される心配はありません。

すでにインデックス登録されてしまっている記事にコードを貼り付けると、その記事がGoogleのクローラーに認識されたタイミングでインデックス登録されていない状態になります。

 

すぐにノーインデックスに切り替わるわけではなく、待つことになりますね。

僕がインデックス登録を外したい野球の記事は150記事あり、それに1記事ずつHTMLコードを貼り付けていくのは結構大変でした。

やることは単純作業ですが、とても時間がかかりました。

 

Googleのクロールを待つしかない

先ほど、すでにインデックス登録されてしまっている記事はノーインデックスの設定をしてもすぐに反映されないと書きましたが、僕はそこで一番苦労しました。

本当に長い時間がかかりました。

 

まずは特に何もせずインデックス登録が外れるのを待ってみましたが、なかなかGoogleのクローラーが当ブログを訪れてくれないためずっとインデックス登録されたままの状態です。

次に、どうにかノーインデックスの状態になってくれないと重複コンテンツで評価を下げられてしまっている現状を変えることができないと思い、googleサーチコンソールで「インデックス登録をリクエスト」「公開URLをテスト」をしてみました。

 

ですが、ノーインデックスのコードを貼った記事は「URLをGoogleに登録できません」となってエラーになってしまいます。

インデックス登録のリクエストという方法は全く意味がありませんでした。

 

ではどうすれば良いかというと、Googleのクローラーにノーインデックスの設定をした記事を認識してもらうしか方法はありません

本当に待つしかないということです。

 

ただ、そのクローラーを早く呼ぶための対策はしておきましょう。

まずはサイトマップをGoogleサーチコンソールに登録することです。

サイトマップを送ることでクロールの頻度が高まる可能性が期待でき、まとめて多くの記事を認識してくれることにも繋がります。

はてなブログの場合は「sitemap.xml」というURだけ登録してあれば問題ありません。

 

しかし、少しでも早く認識してほしいということでほかにもサイトマップを登録してみました。

それは「sitemap.xml?page=1」というURLです。

Googleサーチコンソールからそのサイトマップの中身を見ることができるのですが、そのサイトマップというのはブログのURLをまとめているものです

 

「sitemap.xml」というサイトマップの中身を見てみると、その中に「sitemap.xml?page=1」・「sitemap.xml?page=2」というように小さなくくりがあります。

「sitemap.xml?page=(数字)」というものの中身は、それぞれ約100記事ごとにURLが入ったものです。

 

つまり、ブログ全体のURLをまとめる大きなくくりの中に100記事ごとのURLをまとめるくくりがあるということです

その細かいくくりごとのサイトマップもそれぞれ登録しておいた方が早くなるのではないかと思い、page=1からpage=5までのサイトマップも別でそれぞれ登録しました

 

効果があるのかは分かりませんが、できることはすべてやりたいという考えです。

サイトマップの話が長くなりましたが、はてなブロガーの方はとりあえず「sitemap.xml」というURLを登録すれば十分です

 

そしてもう一つGoogleなどの検索エンジンのクロールを少しでも早める方法があります。

それは、ブログを更新し続けることです

記事の更新頻度を上げたり、サイトの更新をすることによってクローラーがサイトを訪れる頻度は高くなります。

 

記事を投稿する頻度が低いブログよりも記事を投稿する頻度が高いブログの方が情報の入れ替わりが多いため、検索エンジンのクロール回数も必然的に増えるからです。

僕はブログを毎日更新・毎日投稿する方法を取ったおかげでクロールを早めることが出来たと考えています。

 

最後にもう一つ、いろいろとノーインデックスを早く反映させる方法を探す間に旧バージョンのGoogleサーチコンソールで「URLの削除」というものを見つけました

内容としては、URLの削除を申請した記事を一時的(90日間)に検索エンジンで表示されないようにするというものです。

 

「ノーインデックスが反映されるまでの一時的な期間だけでも検索エンジンから外すことが出来れば、重複コンテンツのペナルティを避けることができるのではないか?」と考えてURLの削除を実際にやってみましたが、検索エンジンから記事が消えたのかどうかは良く分かりませんでした。

まあ、実際に検索エンジンから記事が消えたとしても一時的なものなのであまり意味はないので別に良いのですが…

 

類似ページが無くなることで上位に近づく

以上のような対策を取って、実際にノーインデックスの設定の反映まで2ヶ月半ほどかかりましたがほぼ全ての記事はインデックス登録を外れることが出来ました

Googleサーチコンソールでは「noindexタグによって除外されました」という表示になり、除外された状態になりました。

 

検索エンジンから除外されるまえに「送信されたURLにnoindexタグが追加されています」というエラーの状態に一度なりますが、そのまま放置して待っていれば除外されてインデックス登録を外れます。

重複コンテンツによるペナルティを受けていると思っていた大量の記事が除外されたタイミングで、当ブログのドメインパワー大幅に上がりました。

 

元々のドメインパワーが弱いので大幅と言っても大したことはないのですが、Googleサーチコンソールでの平均掲載順位は一桁に近づいて生きています。

検索順位が1位~3位の間をずっとウロウロしていた主力記事も1位で固定されています。

 

ブログをやるにあたってドメインパワーの数値というのは大事ですね。

自分が今どこの位置にいるかを客観的に見ることができますから。

 

今回はほぼ同じ記事をたくさん検索エンジンに登録していたことによってペナルティを受けていた状態になっていましたが、自分の書いている記事が似たようなタイトルになること・似たような内容になることは結構あることだと思います。

ほぼ同じ記事という状態になっていなければブログ自体の評価を下げることはないと思うので、そこまで心配する必要はないと思います。

 

ペナルティを受けてしまう心配があるという人は、ノーインデックスの設定をして早めに対策をしておきましょう。

 

終わりに「検索流入がすべてではない」

僕は今回紹介した「野球観戦ブログ」でも検索流入を得ることができると思っていましたが、実際にはブログ全体の評価を下げることになってしまいました。

 

ブログのドメイン自体の評価が低ければそもそも記事が上位で表示されることは難しいですし、ドメインを下げるという逆効果でこの「野球観戦ブログ」には何もメリットがないように思えてしまいます

そんな中で、僕がこの記事を書き続けたのには理由があります。

SNSやブログ村からのアクセスが多くあったからです。

 

野球の試合がある当日と翌日ぐらいにしか見てもらえない短期的なアクセスが中心でしたが、自分が書いた記事を見てもらえるというのはブロガーとしてとても嬉しいことです

確かに検索流入はブログのアクセスの中心になりますが、検索流入だけにこだわる必要はありません

 

予めノーインデックスのコードを貼り付けてから記事を公開すれば、その記事がブログの評価の対象にはなりません。

検索エンジンで表示されなくてもSNSなどの流入というのがありますし、ブログを訪れた人には読んでもらえるチャンスがあります。

 

そして、一度検索エンジンに登録されてからノーインデックスの設定をしてもなかなか反映されません。

時間も手間もかかるため、検索エンジンから評価の対象にされたくない記事は公開するときにノーインデックスのコードを貼り付けておきましょう。

 

それでは、今日がかけがえのない日となりますように…

 

コメント

タイトルとURLをコピーしました