Googleウェブマスターツール内の重複するタイトルタグの対策

by 管理者
12月 06日 2013 年

あちこちのサイトから数行だけ情報を拾ってきて、目次のように一覧表示するだけの「まとめサイト」がどうやらGoogleから低評価扱いされそうです。

私達サイト管理者はブログやホームページで情報を公開しても、トンビに油揚げみたいに「まとめサイト」に美味しいところだけ持って行かれるので、「まとめサイト」はまじめにコンテンツを掲載しているサイト管理者からの不満が多く、Googleのこの対応に肯定的な意見が多いようです。

これにより、まとめサイトが検索結果でオリジナルコンテンツを差し置いて上位表示されなくなるのではないか?と期待しています。

それだけじゃなく、今年は大手ディレクトリがGoogleから「リンク掲載するならNofflowを付けろ!」と注意され、掲載順位を上げるためにディレクトリサイトを使うことが出来なくなりました。これは存在意義が無くなってしまったディレクトリサイトへの事実上の死刑宣告です。

Webの世界ではここ数年いろいろなサービスが生まれ、次々と淘汰されていきましたが、今年は後半に入ってからいろいろとあったという感じです。

 

さて、サイト管理者ならWMT(ウェブマスターツール)を使っている人が多いと思いますが、数年前(3年?)から意味不明な文字列のURLパラメータが数百個登録されており、それを全て削除してから、タイトルタグの重複が大量に発生するようになってしまいました。

しかもそのURLは全く身に覚えのない物。

 

推測ですが、このURLはサーバが不調になったときにインデックスされたURLで、PHPパラメータの=を削除すると、どんな文字列でもHTTPエラー404にならず、存在する意味のコード200でリターンされるので、GoogleがそのURLを辿って来ても存在するURLと認識して正規のぺージとタイトルが重複してしまうのだと思います。

※当然画面も表示されます。

そして無制限にあると思われた重複するURLですが、重複して増えていくURLを解析すると、意味不明な数種類の文字列を使い回していることが判明しました。

つまり下の画像の重複しているURLを見ると赤・青・緑のようにURLのパターンでグループ化出来ます。

それなら数は限られてくるので、判明している全てのURLの重複パターンを.htaccessに記載してURLを正規化しました。

今後、新しいパターンが現れたら、都度.htaccessに追加しますが、どのくらい重複が減るのか当面様子見です。

 

重複パターン

 

 

この記事へのトラックバックURL