ウェブマスターの皆様は、サイトの管理者として、サイトのどのコンテンツが検索エンジンのインデックスに登録されているかについて、気を配られていることと思います。検索エンジンのインデックスに登録されたくないコンテンツについては、
robots.txt ファイルか、robots メタタグを利用 して、インデックスされたくない旨を検索エンジンに伝えることができます ( 注: robots.txt でブロックされた URL のメタタグに noindex や noarchive を指定しても無効です。Google のクローラーはまず最初に robots.txt をチェックします。そこでアクセスが禁止されたページをクローラーは読み込みに行き
ませんので、そのページにあるメタタグの指定がクローラーに伝わりません ) が、では、すでにインデックスに登録されているコンテンツを削除したい場合は、どうしたらよいかご存知でしょうか? 今回は、Google のインデックスに登録されたコンテンツを削除する方法について、ご紹介します。
まず、その方法は、削除したいコンテンツの種類によって異なります。
削除したいコンテンツの種類別の方法 が、 ウェブマスター向けヘルプセンターに詳しく記載されていますので、是非一度ご参照ください。該当する方法がとられたページは、次回クロール後に、インデックスから自動的に削除されます。ただ、もし希望されるのであれば、次のクロールまでじっと待つのではなく、削除までの時間を短縮する方法もあります。
ウェブマスターツールで 所有権の確認が済んでいるサイトについては、ウェブマスターツールにある「URL の削除」という運用ツールを利用して、インデックスからコンテンツを削除するためのリクエストを送信できます。「URL の削除」ツールのメイン画面から「新しい削除リクエスト」ボタンをクリックし、削除したいコンテンツの種類を選択してください。
個々の URL
個々の URL もしくは画像を削除したい場合は、この項目を選択してください。個々の URL の削除が正しく処理されるためには、その URL が下記のいずれかに該当する必要があります。
次に、削除の準備が整ったら、削除したい URL を入力し、その URL が、ウェブ検索に表示されているのか、それともイメージ検索に表示されているのかを選択してください。そして「追加」ボタンをクリックします。一回のリクエストで最大 100 URL まで追加することができます。削除したい URL をすべて入力したら「リクエストの送信」をクリックします。
サイト上のディレクトリとすべてのサブディレクトリ
特定のディレクトリ内にあるすべてのファイルやフォルダを削除したい場合は、この項目を選択してください。例えば、次の URL についての削除リクエストを送信するとします。
http://www.example.com/myfolder
このリクエストによって、このパスを先頭に持つすべての URL がインデックスから削除されます。
削除される URL 例:
http://www.example.com/myfolder
http://www.example.com/myfolder/page1.html
http://www.example.com/myfolder/images/image.jpg
ディレクトリの削除が正しく処理されるためには、robots.txt ファイルを利用し、そのディレクトリをブロックする必要があります。上で挙げた例に関しては、http://www.example.com/robots.txt に、例えば次のような次の記述が必要です。
User-agent: Googlebot
Disallow: /myfolder
サイト全体
Google のインデックスからサイト全体を削除したい場合は、この項目を選択してください。この項目が選択されると、サイトのすべてのディレクトリとファイルがインデックスから削除されます。
使用するドメイン以外のドメインを持つ URL をインデックスから削除するのに、このツールは利用されないようお願い致します。具体例を挙げると、サイトの URL をすべて www 有りのバージョンでインデックスさせたい場合に、www 無しのバージョンを削除するために、このツールを利用しないでただきたいのです。そのような場合は、
ウェブマスターツールの「使用するドメイン」で設定を行い、可能であれば、使用するドメインへの
301 リダイレクト 設定を行ってください。また、個々の URL やディレクトリの削除同様、「サイト全体」の削除をされる際には、
robots.txt を使って、サイト全体をブロックする必要があります。
Google の検索結果のキャッシュ コピー
キャッシュを削除したい場合は、この項目を選択してください。また、キャッシュの削除が正しく処理されるためには、キャッシュの削除を希望するページに、次の 2 つのいずれかを行う必要があります。
そのページがキャッシュされることを今後一切望まないという場合は、
noarchive メタタグを ページに追加したうえで、ツールを使って、キャッシュ削除のリクエストを送信します ( 注: 該当のページが robots.txt でブロックされていないことを確認してください )。このツールで送信されたキャッシュ削除のリクエストは、迅速に対応さ れます。そして、noarchive メタタグがそのページに追加されていれば、以後 Google がそのページをキャッシュすることはありません。もし、将来的に、改めてキャッシュされることを希望される際には、noarchive メタタグを取り除いていただければ再びキャッシュされるようになります。
すでに削除された内容を含むページがキャッシュされていて、そのキャッシュが残されていることを望まず、その古いバージョンのキャッシュを削除したい場合も、同様に URL 削除ツールからそのリクエストを送信することができます。最新のページの内容が、キャッシュされている内容と異なるかどうかがチェックされ、異なることが確認された場合は、古いバージョンのキャッシュが削除されます。この場合は、約 6 ヶ月後に、自動的に、またそのページのキャッシュが登録されるようになります。概して 6 ヶ月後には、再度クロールが行われているため、そのときに最新のコンテンツがキャッシュされます。もし、より早く Google がそのコンテンツを再度クロールしたことが確認され、それを待たずに再登録を希望される際には、同じく、このツールから、コンテンツの再登録リクエストを送信することも可能です。
削除リクエストのステータス確認
削除リクエストの処理はまず「保留中」と表示され、しばらくすると「完了」もしくは「拒否」のいずれかの結果が表示されます。「拒否」という結果が表示された場合は、削除リクエストが正しく処理されるための必要条件を満たしていたかを再度確認してください。
コンテンツの再登録
削除が正しく処理されると「削除されたコンテンツ」タブに URL がリストされます。コンテンツをブロックしていた robots.txt の記載を消すか、robots メタタグを削除したうえで、このツールにある再登録ボタンをクリックすれば、いつでもそのコンテンツの再登録は可能です。この作業が行われない場合は、少なくとも 90 日間、そのコンテンツは Google のインデックスに登録されません。90 日経過した後に、再度クロールを試みた際に、そのコンテンツがまだブロックされている、もしくは 404 か 410 を返している場合は、そのコンテンツは Google のインデックスに登録されません。逆に、90 日経過した後にクロールが可能な状態であった場合は、そのコンテンツは再び Google のインデックスに登録されます。
自分の管理下にないコンテンツの削除依頼
ご自身が管理しているサイト外のコンテンツの削除についても、
ウェブページ削除リクエストツールをご利用いただきますと、同様のリクエストが送信できます。
ただ、Google はウェブをインデックスしていますが、各ページのコンテンツを管理しているわけではなく、各ページのコンテンツを管理しているのは、その各ページのウェブマスターなので、基本的には、そのウェブマスターがコンテンツをブロックもしくは変更するか、ページを削除しない限り、検索結果からそのコンテンツを削除することはできません。削除を希望するコンテンツがある場合、まず、そのコンテンツの管理者に対応してもらったうえで、このツールを使って検索結果から取り除くまでの時間を短縮することができます。
特定の種類の個人情報やクレジットカード番号などを含む検索結果を見つけた場合は、そのコンテンツの管理者の協力が得られなくても、このツールを使ってリクエストを送信することが可能です。その場合には、Google が直接皆さんと協力できるよう、メールアドレスの入力をお願いします。
また、このツールは、セーフサーチにおいて不適切な結果が返された際のご報告にも利用することができます。
ウェブマスターツール内の URL 削除ツール同様、「保留中」「完了」「拒否」など、リクエストのステータス確認もできます。基本的には、正しく削除の処理が行われるための必要条件を満たしていないと、リクエストは拒否されます。個人情報に関する削除リクエストのステータスは、ここには表示されません。代わりに、削除リクエストを行うに当たって必要な次のステップをご説明するメールが届けられます。
Posted by サーチクオリティチーム
Original Version: Requesting removal of content from our index