ウェブマスター向け公式ブログ
Google フレンドリーなサイト制作・運営に関するウェブマスター向け公式情報
パラメータ付き URL 処理の新機能
2011年10月29日土曜日
ウェブマスター ツールの [サイト設定] > [設定] セクションから「パラメータ処理」機能がなくなっていることに、お気付きの方もいらっしゃるかもしれません。実は、この機能は「URL パラメータ」という新しいセクションとして独立することになりました。また、名前だけでなく機能そのものも一新されたので、より便利に使っていただけるかと思います。なお、以前の「パラメータ処理」機能による URL パラメータの設定は、自動的にこの新しいバージョンに反映されます。では、この新しい「URL パラメータ」には、どのような便利な機能があるのでしょうか。まずはこの機能の目的と役立つケースについてご紹介しましょう。
機能の概要
「URL パラメータ」機能を利用すると、サイト内のどの URL を Googlebot にクロールさせるか、URL 内のパラメータに基づいて指定することができます。それによってたとえば、この機能を使うことで簡単に重複コンテンツがクロールされるのを防ぐことができます。このため、あなたのサイトへのクロール負荷を軽減でき、また重複していないコンテンツがよりたくさんインデックスされやすくなるので、サイトのクロールが効率的に行われるようになるでしょう。また、Googlebot のクロールする範囲がまだ拡大できると思われる場合にも、この機能は有用です。ただし、ご利用にあたっては注意が必要です。というのも、URL パラメータの動作について十分に理解していなければ、クロールされるべき URL が誤ってクロールされない設定になり、そのコンテンツが Googlebot からはアクセスできくなってしまう恐れがあるからです。
新機能の詳細
では次に、新たに追加された機能についてご紹介しましょう。まず、個々のパラメータにクロール アクションを割り当てる際に、パラメータの動作が細かく指定できるようになりました。最初の手順としては、各パラメータがページのコンテンツを変更するかどうかを指定します。もしそのパラメータによってページのコンテンツが変化しないのであれば、設定作業はここで終了です。Googlebot はこのパラメータの代表的な値を持つ URL を選択し、クロールするでしょう。パラメータによってコンテンツが変わることはないので、どの値が選択されても同じ結果になります。一方で、もしパラメータによってページのコンテンツが変わる場合は、そのクロール方法を次の 4 つの中から選択することができます。
Googlebot が決定
すべての URL
値が指定されている URL のみ
クロールしない
なお、「値が指定されている URL のみ」を選択することで、パラメータに使用する値を自分で指定することができます。もう Google が用意する値のリストに制限されることはなくなりました。また、必須ではありませんが、たとえば並べ替えやページ指定、コンテンツ選択など、パラメータの具体的な動作を指定することもできます。さらに、すべてのパラメータに対して、それを含むクロール済み URL の例がそれぞれ表示されるようになりました。
上記の 4 つのクロール オプションのうち、「クロールしない」は今回追加されたもので、特に注意が必要です。このオプションはもっとも優先度が高く、当該の URL に含まれる他のパラメータのどの設定よりも優先されます。つまり、ある URL のパラメータが 1 つでも「クロールしない」に設定されていると、他のパラメータがたとえ「すべての URL」に設定されていたとしても、その URL がクロールされることはありません。なので、このオプションを使用するときには十分にご注意ください。ちなみに、2 番目に適用が優先されるオプションは「値が指定されている URL のみ」です。
事例
では、実際の例を通して、少し頭の体操をしてみましょう。
- - -
fairyclothes.example.com という名前のオンライン ストアがありました。このお店のウェブサイトでは、URL の中でパラメータを使用しており、さまざまな URL から同じコンテンツにアクセスできるようになっていました。ある日、オンライン ストアのオーナーは気付きました。冗長な URL があまりにも多いと、Googlebot がサイト全体をクロールできないかもしれない、と。そこで、好奇心旺盛で何でも知りたがる助手を偉大なる「ウェブの魔法使い」の元へ送り、Googlebot による重複コンテンツのクロールを減らすために「URL パラメータ」機能をどのように使用すればよいか、教えを請うことにしました。賢者として知られる「ウェブの魔法使い」は、URL パラメータに目を通すと、次のような設定を提案しました。
パラメータ名
コンテンツへの影響
Googlebot がクロールする対象
trackingId
なし
代表的な URL 1 つ
sortOrder
並べ替え
値が「lowToHigh」に指定されている URL のみ
sortBy
並べ替え
値が「price」に指定されている URL のみ
filterByColor
絞り込み
クロールしない
itemId
コンテンツ指定
すべての URL
page
ページ指定
すべての URL
助手はさっそく質問します。
助手
: trackingId については代表的な URL を Googlebot に選ばせる(値は Googlebot が選択する)よう指定なさっていますね。「値が指定されている URL のみ」を選択して特定の値を自分で指定しなかったのはなぜですか?
ウェブの魔法使い
: Googlebot がウェブをクロールしているときに、君のサイトにリンクしている URL で次のようなものが見つかったとしよう:
fairyclothes.example.com/skirts/?trackingId=aaa123
fairyclothes.example.com/skirts/?trackingId=aaa124
fairyclothes.example.com/trousers/?trackingId=aaa125
このとき、もしも Googlebot に「trackingId=aaa125」の URL だけをクロールするよう指定すると、Googlebot は URL 1 と 2 をクロールしなくなってしまうのだ。というのも、どちらの URL も trackingId の値が aaa125 ではないからだ。これらの URL のコンテンツはクロールされず、インデックスもされない。したがって、君の店が仕入れたすてきなスカート(/skirts/)がGoogle の検索結果に並ぶこともない。だからこの場合は、代表的な URL を選ばせるべきなのだよ。なぜかって?そのように指定すると、Googlebot がウェブ上で発見した 2 つの URL がこのパラメータの値だけ違っているとき(上の例でいうと URL 1 と 2)、Googlebot はそのうちどちらか 1 つをクロールするだけで、コンテンツをすべて取得できるからだ。上の例では、1 と 3 か、2 と 3 というペアで、合計 2 つの URL がクロールされることになる。おかげで、スカート(/skirts/)もズボン(/trousers/)も、1 つ残らずクロールされるのだ。
助手
: sortOrder パラメータについてはどうですか?商品のリストが昇順でも降順でもかまわないと思うのですが。Google に代表的な値を選ばせるのではいけないのですか?
ウェブの魔法使い
: Googlebot がクロールを続ける中で、次のような URL が見つかったとしよう:
fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’lowToHigh’
fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’highToLow’
fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’lowToHigh’
fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’ highToLow’
最初の 2 つの URL(1 と 2)の違いは sortOrder パラメータの値だけであり、その次の 2 つ(3 と 4)についても同じだ。しかし、URL 1 と 2 のコンテンツは同じではない。最初の URL ではスカートが安い順(’lowToHigh’)に表示され、2 番目の URL では高い順(’highToLow’)になっている。これを踏まえると、この状況で 1 つの代表値だけを使うのは得策ではないといえる。しかも、sortOrder パラメータだけが異なるいくつかの URL から Googlebot に代表的な値を 1 つだけ選択させると、そのたびに違う値が選択される可能性がある。たとえば上の例では、最初の 2 つの URL のうち、URL 1 が選択されたとしよう(sortOrder=’lowToHigh’)。一方で、その次の 2 つの URL では 4 が選択されたとする(sortOrder=’ highToLow’)。もしこの状況になったら、Googlebot は次のように、安い価格帯のスカートだけを 2 回クロールすることになるだろう:
fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’lowToHigh’
fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’ highToLow’
こうなると、高い価格帯のスカートは、まったくクロールされなくなってしまうのだ。このように、並べ替えのパラメータを扱うときは、一貫性が鍵となる。並べ替え順は常に同じにすることだ。
助手
: sortBy の値についてはどうですか?
ウェブの魔法使い
: sortOrder 属性によく似ているよ。商品一覧の URL がクロールされるときに、並べ替え順はどのページでも同じでなければならない。そうでなければ、一部の商品が Googlebot から認識されなくなるからね。ただし、どの値を選択するかについては注意が必要だ。店で書籍の他に靴も売っているとしたら、「title」という値は選ばない方がよいだろう。というのも、靴を表示する URL に「sortBy=title」が含まれることはまずないので、クロールされなくなってしまうからだ。同じように、「sortBy=size」と設定すると、靴のクロールは問題なくても、書籍はクロールされなくなってしまう。パラメータ設定の影響はサイト全体に及ぶことを忘れないように。
助手
: filterByColor というパラメータの付いた URL はクロールさせないのですか?
ウェブの魔法使い
: たとえば、スカートの一覧が 3 ページにわたってあるとしよう。そのうち何点かは青で、何点かは赤、残りは緑色だ。
fairyclothes.example.com/skirts/?page=1
fairyclothes.example.com/skirts/?page=2
fairyclothes.example.com/skirts/?page=3
このリストは、さらに絞り込むことができる。たとえば、ユーザーが青を選ぶと、青いスカートが次の 2 ページにわたって表示される:
fairyclothes.example.com/skirts/?page=1&flterByColor=blue
fairyclothes.example.com/skirts/?page=2&flterByColor=blue
この 2 つは新しいページのように見えるが(表示される商品のセットは他のどのページとも異なる)、実際のところ、新しいコンテンツは何もないのだ。というのも、青いスカートはすべて、元の 3 つのページに含まれているからだ。つまり、コンテンツを色で絞り込んだ URL を別途、クロールさせる必要はないということになる。そのような URL で表示されるコンテンツは既にクロールされているからだ。ここで注意してほしいのは、特定の URL をクロール対象から除外するために「クロールしない」を選択するときだ。そのコンテンツが Googlebot から別の方法でアクセスできるようにしておくことが肝心で、上の例でいえば、最初の 3 つのリンクを Googlebot が発見できる必要があり、このクロールを妨げるような設定がないように配慮しなければならないのだ。
- - -
もしご自分のサイトが
URL パラメータ
を使用していて、コンテンツが重複して生成される可能性がある場合には、ぜひウェブマスター ツールの新機能である「URL パラメータ」を試してみてください。ご感想やご質問は
ウェブマスター ヘルプフォーラム
までお寄せください。
Written by Kamila Primke, Software Engineer, Webmaster Tools Team
Original version:
Improved handling of URLs with parameters
ラベル
+1 ボタン
2
AMP
11
API
3
App Indexing
8
CAPTCHA
1
Chrome
2
First Click Free
1
Google アシスタント
1
Google ニュース
1
Google プレイス
2
Javascript
1
Lighthouse
4
Merchant Center
8
NoHacked
4
PageSpeed Insights
1
reCAPTCHA v3
1
Search Console
101
speed
1
イベント
25
ウェブマスターガイドライン
57
ウェブマスタークイズ
2
ウェブマスターツール
83
ウェブマスターフォーラム
10
オートコンプリート
1
お知らせ
69
クロールとインデックス
75
サイトクリニック
4
サイトマップ
15
しごと検索
1
スマートフォン
11
セーフブラウジング
5
セキュリティ
18
ダイナミック レンダリング
1
データー ハイライター
2
ハッキング
19
ハングアウト
2
ビデオチュートリアル
7
フィードバックとコミュニケーション
1
プロダクトエキスパート
1
マルウェア
9
モバイル
2
モバイルサイト
54
リッチカード
2
リッチスニペット
12
リッチリザルト
4
画像
3
画像検索
2
検索エンジン最適化
13
検索結果
85
構造化データ
25
国際化
4
再審査リクエスト
9
初級者向け
160
上級者向け
203
中級者向け
206
動画
1
アーカイブ
2020
11
9
8
7
6
5
4
3
2
1
2019
11
10
9
8
6
5
4
3
2
1
2018
12
11
10
7
6
5
4
3
2
1
2017
12
11
10
9
8
7
6
4
3
2
1
2016
12
11
9
8
7
6
5
4
3
2
1
2015
12
11
10
9
8
7
5
4
3
2
1
2014
12
11
10
9
8
7
6
5
4
3
2
1
2013
12
11
10
9
8
7
6
5
4
3
2
1
2012
12
11
10
9
8
7
6
5
4
3
2
1
2011
12
11
10
9
8
7
6
5
4
3
2
1
2010
12
11
10
9
8
7
6
5
4
3
2
1
2009
12
11
10
8
7
6
4
3
2
1
2008
12
Feed
Follow @googlewmc