robots.txt
検索エンジンのクローラーにクロールを許可・禁止するURLを指示するテキストファイル。サイトルートに設置し、管理画面や重複コンテンツのインデックスを防ぐ。
robots.txtとは?
robots.txtは、Webサーバーのルートディレクトリに設置するテキストファイルです。Googlebot等のクローラーに「どのURLをクロールしてよいか・してはいけないか」を伝えます。
基本的な書き方
User-agent: *
Disallow: /admin/
Disallow: /private/
Allow: /
Sitemap: https://example.com/sitemap.xml
- User-agent: 対象クローラー(
*は全クローラー) - Disallow: クロール禁止のパス
- Allow: Disallowより優先して許可するパス
よくある用途
| 用途 | 設定例 |
|---|---|
| 管理画面を隠す | Disallow: /admin/ |
| 検索結果ページを除外 | Disallow: /search? |
| 全クロール禁止(開発中) | Disallow: / |
| XMLサイトマップを伝える | Sitemap: https://example.com/sitemap.xml |
注意点
- robots.txtはクローラーへの「お願い」であり強制力はない(悪意あるボットは無視する)
- インデックスを確実に防ぐには
noindexメタタグまたはX-Robots-Tagヘッダーを使う - 誤ってサイト全体をDisallowするとSEOに壊滅的な影響を与える
まとめ
robots.txtはシンプルですが、設定ミスがSEO事故につながることがあります。変更後はGoogle Search ConsoleのURLテストツールで動作確認を必ず行いましょう。
関連する用語 (Webマーケティング)
全45件を見るバウンス率(直帰率)
サイトに訪問して1ページだけ閲覧し離脱した訪問者の割合。高いバウンス率は「コンテンツと訪問者の意図のミスマッチ」を示すことが多い。
構造化データ(schema.org)
Googleなどの検索エンジンがページ内容を正確に理解するためのマークアップ。JSON-LD形式で記述し、リッチスニペット表示やナレッジパネルへの反映に活用される。
IT用語: ヒートマップとは|ユーザーの行動を色で可視化する分析ツール
Webページのどこがクリックされ・どこまで読まれているかを色で可視化するヒートマップ分析ツールを解説。
リッチスニペット(リッチリザルト)
通常の青リンク+説明文に加えて、評価スター・FAQ・パンくずリスト等が表示された検索結果。構造化データを実装することで獲得でき、CTR向上に直結する。
ドメインパワー
Googleなどの検索エンジンが、そのWebサイト(ドメイン)に対して持っている「信頼度」や「権威性」の強さを示す概念・数値。
バックリンク(被リンク)
外部サイトから自サイトへ向けられたリンク。SEOにおいて被リンクの質と量はドメインの信頼性・権威性を高める重要なシグナルとなる。