学ぶ AIボットのクロール可能性とインデックス作成

メニューを表示するにはスワイプしてください

これまでに、オーソリティシグナル、コンテンツ品質、スキーママークアップ、プロンプトマッチングについて説明しましたが、AIクローラーが実際にコンテンツへアクセスできなければ意味がありません。技術的アクセシビリティは前提となる層です。華やかさはなく、戦略というより保守作業のように感じられるため、しばしば軽視されがちです。しかし、AIクローラーをブロックしたり、ボットが読み取れない方法でコンテンツを表示したりするサイトは、コンテンツの品質に関係なく、引用の対象から完全に外れてしまいます。

注意

技術的クロール可能性は競争優位性ではなく、参加のための最低条件です。正しく設定しても引用されやすくなるわけではありませんが、誤ると引用は不可能になります。

主要なAI検索プラットフォームごとに独自のクローラーがあり、固有のユーザーエージェント文字列で識別されます。これらは従来の検索ボットとは異なり、GooglebotやBingbotに与えられた権限を自動的に継承しません。robots.txtがAIクローラーに対応するよう更新されていない場合、知らないうちに一部のAIクローラーをブロックしている可能性があります。

robots.txt コンフィギュレーター

User-agent: *
Allow: /

# Traditional search bots
User-agent: Googlebot
Allow: /

User-agent: Bingbot
Allow: /

# ChatGPT Search
User-agent: GPTBot
Allow: /

# Perplexity
User-agent: PerplexityBot
Allow: /

# Gemini / AI Overviews
User-agent: Google-Extended
Allow: /

# Copilot / ChatGPT (Bing)
User-agent: OAI-SearchBot
Allow: /

技術的クロール可能性チェックリスト

robots.txt 以外にも、AI ボットがコンテンツを正しく読み取りインデックスできるかどうかを決定する技術的要素がいくつか存在します。このチェックリストは全体的な範囲を網羅しています：

robots.txt ですべての AI クローラーを許可;
コンテンツがサーバーレンダリングまたは静的レンダリングされている;
ページがインデックス可能（主要コンテンツに noindex メタタグがない）;
XML サイトマップが最新で提出済み;
ボットトラフィックをブロックする過度なレート制限がない;
カノニカル URL が一貫している;
主要コンテンツがログインやペイウォールの背後に隠れていない。

AI の読み取りを妨げるレンダリングの落とし穴

すべて明確でしたか？

フィードバックありがとうございます！

セクション 1. 章 9

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1. 章 9