●サイトマッププロトコルに従って作成
サイトマッププロトコルを使用すると、テキストファイルで作成した場合と異なり、サイトの最終更新日や更新頻度、URLの優先順位など詳細情報を含めることができます。 よって検索エンジンでサイトをより正確にクロールできるようになります。 Googleでもこの作成方法を最も推奨していますので、是非チャレンジしてください。
このサイトマッププロトコル形式は、".xml" タグで作成します。 また、ファイルはUTF-8エンコードで作成してください。 使用できるxmlタグは次のとおりです。
<urlset> ファイルの他のタグヲ囲み、現在のプロトコル標準を参照します。
<url> 各URLエントリの親タグです。その他のタグは、このタグ内に含めます。
<loc> ページのURLを表します。 ウェブサーバーによっては、httpなどのプロトコルから始め、末尾にスラッシュ(/)を含める必要があります。 この値は2048文字数以下で指定する必要があります。
<lastmod> ファイルの最終更新日を表します。 この日付はISO8601形式で記述します。 必要な場合は、時刻の部分を省略することも可能です。
<changefreq> ページの更新頻度を表します。 検索エンジンではこの値を参考情報として使用しますが、指定した頻度とは異なる頻度でクロールされることもあります。 使用できる値は次のとおりです。
・always ・hourly ・daily ・weekly ・monthly ・yearly ・never
neverはアーカイブページのURLに使用します。 このタグの値は、必ずしも指定したとおりになるわけではなく、あくまでもヒントとして使用されることに注意してください。 検索エンジンのクローラはこの情報を使用してクロール頻度を調整しますが、実際のクロールでは、hourlyというマークが付けられたページには1時間に1回以下、yearlyというマークが付けられたページには1年に1回以上クロールが行なわれます。 また、neverとマークされたページでも、予期せず変更された場合に備えて、定期的にクロールが行なわれます。 <priority> サイト内の他のURLと比較した時の、このURLの優先度を表します。 0.0から1.0まで値を指定でき、1.0が最優先の値になります。 この値は他のサイトのページとの比較ではなく、あくまでも自分のサイト内のページの優先度です。つまり、自分のサイト内の重要なページから順にクロールされるように指定するためのものです。 よって、検索結果の表示順やページランクには関係ありませんので注意してください。 検索エンジンではこの情報を使用して、自分のサイトのURLの中から重要なページを検索インデックスに優先的に登録することができます。
・<urlset>タグで始め、</urlset>タグで閉じます。 ・各URLに<url>エントリをxml親タグとして含めます。 ・各親タグ<url>に子エントリ<loc>を含めます。 ・上記に示した、<lastmod><changefreq><priority>の3つのタグはオプションタグです。つまり記載しなくても構いません。 実際に私も面倒くさいので記載していません。 ただし、それ以外のタグは必須ですので必ず記載してください。
次にサイトマッププロトコルで作成したサイトマップのサンプルを記載していますので、参考にしてください。 テーマ:Google関連 - ジャンル:コンピュータ
|