サイトマッププロトコルを使用すると、テキストファイルで作成した場合と異なり、サイトの最終更新日や更新頻度、URLの優先順位など詳細情報を含めることができます。
よって検索エンジンでサイトをより正確にクロールできるようになります。
Googleでもこの作成方法を最も推奨していますので、是非チャレンジしてください。このサイトマッププロトコル形式は、".xml"
タグで作成します。
また、ファイルはUTF-8エンコードで作成してください。
使用できるxmlタグは次のとおりです。
<urlset>
|
ファイルの他のタグヲ囲み、現在のプロトコル標準を参照します。 |
<url>
|
各URLエントリの親タグです。その他のタグは、このタグ内に含めます。 |
<loc>
|
ページのURLを表します。
ウェブサーバーによっては、httpなどのプロトコルから始め、末尾にスラッシュ(/)を含める必要があります。
この値は2048文字数以下で指定する必要があります。 |
<lastmod>
|
ファイルの最終更新日を表します。
この日付はISO8601形式で記述します。
必要な場合は、時刻の部分を省略することも可能です。 |
<changefreq>
|
ページの更新頻度を表します。
検索エンジンではこの値を参考情報として使用しますが、指定した頻度とは異なる頻度でクロールされることもあります。
使用できる値は次のとおりです。・always
・hourly
・daily
・weekly
・monthly
・yearly
・never
neverはアーカイブページのURLに使用します。
このタグの値は、必ずしも指定したとおりになるわけではなく、あくまでもヒントとして使用されることに注意してください。
検索エンジンのクローラはこの情報を使用してクロール頻度を調整しますが、実際のクロールでは、hourlyというマークが付けられたページには1時間に1回以下、yearlyというマークが付けられたページには1年に1回以上クロールが行なわれます。
また、neverとマークされたページでも、予期せず変更された場合に備えて、定期的にクロールが行なわれます。
|
<priority>
|
サイト内の他のURLと比較した時の、このURLの優先度を表します。
0.0から1.0まで値を指定でき、1.0が最優先の値になります。
この値は他のサイトのページとの比較ではなく、あくまでも自分のサイト内のページの優先度です。つまり、自分のサイト内の重要なページから順にクロールされるように指定するためのものです。
よって、検索結果の表示順やページランクには関係ありませんので注意してください。
検索エンジンではこの情報を使用して、自分のサイトのURLの中から重要なページを検索インデックスに優先的に登録することができます。 |
・<urlset>タグで始め、</urlset>タグで閉じます。
・各URLに<url>エントリをxml親タグとして含めます。
・各親タグ<url>に子エントリ<loc>を含めます。
・オレンジ色で示した、<lastmod><changefreq><priority>の3つのタグはオプションタグです。つまり記載しなくても構いません。
実際に私も面倒くさいので記載していません。
ただし、それ以外のタグは必須ですので必ず記載してください。
<エンティティのエスケープ処理>
サイトマップファイルはUTF-8エンコードで作成する必要があります。
URLなどのデーター値内に次の文字が含まれている場合は、エスケープコードに置き換えて使用してください。
| 文字 |
エスケープ
コード |
| アンバサド |
& |
& |
| 一重引用符 |
' |
' |
| 二重引用符 |
" |
" |
| 不等記号
(より大) |
> |
> |
| 不等記号
(より小) |
< |
< |
<xmlサイトマップのサンプル>
次に、xml形式のサイトマップの例を示します。
このサイトマップはここのサイトのいくつかのページのURLを含めたものです。
(なんならこのままコピペをして、URLと日付、更新頻度、優先順位などの指定を変えて使用しちゃってください!)
<?xml
version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://beginnertop.web.fc2.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner2.htm</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner6.htm</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner7.htm</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner4.htm</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
・xmlファイルはUTF-8エンコードで作成してください。
これはファイルを保存するときにUTF-8エンコードを指定して保存してください。
例えばメモ帳では、「名前を付けて保存」ダイアログボックスの「文字コード」メニューから選択することができます。
また、上記がない場合はタスクバーの「編集」→「フォントの設定」でフォントを「Times
New Roman」(欧文)に指定してから普通にファイルを保存しても構いません。
・xmlファイルには上記以外の情報を含めることはできません。(含めてしまうとエラーになり、Googlebotがクロールできなくなります。)
・xmlファイルを保存する時、名前は自由に設定して構いません。ファイルの拡張子は
".xml"
とします。(わかりやすく "sitemap.xml"
などとすれば良いと思います。)
・xmlファイルは検索エンジンでクロールさせたい最上位のディレクトリにアップロードしてください。
xmlファイル内にはこのディレクトリより上位にあるURLを含めてはいけません。(エラーになります。)
例えばこのサイトのトップページのURLはhttp://beginnertop.web.fc2.com/です。
そしてここのページのURLはhttp://beginnertop.web.fc2.com/beginner10.htmです。
すなわちここのサイトの最上位ディレクトリはhttp://beginnertop.web.fc2.com/であると言えます。
このサイト内のほかのページも見てもらえば分かると思いますが、URLは必ずhttp://beginnertop.web.fc2.com/○○○○〜などの形になっています。
ここで作成したサイトマップを最上位のディレクトリにアップロードするとは、サイトマップのURLがhttp://beginnertop.web.fc2.com/で始まるURLにしてください。
つまり、http://beginnertop.web.fc2.com/sitemap.xmlなどのURLにしてくださいということです。
※xmlファイルで作成した場合、スペースや無駄な改行もエラーになりますので注意してください。
方法としては、上記の方法でサイトマップを作成し、どこかのページから、あるいはページへリンクさせるわけではなく単独で、作成したホームページを保存しているファイルと同じファイル内に保存します。
FTP送信などでページをアップロードするときに、保存したxmlファイルのページも一緒にアップロードしてください。
これで完了です。
また、ちゃんとアップロードできたかどうかを、URL入力をしてみて作成したサイトマップが表示されるかどうか、確かめてみるものいいと思います。
→●サイトマップをテキストファイルで作成する
→●Googleサイトマップへ登録
|