アクセスアップ・SEO対策・検索エンジン登録
サーチエンジンに登録!
GoogleやYahoo!などの

検索エンジン(検索サイト)に
登録する方法

初心者向けホームページ作成支援のページです。
私が調べた方法や、参考にさせてもらったサイトを紹介しています。
お役に立てていただけると嬉しいです。
ホームページ売上アップ診断+オリジナルSEO対策ツールで売上アップ!
ホームページ売上アップ診断+オリジナルSEO対策ツールで売上アップ!

サイトマッププロトコルに従って作成する  
サイトマッププロトコルを使用すると、テキストファイルで作成した場合と異なり、サイトの最終更新日更新頻度、URLの優先順位など詳細情報を含めることができます。
よって検索エンジンでサイトをより正確にクロールできるようになります。
Googleでもこの作成方法を最も推奨していますので、是非チャレンジしてください。

このサイトマッププロトコル形式は、".xml" タグで作成します。
また、ファイルはUTF-8エンコードで作成してください。

使用できるxmlタグは次のとおりです。

<urlset>
ファイルの他のタグヲ囲み、現在のプロトコル標準を参照します。
<url>
各URLエントリの親タグです。その他のタグは、このタグ内に含めます。
<loc>
ページのURLを表します。
ウェブサーバーによっては、httpなどのプロトコルから始め、末尾にスラッシュ(/)を含める必要があります。
この値は2048文字数以下で指定する必要があります。
<lastmod>
ファイルの最終更新日を表します。
この日付はISO8601形式で記述します。
必要な場合は、時刻の部分を省略することも可能です。
<changefreq>
ページの更新頻度を表します。
検索エンジンではこの値を参考情報として使用しますが、指定した頻度とは異なる頻度でクロールされることもあります。
使用できる値は次のとおりです。

・always
・hourly
・daily
・weekly
・monthly
・yearly
・never

neverはアーカイブページのURLに使用します。
このタグの値は、必ずしも指定したとおりになるわけではなく、あくまでもヒントとして使用されることに注意してください。
検索エンジンのクローラはこの情報を使用してクロール頻度を調整しますが、実際のクロールでは、hourlyというマークが付けられたページには1時間に1回以下、yearlyというマークが付けられたページには1年に1回以上クロールが行なわれます。
また、neverとマークされたページでも、予期せず変更された場合に備えて、定期的にクロールが行なわれます。

<priority>
サイト内の他のURLと比較した時の、このURLの優先度を表します。
0.0から1.0まで値を指定でき、1.0が最優先の値になります。
この値は他のサイトのページとの比較ではなく、あくまでも自分のサイト内のページの優先度です。つまり、自分のサイト内の重要なページから順にクロールされるように指定するためのものです。
よって、検索結果の表示順やページランクには関係ありませんので注意してください。
検索エンジンではこの情報を使用して、自分のサイトのURLの中から重要なページを検索インデックスに優先的に登録することができます。

・<urlset>タグで始め、</urlset>タグで閉じます。
・各URLに<url>エントリをxml親タグとして含めます。
・各親タグ<url>に子エントリ<loc>を含めます。
・オレンジ色で示した、
<lastmod><changefreq><priority>の3つのタグはオプションタグです。つまり記載しなくても構いません。
実際に私も面倒くさいので記載していません。
ただし、それ以外のタグは必須ですので必ず記載してください。

<エンティティのエスケープ処理>

サイトマップファイルはUTF-8エンコードで作成する必要があります。
URLなどのデーター値内に次の文字が含まれている場合は、エスケープコードに置き換えて使用してください。

文字 エスケープ コード
アンバサド & &amp;
一重引用符 ' &apos;
二重引用符 " &quot;
不等記号 (より大) > &gt;
不等記号 (より小) < &lt;

<xmlサイトマップのサンプル>

次に、xml形式のサイトマップの例を示します。
このサイトマップはここのサイトのいくつかのページのURLを含めたものです。
(なんならこのままコピペをして、URLと日付、更新頻度、優先順位などの指定を変えて使用しちゃってください!)

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://beginnertop.web.fc2.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner2.htm</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner6.htm</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner7.htm</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://beginnertop.web.fc2.com/beginner4.htm</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>

・xmlファイルはUTF-8エンコードで作成してください。
これはファイルを保存するときにUTF-8エンコードを指定して保存してください。
例えばメモ帳では、「名前を付けて保存」ダイアログボックスの「文字コード」メニューから選択することができます。
また、上記がない場合はタスクバーの「編集」→「フォントの設定」でフォントを「Times New Roman」(欧文)に指定してから普通にファイルを保存しても構いません。

・xmlファイルには上記以外の情報を含めることはできません。(含めてしまうとエラーになり、Googlebotがクロールできなくなります。)

・xmlファイルを保存する時、名前は自由に設定して構いません。ファイルの拡張子は ".xml" とします。(わかりやすく "sitemap.xml" などとすれば良いと思います。)

・xmlファイルは検索エンジンでクロールさせたい最上位のディレクトリにアップロードしてください。
xmlファイル内にはこのディレクトリより上位にあるURLを含めてはいけません。(エラーになります。)

例えばこのサイトのトップページのURLはhttp://beginnertop.web.fc2.com/です。
そしてここのページのURLはhttp://beginnertop.web.fc2.com/beginner10.htmです。

すなわちここのサイトの最上位ディレクトリはhttp://beginnertop.web.fc2.com/であると言えます。

このサイト内のほかのページも見てもらえば分かると思いますが、URLは必ずhttp://beginnertop.web.fc2.com/○○○○〜などの形になっています。
ここで作成したサイトマップを最上位のディレクトリにアップロードするとは、サイトマップのURLがhttp://beginnertop.web.fc2.com/で始まるURLにしてください。
つまり、http://beginnertop.web.fc2.com/sitemap.xmlなどのURLにしてくださいということです。

※xmlファイルで作成した場合、スペースや無駄な改行もエラーになりますので注意してください。

方法としては、上記の方法でサイトマップを作成し、どこかのページから、あるいはページへリンクさせるわけではなく単独で、作成したホームページを保存しているファイルと同じファイル内に保存します。
FTP送信などでページをアップロードするときに、保存したxmlファイルのページも一緒にアップロードしてください。

これで完了です。
また、ちゃんとアップロードできたかどうかを、URL入力をしてみて作成したサイトマップが表示されるかどうか、確かめてみるものいいと思います。

→●サイトマップをテキストファイルで作成する
→●
Googleサイトマップへ登録