TOP 投稿 過去ログ 管理用 RSS RDF

XMLファイルに「”」「’」「<」「>」「&」を書いたらエラーになる

URL:http://ykr414.com/xml/error.html
半角の「"」「'」「<」「>」「&」を記述した場合、
ブラウザで表示させると「セミコロン(;)が必要です。」というエラーになります。
それぞれをエンティティで表記する必要があるみたいです。

「"」⇒「&#34;」
「'」⇒「&#39;」
「<」⇒「&#60;」
「>」⇒「&#62;」
「&」⇒「&#38;」
※それぞれ半角で記述するとエンティティとなる。

Googleなどの検索エンジン用に、Sitemapを手作業で書いているとエラーが発生していました。
自動で抽出するツールの動作がよろしくなかったので、ページから正規表現の置換を駆使して同じサーバ内のリンク先だけを抽出し、DBに貼り付けて重複を削除、キーワードを入力しているところはエンティティ化して保存しておいたのですよ。

sitemaps.org - プロトコル
sitemaps.orgのプロトコルを見ると、「&」は「&amp;」で書くようになってますね。
Googleのサイトマップの説明もそうなっているような感じです。
「&」⇒「&amp;」
「'」⇒「&apos;」
「"」⇒「&quot;」
「<」⇒「&gt;」
「>」⇒「&lt;」