Ademas de xml podemos crear sitemaps en feed RSS y archivos de texto.
Sitemaps en formato de feed RSS
Este formato es fácil de utilizar si ya tenemos feed en nuestra página web, pero tiene un problema y es que de cara a buscadores no siempre va a mostrar todas las urls de tu página, ya que mostrará siempre las que se han actualizado recientemente.La mecánica de construcción del archivo sería la misma que la de cualquier archivo feed, cuya sintaxis y características podemos ver en el Manual de RSS. Ahora bien, siempre debemos tener en cuenta que los motores de búsqueda se fijarían principalmente en el campo link y en el campo fecha.
Además es importante colocar el archivo en la raíz del dominio, para que los buscadores puedan rastrear todas las carpetas y URLs que hemos incluido en el sitemap.
Google tiene un sistema dentro de la zona de herramientas de webmaster que te permite subir tus feed para que Google los tenga encuenta como sitemaps.
Un ejemplo de feed preparado para actuar como sitemap seria el siguiente:
<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>Sitemap</title>
<link>http://www.dominio.com</link>
<description>Todas las urls de mi dominio</description>
<language>es-es</language>
<item>
<title>Titulo pagina</title>
<description>Descripcion de la url</description>
<link>La url completa </link>
<pubDate>Wed, 21 Oct 2009 11:57:44 +0200</pubDate>
</item>
</channel></rss>
Sitemaps en archivo de texto con formato plano
Este formato es muy similar al que utilizamos para crear los robots.txt. Consiste básicamente en un archivo de texto plano en el que colocamos las urls, cada una en una fila, con la ruta completa (incluido el http://).El archivo de texto solo puede contener URLs, estar codificado en UTF-8, contener como máximo 50,000 direcciones y no superar los 10 MB. Además no puede contener ni cabecera ni pie.
Puedes dar el nombre que quieras al archivo siempre y cuando cumpla con los estándar RFC-3986 para direcciones URI y al estándar RFC-3987 para direcciones IRI.
Y en cuanto a la ubicación, como en el resto de formatos disponibles para sitemaps, lo aconsejable es colocarlo en la raíz de nuestro dominio.
Un ejemplo de archivo de texto con las URL del sitio, en formato válido para utilizar como sitemap, seria simplemente esto:
http://www.dominio.com/pagina.html
hhtp://www.dominio.com/pagina2.html
http://www.dominio.com/carpeta/pagina.html
Conclusión sobre formatos de sitemap
En definitiva, yo considero que de los tres formatos el más adecuado es el archivo XML, ya que en el caso del feed no siempre se van a rastrear todas las páginas (por ser un archivo que almacena las novedades del sitio). En el caso del archivo de texto, considero que es demasiado pesado de construir, ya que tenemos que ir linea por linea escribiendo todas las URLs. Si se trata de una web con poco contenido no es una tarea muy complicada pero si se trata de una web con mucho contenido posiblemente nos llevaría demasiado tiempo, incluso tendríamos que construir más de un archivo. No obstante, también tenemos que tener en cuenta la posibilidad de crear el archivo del sitemap de manera automatizada, con algún script, pero esto lo dejamos para más adelante.En el siguiente artículo hablaremos de la ubicación en nuestro dominio de dichos archivos sitemaps.