Otros formatos de sitemaps

  • Por
Ademas de xml podemos crear sitemaps en feed RSS y archivos de texto.
Es cierto que el formato más utilizado para la creación de sitemaps es XML pero existen otras dos formas distintas de crearlos. Son formas en los que se utilizan también ficheros de texto, pero con otras sintaxis, que pueden sernos útiles en ciertos casos o con los que quizás nos sintamos más a gusto trabajando. En el Manual de Sitemaps de DesarrolloWeb.com vamos a ver a continuación cuáles son estás otras maneras de producir los sitemaps, una es la creación de un sitemaps mediante un feed RSS y la otra es mediante un simple archivo de texto de sintaxis plana.

Sitemaps en formato de feed RSS

Este formato es fácil de utilizar si ya tenemos feed en nuestra página web, pero tiene un problema y es que de cara a buscadores no siempre va a mostrar todas las urls de tu página, ya que mostrará siempre las que se han actualizado recientemente.

La mecánica de construcción del archivo sería la misma que la de cualquier archivo feed, cuya sintaxis y características podemos ver en el Manual de RSS. Ahora bien, siempre debemos tener en cuenta que los motores de búsqueda se fijarían principalmente en el campo link y en el campo fecha.

Nota: si necestias más información sobre que es RSS te recomiendo que visites nuestra wiki, la categoria RSS, o nuestro directorio donde seguro encontraras todo lo necesario para profundizar en el tema de los Feed RSS.

Además es importante colocar el archivo en la raíz del dominio, para que los buscadores puedan rastrear todas las carpetas y URLs que hemos incluido en el sitemap.

Google tiene un sistema dentro de la zona de herramientas de webmaster que te permite subir tus feed para que Google los tenga encuenta como sitemaps.

Un ejemplo de feed preparado para actuar como sitemap seria el siguiente:

<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>Sitemap</title>
<link>http://www.dominio.com</link>
<description>Todas las urls de mi dominio</description>
<language>es-es</language>
<item>
   <title>Titulo pagina</title>
<description>Descripcion de la url</description>
<link>La url completa </link>
<pubDate>Wed, 21 Oct 2009 11:57:44 +0200</pubDate>
</item>
</channel></rss>

Sitemaps en archivo de texto con formato plano

Este formato es muy similar al que utilizamos para crear los robots.txt. Consiste básicamente en un archivo de texto plano en el que colocamos las urls, cada una en una fila, con la ruta completa (incluido el http://).

El archivo de texto solo puede contener URLs, estar codificado en UTF-8, contener como máximo 50,000 direcciones y no superar los 10 MB. Además no puede contener ni cabecera ni pie.

Puedes dar el nombre que quieras al archivo siempre y cuando cumpla con los estándar RFC-3986 para direcciones URI y al estándar RFC-3987 para direcciones IRI.

Y en cuanto a la ubicación, como en el resto de formatos disponibles para sitemaps, lo aconsejable es colocarlo en la raíz de nuestro dominio.

Un ejemplo de archivo de texto con las URL del sitio, en formato válido para utilizar como sitemap, seria simplemente esto:

http://www.dominio.com/pagina.html
hhtp://www.dominio.com/pagina2.html
http://www.dominio.com/carpeta/pagina.html

Conclusión sobre formatos de sitemap

En definitiva, yo considero que de los tres formatos el más adecuado es el archivo XML, ya que en el caso del feed no siempre se van a rastrear todas las páginas (por ser un archivo que almacena las novedades del sitio). En el caso del archivo de texto, considero que es demasiado pesado de construir, ya que tenemos que ir linea por linea escribiendo todas las URLs. Si se trata de una web con poco contenido no es una tarea muy complicada pero si se trata de una web con mucho contenido posiblemente nos llevaría demasiado tiempo, incluso tendríamos que construir más de un archivo. No obstante, también tenemos que tener en cuenta la posibilidad de crear el archivo del sitemap de manera automatizada, con algún script, pero esto lo dejamos para más adelante.

En el siguiente artículo hablaremos de la ubicación en nuestro dominio de dichos archivos sitemaps.