Explicamos cómo crear un archivo sitemap sin ninguna ayuda de programas, simplemente escribiendo su código con el lenguaje XML.
Es bastante sencillo de crear pero si tu página tiene bastantes URLs que colocar en el archivo, se puede hacer bastante pesado por lo que recomendaría utilizar algún programa o script para hacerlo de una forma más rápida. Esto lo veremos en artículos sucesivos.
Bueno, pues vamos a empezar por crear un archivo con extensión .xml, por ejemplo sitemaps.xml y lo colocamos en la raíz de nuestro dominio o sitio web. Quedaría en una URL parecida a esta:
http://www.dominio.com/sitemaps.xml
En artículos posteriores hablaremos más detenidamente sobre la ubicación de estos archivos.
Una vez creado el archivo nos metemos de lleno en la sintaxis y el esqueleto del archivo.
Para empezar todo archivo de sitemap tiene que empezar con las siguientes lineas, que especifican el tipo de documento, juego de caracteres y el formato que vamos a utilizar.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Además tiene que terminar con estas otras lineas.
</urlset>
Con esto ya tenemos el esqueleto y podemos empezar a ir metiendo las URLs de cada una de las páginas de nuestro sitio. Para ello tenemos que colocar la etiqueta
Dentro de esta etiqueta podemos poner varias cosas, pero sólo una de ellas es obligatoria, el resto son opcionales y ayudan a aportar información de interés al motor de búsqueda o araña del buscador.
El esquema principal de la creación de esta etiqueta es el siguiente:
<url>
<loc>http://www.dominio.es/</loc>
<lastmod>2005-01-01</lastmod>
<changefreg>monthly </changefreg>
<priority>0.8</priority>
</url>
De todas las opciones escritas anteriormente la única obligatoria es la etiqueta <loc> que es la que nos dice la URL. Esta URL debe comenzar con el protocolo http y acabar con una barra diagonal (/). Este valor debe contener menos de 2.048 caracteres.
La siguiente etiqueta (<lastmod>) nos informa de la fecha de la ultima modificación del archivo. Debe estar escrito con el siguiente formato:
AAAA-MM-DD
Después podemos poner la etiqueta <changefreg> que nos informa de la frecuencia con la que puede cambiar esta página. Acepta los siguientes valores, que no siempre pueden coincidir con la frecuencia real, pero que debería aproximarse lo más posible:
- always (siempre)
- hourly (cada hora)
- daily (diariamente)
- weekly (semanalmente)
- monthly (mensualmente)
- yearly (anualmente)
- never (nunca)
Tenemos que tener presente que esta etiqueta es opcional y, aunque tú pongas que una pagina se actualiza diariamente no implica que los rastreadores vayan a pasar todos los días por ella. Esta etiqueta la toman los rastreadores como una sugerencia a la hora de decidir cada cuanto tiempo rastrear la página.
Por ultimo podemos añadir la etiqueta <priority> que nos permite crear un indice de prioridad para nuestras páginas. El rango esta entre 0.0 y 1. Pero ojo con esta etiqueta, ya que por poner un 1 a todas las páginas no nos servirá de mucho, ya que los rastreadores no lo tomarán en cuenta.
Bueno con esto ya tenemos toda la sintaxis de nuestro archivo xml. Os dejo un pequeño ejemplo de como quedaría un archivo construido para un par de URL.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.dominio.es/</loc>
<lastmod>2005-01-01</lastmod>
<changefreg>daily</changefreg>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.dominio.es/articulos/redactar.php</loc>
<lastmod>2009-01-02</lastmod>
<changefreg> daily </changefreg>
<priority>0.2</priority>
</url>
</urlset>
En el siguiente artículo veremos como crear un archivo XML que sea un indice de sitemaps.