¿Para que sirve un sitemap? Crear un Sitemap para posicionar nuestra web

Hoy en día sabemos la importancia de posicionar nuestra web en buscadores, de nada sirve aparecer en la página 100 de Google, Yahoo o Bing, ni tan siquiera la 4ª o 5ª página nos ofrece un rendimiento óptimo para nuestra web, hay que estar en las primeras posiciones, cuanto más cerca de la primera posición, más visitas obtendremos.

Esto es así, y para conseguirlo, primero debemos de comprender como funcionan los buscadores para ayudarlos en su busqueda.

De una forma muy simplificada, los buscadores rastrean nuestra web, enlace por enlace, y siguiendo enlaces uno por uno, y así, hasta crear un mapa de nuestra sitio web, estos bots son llamados arañas.

Pero hay una manera de ayudarlos a esta tarea, y es utilizando un sitemap. De esta manera es más facil que nos indexen más cantidad de páginas.

Para crear un sitemap, debemos seguir unas determinadas reglas, el formato más usual es en formato txt o xml, en Google he utilizado para páginas simples el txt y me ha ido correctamente, pero para páginas más complejas como por ejemplo ver tutoriales, utilizo el formato en xml (aparte de usar un generador para ahorrarme el trabajo).

Vamos al turrón! voy a poner un ejemplo y lo comento.

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.vertutoriales.com/</loc>

</url>

<url>

<loc>http://www.vertutoriales.com/tutoriales-sitemap.html</loc>

</url>

</urlset>

Vamos a ver que estamos declarando y para que sirve:

  • El xml version sirve para declarar que tipo de xml estamos utilizando, por defecto el UTF-8
  • En el urlset declaramos el protocolo que vamos a utilizar, en este caso el 0.9
  • Con el <url> contendrá además de la URL, los diferentes parametros.
  • Con el <loc> declaramos la URL en cuestión, es lo mínimo que contendrá la etiqueta <url>.

En este ejemplo anterior, hemos declarado 2 urls sin ningún parámetro adicional, estos valores son los indispensables para un sitemap.xml pero podemos utilizar algunas opciones que vemos a continuación:

<lastmod>Fecha</lastmod>

Esta fecha será la última modificación de la página que tengamos dentro de <url>. El formato de fecha es AAAA-MM-DD, por tanto el 22 de diciembre de 1982 será 1982-12-22.

<changefrec>Frecuencia</changefrec>

Sirve para decirle a la araña la frecuencia con la que ha de visitar el sitio. Es orientativo, por lo que no debe cumplirse forzosamente.

Frecuencia puede tomar alguno de estos 7 valores:

  1. always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas),
  2. hourly (a cada hora).
  3. daily (diariamente).
  4. weekly (semanalmente).
  5. monthly (mensualmente).
  6. yearly (anualmente).
  7. never (nunca, típicamente para páginas archivadas).

<priority>Prioridad</priority>

Sirve para darle una prioridad con respecto a las demás urls del sitio. Aunque en realidad no he podido probar la relevancia que puede tener el cambio de valor de prioridad, suelo ponerlo orientativamente. Los valores que puede tomar van desde 0 y 1, donde 0 es lo mínimo y 1 lo máximo, por defecto toma el valor 0.5.

Os pongo un ejemplo para que vayais viendo como quedaría, vamos a tomar el mismo ejemplo de arriba y lo modificamos, quedaría así:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.vertutoriales.com/</loc>

<lastmod>2009-12-22</lastmod>

<changefrec>dailychangefrec>

<priority>1</priority>

</url>

<url>

<loc>http://www.vertutoriales.com/tutorial-sitemap.htm</loc>

<lastmod>2009-12-26</lastmod>

<changefrec>yearly</changefrec>

<priority>0.3</priority>

</url>

</urlset>

Con esto tendríamos un archivo sitemap.xml preparado para subirlo a nuestro servidor y a continuación enviarlo a las herramientas que nos ofrecen los diversos buscadores.

Comentar que si el sitemap contiene todas las urls de nuestro sitio, ha de estar alojado en la carpeta raiz del sitio, de manera que si tenemos http://www.vertutoriales.com/tutoriales/sitemap.xml, la araña no puede reconocer el directorio contenedor, y no podrá acceder a ttp://www.vertutoriales.com/. Por eso tened cuidado con el sitio donde alojais vuestro sitemap.xml y donde apunta.

Como os he comentado y para terminar, una vez subido el sitemap, solo quedaría mandarselo a los buscadores, para Google sería en Google Webmaster Tools, para Yahoo accedemos desde Yahoo Site explorer, para Bing desde http://www.bing.com/webmaster/

Espero que os sea util esta información y la pongais en práctica, ya que ayuda a actualizar nuestra web en el buscador mucho más rápido. Digo más rápido, por que normalmente las arañas hacen bien su trabajo y aún sin tener el sitemap, terminan rastreando nuestra web sin problema. Pero mejor tenerlo actualizado!.

Y nada más, si tenéis alguna duda podéis dejar algún comentario en el post o escribirme la duda en el siguiente link donde respondo a preguntas dentro de mis conocimientos 😉

Un saludo!

Te puede interesar: