Google Caffeine: nuevo sistema de indexación en marcha

  • Por
La compañía propietaria del motor de búsqueda anuncia que tras un año de pruebas, ha completado su nuevo sistema de indexación con el que mejorar la experiencia al ofrecer resultados.
09/06/2010 - Google acaba de anunciar a través de su blog oficial que ya ha completado su nuevo sistema Caffeine con el que ofrecer resultados un 50% más actualizados para búsquedas web y de forma más rápida que lo que venía haciendo con su anterior motor de indexación.

Los objetivos del proyecto Caffeine se han centrado en mejorar la velocidad y precisión de los resultados de una búsqueda. Este nuevo sistema de indexación responde al incremento de contenidos que ha habido en Internet en los últimos años con la llegada de vídeos y tecnologías multimedia que han dado lugar a una mayor complejidad y riqueza de cada página y/o blog.

Aunque un usuario no perciba "aparentemente" ningún cambio, es interesante señalar que el índice anterior disponía de varias capas, algunas de las cuales se actualizaban a un ritmo más rápido que otros. La capa principal se actualizaba cada dos semanas aunque para hacerlo era necesario analizar toda la web, lo que significaba que había un retraso entre el momento en que Google encontraba una página y esta era puesta a disposición de los usuarios. Ahora con Caffeíne, se analiza la web en pequeñas porciones y se actualiza el índice de búsqueda de forma continua. A medida que nos encontramos páginas nuevas, o nuevas informaciones en las páginas existentes, podemos agregar estas directamente al índice, lo que se traduce en encontrar información un 50% más actualizada que con el indice anterior.

Para hacernos una idea, cada segundo Caffeine procesa cientos de miles de páginas en paralelo. Si se tratará de una pila de papel cada segundo crecería 5 kilometros de alto. El indice ocupa cerca de 100 millones de Gigabytes de almacenamiento en una base de datos y añade nueva información a una velocidad de cientos de miles de Gb por día.