Un sistema buscador, realizado en PHP y MySQL, que es capaz de indexar contenidos de uno o varios sitios web, ofrecer resultados ordenados por importancia y configurarse para diversos usos o diseños.
En este artículo vamos a presentar Blasten blt-SEARCH, un sistema de búsqueda e indexación de contenidos escrito en PHP y que utiliza base de datos MySQL. Se trata de un producto gratuito y con interesantes posibilidades, que se muestra muy útil para proveer de herramientas búsqueda dentro de nuestro sitio web, o de otras páginas.
Una de las partes fundamentales de blt-SEARCH es un sistema escaneador de enlaces, que pondera los resultados por importancia y que permite ordenar al instante todos los enlaces encontrados en la búsqueda. Para ello calcula la similitud entre el criterio buscado y los contenidos indexados, basándose en la importancia de la página y consigue asignar una posición adecuada, acorde a la cantidad de enlaces referidos durante el proceso de indexación.
A la hora de indexar los contenidos de los sitios web, es capaz es excluir ciertas URL que superen una cantidad dada de parámetros enviados a través de HTTP-GET. Si así lo deseamos, también puede eliminar parámetros sin necesidad de suprimir la exploración a esa página. Lo que se traduce en una gran ventaja para sitios generados dinámicamente a través de cualquier tecnología. Asimismo puede iniciar conexiones a páginas de acceso restringido con autentificación HTTP.
Tiene también capacidad para denegar el seguimiento de enlaces a determinados dominios indicados por usted, o denegar todos.
Dispone de otras características adicionales. Entre las que cabría destacar:
- Una biblioteca de funciones, que permiten obtener información confidencial de cada documento indexado, que son utilizadas por blt-SEARCH para generar resultados.
- La posibilidad de obtener resultados aún mucho más específicos y avanzados, buscado en URLS definidas por el usuario.
- Arroja sugerencias totalmente exactas y efectivas cuando no sea encontrado con exactitud un criterio en la base de datos
- Se pueden definir una serie de palabras comunes para excluirlas en las búsquedas, lo que mejora su efectividad
- Es capaz de leer todos los metas tags y robots.txt de las páginas a indexar y trabajar acorde a lo que ellos indiquen.
- Indexa también la totalidad de los marcos flotantes interpretados a través de las etiquetas <frame> e <iframe> respectivamente.
- Puede mostrar un mapa de todo el sitio web explorado y los elementos que lo constituyen.
- Es posible indexar sitios personales individuales o múltiples.
- No solo indexa páginas web, sino también imágenes en formatos (Jpeg, Gif, Png y Wbmp), de las que extrae información como el tamaño de la imagen, dimensiones, formato, Url, etc.
A la hora de mostrar los resultados, es posible configurar una serie de opciones y parámetros, para adaptarlos a las necesidades de cada sitio web.
Conclusión
No cabe duda que los sistemas de búsqueda son una parte importante dentro de sitios web grandes. blt-SEARCH nos facilita la tarea de encontrar contenidos de forma rápida y precisa, y eso es muy de agradecer. Este sistema es gratuito y adaptable a muchos casos distintos, por lo que seguro que puede resultar muy útil a los administradores de sitios web.
Se puede obtener más información en la
página del producto o en su
área de documentación.
Imagen de una de las pantallas del sistema