Portada Por Grete Pasch

Sistemas de búsqueda en Internet


Cuando el Web estaba en pañales, había relativamente pocos usuarios y no mucho que ver. Facilmente cada usuario agregaba en su homepage (la página inicial que se abre por default en su browser) una lista de las páginas que le interesaban. Fue entonces cuando Jerry Yang y David Filo, dos estudiantes de la universidad de Stanford, empezaron a compilar una lista de las mejores páginas. El producto de su esfuerzo es la empresa Yahoo, que produce uno de los directorios más populares de Internet, y que es un excelente punto de partida en su navegación por la red.

Yahoo es un directorio clasificado por temas, de manera similar a como está organizada una biblioteca. Pero, aquí empieza el problema: ¿cómo clasificar el conocimiento humano en una docena de categorías, sin ofender a nadie? Por ejemplo, las páginas sobre "cine" ¿deben aparecer bajo "arte" o bajo "entretenimiento"?

Yahoo depende del trabajo de docenas de catalogadores que deciden bajo qué categorías listar cada sitio. Pero dada la velocidad con la que está creciendo el Web, cada vez se hace más difícil contratar suficientes personas que visiten, revisen y clasifiquen cada página en cada sitio. Precisamente aquí es donde se ve la utilidad de dos tipos de programas especializados: los robots y los search engines (motores de búsqueda). Uno de los primeros robots que recorrieron la red fue "Lycos", el cual aún es muy utilizado. La información recolectada e indexada por un robot puede alcanzar docenas de gigabytes y, por lo tanto, para procesarla se requiere una alta capacidad computacional.

Las herramientas de búsqueda tienen su propia interfase, y usan diferentes comandos y notación. Aun así, podemos darle dos consejos que se aplican en todos los casos. Primero, invierta un poco de tiempo leyendo las instrucciones para realizar búsquedas avanzadas, Por ejemplo, HotBot permite restringir los resultados por fecha o por lenguaje de programación. Alta Vista ofrece la posibilidad de especificar búsquedas booleanas, y de especificar un nombre exacto. MetaCrawler tiene una búsqueda por región geográfica. Segundo, realice la misma búsqueda de información usando al menos dos herramientas, ya que es poco probable que dos sitios indexen exactamente los mismos recursos, o pruebe uno de los "superíndices" como MetaCrawler, que realiza búsquedas en varios índices a la vez.. Y recuerde que el mundo de Internet cambia constantemente.


Inicio Escríbanos a agg@guate.net
Julio de 1997