Mecanismos de buscaNo capítulo anterior (Introdução aos sistemas de busca) foi apresentada uma idéia geral dos sistemas de busca, dos mecanismos de busca e dos diretórios. Neste capítulo, essas entidades serão apresentados com maior detalhamento. Vistos de uma forma simplificada, os mecanismos de busca têm três componentes principais: um programa de computador denominado robot, spider, crawler, wanderer, knowbot, worm ou web-bot. Aqui, vamos chamá-los indistintamente de robô. Esse programa "visita" os sites ou páginas armazenadas na web. Ao chegar em cada site, o programa robô "pára" em cada página dele e cria uma cópia ou réplica do texto contido na página visitada e guarda essa cópia para si. Essa cópia ou réplica vai compor a sua base de dados.
o segundo componente é a base de dados constituída das cópias efetuadas pelo robô. Essa base de dados, às vezes também denominada índice ou catálogo, fica armazenada no computador, também chamado servidor do mecanismo de busca.
o terceiro componente é o programa de busca propriamente dito. Esse programa de busca é acionado cada vez que alguém realiza uma pesquisa. Nesse instante, o programa sai percorrendo a base de dados do mecanismo em busca dos endereços - os URL - das páginas que contém as palavras, expressões ou frases informadas na consulta. Em seguida, os endereços encontrados são apresentados ao usuário.
Funções básicas de um sistema de busca.Esses três componentes estão estreitamente associados às três funções básicas de um sistema de busca: a análise e a indexação (ou "cópia") das páginas da web,
o armazenamento das "cópias" efetuadas e
a recuperação das páginas que preenchem os requisitos indicados pelo usuário por ocasião da consulta.
Para criar a base de dados de um mecanismo de busca, o programa robô sai visitando os sites da web. Ao passar pelas páginas de cada site, o robô anota os URL existentes nelas para depois ir visitar cada um desses URL. Visitar as páginas, fazer as cópias e repetir a mesma operação: cópia e armazenamento, na base de dados, do que ele encontrar nesses sites. Essa é uma das formas de um mecanismo de busca encontrar os sites na web. A outra maneira de o mecanismo de busca encontrar os sites na web é o "dono" do site informar, ao mecanismo de busca, qual o endereço, o URL, do site. Todos os mecanismos de buscas têm um quadro reservado para o cadastramento, submissão ou inscrição de novas páginas. É um hiperlink que recebe diversas denominações conforme o sistema de busca. Veja alguns exemplos.
Nome do hiperlink | Mecanismos de busca | Acrescente uma URL | | Cadastre a sua página no Radix | | Inserir site | |
Nos sites de língua inglesa, usam-se, geralmente, hiperlinks denominados List your site, Add URL ou Add a site.
Resumindo: num mecanismo de busca, um programa de computador visita as páginas da web e cria cópias dessas páginas para si. Essas cópias vão formar a sua base de dados que será pesquisada por ocasião de uma consulta. Alguns mecanismos de busca:
MOURA, Gevilacio Aguiar Coêlho de. Sistemas de busca da web: diretórios e mecanismos de busca. [online] Disponível na Internet via WWW. URL: http://www.quatrocantos.com/ tec_web/sist_busca/index.htm. Última atualização em 01 de janeiro de 2001.
| Sumário
Considerações gerais acerca da web
Introdução aos sistemas de busca
Mecanismos de busca
Diretórios
Mecanismos de busca e diretórios: características e diferenças
Utilizando os sistemas de busca: modos de pesquisa
Operadores booleanos
Pesquisa em um diretório
|