Quatrocantos.com
Pesquisa personalizada
em Quatrocantos.com

Sistemas de busca da web: diretórios e mecanismos de busca

Gevilacio Aguiar Coêlho de Moura

 

Mecanismos de busca

No capítulo anterior (Introdução aos sistemas de busca) foi apresentada uma idéia geral dos sistemas de busca, dos mecanismos de busca e dos diretórios. Neste capítulo, essas entidades serão apresentados com maior detalhamento.

Vistos de uma forma simplificada, os mecanismos de busca têm três componentes principais:

Mecanismos de busca um programa de computador denominado robot, spider, crawler, wanderer, knowbot, worm ou web-bot. Aqui, vamos chamá-los indistintamente de robô. Esse programa "visita" os sites ou páginas armazenadas na web. Ao chegar em cada site, o programa robô "pára" em cada página dele e cria uma cópia ou réplica do texto contido na página visitada e guarda essa cópia para si. Essa cópia ou réplica vai compor a sua base de dados.

Mecanismos de busca o segundo componente é a base de dados constituída das cópias efetuadas pelo robô. Essa base de dados, às vezes também denominada índice ou catálogo, fica armazenada no computador, também chamado servidor do mecanismo de busca.

Mecanismos de busca o terceiro componente é o programa de busca propriamente dito. Esse programa de busca é acionado cada vez que alguém realiza uma pesquisa. Nesse instante, o programa sai percorrendo a base de dados do mecanismo em busca dos endereços - os URL - das páginas que contém as palavras, expressões ou frases informadas na consulta. Em seguida, os endereços encontrados são apresentados ao usuário.

 

Funções básicas de um sistema de busca.

Esses três componentes estão estreitamente associados às três funções básicas de um sistema de busca:
Mecanismos de busca a análise e a indexação (ou "cópia") das páginas da web,

Mecanismos de busca o armazenamento das "cópias" efetuadas e

Mecanismos de busca a recuperação das páginas que preenchem os requisitos indicados pelo usuário por ocasião da consulta.

Para criar a base de dados de um mecanismo de busca, o programa robô sai visitando os sites da web. Ao passar pelas páginas de cada site, o robô anota os URL existentes nelas para depois ir visitar cada um desses URL. Visitar as páginas, fazer as cópias e repetir a mesma operação: cópia e armazenamento, na base de dados, do que ele encontrar nesses sites. Essa é uma das formas de um mecanismo de busca encontrar os sites na web.

A outra maneira de o mecanismo de busca encontrar os sites na web é o "dono" do site informar, ao mecanismo de busca, qual o endereço, o URL, do site. Todos os mecanismos de buscas têm um quadro reservado para o cadastramento, submissão ou inscrição de novas páginas. É um hiperlink que recebe diversas denominações conforme o sistema de busca. Veja alguns exemplos.

Nome do hiperlink
Mecanismos de busca
Acrescente uma URL
Cadastre a sua página no Radix
Inserir site

Nos sites de língua inglesa, usam-se, geralmente, hiperlinks denominados List your site, Add URL ou Add a site.

Resumindo: num mecanismo de busca, um programa de computador visita as páginas da web e cria cópias dessas páginas para si. Essas cópias vão formar a sua base de dados que será pesquisada por ocasião de uma consulta.

Alguns mecanismos de busca:
Fast Search (All the Web)

Clique aqui para ver próximo capítulo. Ele aborda os diretórios.


MOURA, Gevilacio Aguiar Coêlho de. Sistemas de busca da web: diretórios e mecanismos de busca. [online] Disponível na Internet via WWW. URL: http://www.quatrocantos.com/ tec_web/sist_busca/index.htm. Última atualização em 01 de janeiro de 2001.

Sumário

Considerações gerais acerca da web

Introdução aos sistemas de busca

Mecanismos de busca

Diretórios

Mecanismos de busca e diretórios: características e diferenças

Utilizando os sistemas de busca: modos de pesquisa

Operadores booleanos

Pesquisa em um diretório


Todos os Direitos Reservados. © Copyright 1999 - 2012. Gevilacio Aguiar Coêlho de Moura. É vedado o uso comercial deste artigo e sua reprodução, no todo ou em parte, só é permitida mediante autorização expressa do autor. Não são permitidas a reprodução nem a manutenção deste artigo em sites, páginas da web e assemelhados.

Veja também Citações e Referências a Documentos Eletrônicos