Quatrocantos.com
Pesquisa personalizada
em Quatrocantos.com

Sistemas de busca da web: diretórios e mecanismos de busca

Gevilacio Aguiar Coêlho de Moura

 

Diretórios

No capítulo anterior, foram abordados os mecanismos de busca. Agora é a vez dos diretórios.

Um diretório tem dois componentes principais:

diretório 1 uma base de dados, também chamada de índice ou catálogo e

diretório 2 um programa de computador que faz a pesquisa na base de dados.

A montagem ou criação da base de dados de um diretório é realizada por humanos. São eles, os humanos, que fazem a análise e a indexação dos sites da web. Nos diretórios, não existem robôs para a catalogação e a indexação da web: quem faz isso são humanos.

Enquanto os mecanismos de busca copiam todo o conteúdo das páginas que encontram pela frente e mantém tudo isso em suas bases de dados, os diretórios mantêm em suas bases de dados apenas um resumo do contéudo dos sites por ele catalogados (1). Muitas vezes esse resumo que fica na base de dados do diretório contém, apenas, o título do site mais duas ou três frases sobre o assunto nele contido. Esse resumo tanto pode ser elaborado pelo autor da página ou por quem a submete como por um editor, dependendo do diretório.

Conforme já se falou anteriormente, o diretório tem a mesma finalidade dos mecanismos de busca: a indexação e a recuperação de páginas da web. Eles têm a mesma finalidade, mas existem duas diferenças fundamentais entre os diretórios e os mecanismos de busca.

Duas diferenças

A primeira diferença é o modo de o diretório encontrar na web os sites a serem por ele indexados. Enquanto o programa robô do mecanismo de busca toma, ou pode tomar, a iniciativa de sair visitando os sites e suas páginas pelo mundo afora, o diretório fica lá "na dele" esperando que você, o dono do site e das páginas, tome a iniciativa de apresentá-los a ele.

A segunda diferença: o diretório classifica o conteúdo dos sites segundo categorias e subcategorias, setores de atividade econômica ou ramos do conhecimento. Quando você for informar o URL de seu site para que o diretório faça a indexação dele, você também deve dizer a ele a qual dessas categorias sua página pertence. (É bom lembrar que alguns mecanismos de busca também solicitam que você informe o assunto ou a categoria do seu site.)

Pois bem, mas a diferença mais significativa mesmo fica é por conta de quem faz a indexação das páginas da web. Enquanto nos mecanismos de busca quem realiza essa atividade é uma máquina, um programa de computador, nos diretórios quem faz a análise e a indexação dos sites são humanos.

É claro que os humanos que trabalham na construção e na montagem dos diretórios também usam programas de computador para criar a sua (deles...) base de dados. Mas são eles, os humanos, que fazem a análise dos sites apresentados. E é aí que se encontra a diferença fundamental entre os mecanismos de busca e os diretórios: a participação dos humanos na construção da base de dados.


Os humanos

Agora, me permitam abrir um parêntese. É uma observação sobre humanos. Seguinte: geralmente fala-se que o homem é isso, que o homem faz aquilo, que o homem descobriu ou que inventou alguma coisa usando esse termo, homem, como uma referência ao gênero humano. Ao verem isso, muitas mulheres se irritam e reclamam porque sentem-se excluídas. E com justa razão. Como não pretendo ferir as susceptibilidades femininas por não serem clara e explicitamente citadas, eu decidi usar a palavra humanos = mulheres + homens. Está explicado e fecho o parêntese. :)

Continuando... Sim, a interferência dos humanos. Pois é, enquanto na criação da base de dados dos mecanismos de busca os humanos não interferem (ou pouco interferem, na verdade), para a criação da base de dados dos diretórios os humanos são essenciais.

E você é quem deve tomar a iniciativa. Sempre. Você informa ao diretório o título, o URL, a descrição do conteúdo, a categoria a que o site pertence e mais algumas informações complementares, como no caso do Yahoo!.

Caso o diretório disponha de uma equipe de editores, eles irão até o site e farão uma "vistoria" nele. Uma vez aprovada a inclusão, o site é inscrito no índice dele.

Mas também existem os diretórios sem editores. Eles aceitam as informações do jeito que você mandar e a arquivam lá no índice deles.

Entre os diretórios com editores destacam-se o Yahoo! e o LookSmart. O Yahoo! dos Estados Unidos dispõe de uma equipe de de mais de 100 editores. O LookSmart tem cerca de 200 editores.

Quando ocorre de o diretório só fazer a inclusão de um site após a conferência do pessoal de lá, três coisas podem acontecer:

diretório 1 talvez seu site demore bastante tempo para aparecer na base de dados deles. Alguns diretórios prometem fazer a inclusão de um site no prazo de duas semanas. Outros diretórios dão um prazo de até seis semanas;

diretório 2 talvez sua página jamais apareça por lá ou

diretório 3 talvez sua página seja logo logo indexada e saia passeando pelo mundo afora. (Passear é força de expressão, pois ela não vai a lugar algum...)

Talvez!?

Uma pessoa mais curiosa pode interromper essa conversa toda e perguntar: "Que história é essa de tanto talvez? Afinal de contas, que garantia eu vou ter de que minha página vai ser analisada e indexada por um diretório?"

Calma. Aí vai a resposta: você, nem ninguém, jamais vai ter a menor garantia de que sua página vai aparecer indexada num diretório que tem editores para analisar as páginas submetidas. Jamais.

"E por que não?"

Aí já vem outra história...

Os humanos, ao contrário dos programas de computador, são cheios de preferências pessoais e usam aquilo que eles chamam de critérios de relevância. É segundo esses critérios de relevância que os editores vão avaliar se sua página merece ou não freqüentar os índices deles. Subjetividade na avaliação? Certamente.

"E se eles rejeitarem minha página, o que é que eu faço?"

Que tal cantar um tango argentino? Não sabe cantar um tango argentino? Cante um baião, uai!...

Na verdade você não pode fazer nada. A-bi-sso-lu-ta-men-te-na-da.

Mas o que pode parecer um defeito é, sem dúvida, uma das qualidades mais marcantes dos diretórios que têm equipe de editores. A análise dos editores tem por finalidade evitar que se faça a indexação de coisa imprestável, lixo que jamais vai ser procurado por um consulente.

Se você visitar um diretório e procurar pela palavra gato, o felídeo, dificilmente você vai deparar com uma página pessoal (epa!) de um ronronante gatinho homenageado pelo(a) feliz proprietário(a)... Nos (bons) diretórios, dificilmente você vai encontrar uma página do tipo: Eu (uma foto); Eu passeando (outra foto); Eu estudando (outra foto)... Eu me chamo Fulan...

Não se deve pensar em mecanismos de busca e em diretórios como duas entidades que se contrapõem e se excluem. Eles se complementam. Veja o caso do AltaVista, um mecanismo de busca. Ele apresenta na página de abertura uma coleção de categorias. Neste caso, você tem duas alternativas de pesquisa:

diretório 1 você pode pesquisar através das categorias

ou

diretório 2 fazer a pesquisa através de palavras chave.

Ao clicar numa das categorias, o programa transfere o controle para o LookSmart, um diretório, e é nele que a pesquisa é realizada.

Caso análogo ocorre com o Yahoo!. Se o assunto indicado no quadro de pesquisa não for encontrado na base de dados dele, o Yahoo! vai fazer a pesquisa na base de dados do Inktomi.


O Inktomi não é um sistema de busca que se encontra ao alcance do usuário comum. Essa empresa mantém uma base de dados accessível, apenas, aos sistemas de busca.


Quem paga a conta?

Só mais uma coisinha: a maioria dos sistemas de busca presta um serviço gratuito, o de divulgação do seu site ou de ajuda numa pesquisa. Nos serviços gratuitos, a remuneração deles vem da publicidade inserida, por exemplo, no topo da página. Outra propaganda, mais insidiosa, é aquela apresentada quando da resposta a uma consulta e que lhe mostra um produto que, "por acaso", tem a ver com a sua consulta.

Aí vão alguns dos sistemas de busca que cobram para a inserção ou quando do fornecimento de informações ou artigos. São eles:o GoTo.Com, o Galaxy, o NorthernLight, o Matilda, o Yahoo! e o Excite..

O GoTo.Com diz que você seleciona os termos mais relevantes para o seu site. Depois, diz ele, você determina quanto quer pagar pela posição do seu site nas respostas. Para aparecer nos primeiros lugares, você paga mais.

O Galaxy, um diretório e, segundo eles, o primeiro sistema de busca da web, lançado em 1994, cobra pelo cadastramento de um site da seguinte maneira: os donos do Galaxy dizem não garantir que os sites submetidos sejam analisados e indexados em um tempo razoável. Para assegurar uma rápida inclusão do site no índice deles, você deve pagar uma taxa de U$ 25.

Outro serviço pago é o da NorthernLight, um mecanismo de busca. Ele cobra de um a quatro dólares por documento fornecido de sua "Special Collection". Um detalhe: se o usuário não ficar satisfeito com o documento obtido, mesmo depois de tê-lo baixado, impresso e lido, a NorthernLight se compromete a devolver o dinheiro recebido por ele.

Matilda, um site australiano , cobra a taxa anual, que eles chamam de "voluntary fee", no valor de U$ 29. Instituições educacionais, sites pessoais e entidades sem fins lucrativos são isentos da taxa desde que esses sites façam a inserção de um link para o Matilda.

Cento e noventa e nove dólares é quanto o Excite cobra para inserir uma página na base de dados deles dentro de 48 horas (http://www.excite.com/info/add_url/)

O Yahoo cobra U$ 199 pela garantia de inserir um site dentro de sete dias. A página http://docs.yahoo.com/info/ suggest/busexpress.html descreve essa opção denominada Business Express. (Não sei se a versão brasileira do Yahoo! já dispõe de um "serviço" equivalente.. Alguém que já tenha tendado submeter um site ao Yahoo!, de lá ou daqui, deve ter percebido que o tempo normal de inserção de um site nele é bastante dilatado...)

Exemplos de diretórios


Aí vão alguns diretórios:

Aonde
Cadê?
Bookmarks
Yahoo!
Aeiou
Sapo

 

E quais as diferenças entre os mecanismos de busca e os diretórios? Clique aqui para saber.



(1) Na verdade, há mecanismos de busca que, de fato, copiam todo o conteúdo das páginas da web como o AltaVista, o Northern Light e o Inktomi. Mas há, também, mecanismos de busca que coletam, apenas, algumas informações das páginas catalogadas. Volta


MOURA, Gevilacio Aguiar Coêlho de. Sistemas de busca da web: diretórios e mecanismos de busca. [online] Disponível na Internet via WWW. URL: http://www.quatrocantos.com/ tec_web/sist_busca/index.htm. Última atualização em 01 de janeiro de 2001.

Sumário

Considerações gerais acerca da web

Introdução aos sistemas de busca

Mecanismos de busca

Diretórios

Mecanismos de busca e diretórios: características e diferenças

Utilizando os sistemas de busca: modos de pesquisa

Operadores booleanos

Pesquisa em um diretório


Todos os Direitos Reservados. © Copyright 1999 - 2012. Gevilacio Aguiar Coêlho de Moura. É vedado o uso comercial deste artigo e sua reprodução, no todo ou em parte, só é permitida mediante autorização expressa do autor. Não são permitidas a reprodução nem a manutenção deste artigo em sites, páginas da web e assemelhados.

Veja também Citações e Referências a Documentos Eletrônicos