h1

Buscadores

30 30UTC Março 30UTC 2009

A web 2.0 e a convergencia digital serão os responsáveis pelo que chamo de “inundação da informação”. Já se sabe que a web 2.0 proporcionou um aumento significativo, para não dizer absurdo, da quantidade de conteúdo na Internet. Blogs, Fotologs, redes sociais, todos eles deram força ao usuário comum para eternizar seu conhecimento. Só de blogs, são cerca de 120 mil novos por dia . E isso é bom: não dependemos mais do “monopólio da informação”.

A história do ser humano segue este caminho: alguém descobre algo ou deseja que alguma informação seja guardada para que alguém, NO FUTURO, leia, aprenda, reflita, descubra, enfim… uma pessoa escreve para que outra leia. Esse processo é assim desde que se criou a escrita. A escrita foi criada com esse propósito. Guardar informação. A biblioteca de Alexandria foi criada no início do século III a.C (referência ), e seu objetivo era preservar e divulgar a cultura nacional.

Hoje, ncessitamos de conhecimento, tanto quanto no passado, mas com uma diferença: de forma rápida. Não temos tanto tempo para ir numa biblioteca como a de Alexandria, e pesquisar o assunto que queremos entre os mais de 400 mil livros. E o que se fez quando descobriu-se que se tinha várias bibliotecas em um único computador com acesso à Internet? Criou-se algo chamado “mecanismos de busca”.

Deram alguns nomes para sistemas desse tipo: apontadores, buscadores, robôs de busca… até “oráculo” (esse último associado ao Google). Esses sistemas indicam os lugares na Internet que PODEM, repito, PODEM conter as informações que alguém está procurando. É verdade que em algumas páginas sugeridas o que se encontra é uma receita de bolo de trigo quando se queria saber sobre a crise do mercado de trigo brasileiro. Ninguém é perfeito. Mas estamos em busca disso.

Se você colocar na pesquisa Google o texto “antes do google” (sem aspas) o primeiro resultado relevante será o segundo link (essa aqui ). Já na pesquisa do Yahoo o primeiro resultado relevante, que por sinal é a mesma página, encontra-se apenas na oitava posição. Não é por acaso que o Google se tornou o mecanismo de busca mais usado no mundo. Por quê? Neste link aqui se pode entender que o Google trabalha em cima de algo chamado “pagerank” (para mais detalhes, ver o último link citado).

Mas ainda há um problema o mecanismo não “entende” o que se quer procurar. Se eu quiser saber se a crise afetou o preço do pão de centeio, vou receber como primeira opção de link (esse aqui) uma receita de pão de centeio. E a crise? Não sei, mas deve estar ligado a algum anúncio do Adsense na mesma página.

E para onde vamos? Não temos tempo de ficar pesquisando em várias páginas de Internet de buscadores que não entendem o que queremos saber. Queremos ler 7 livros didáticos em 21 horas, e não temos paciência de ler nem o prefácio. O que queremos é perguntar a alguém (real ou virtual) e receber a resposta. Precisamos de algo melhor do que o existente “oráculo”.

Já existem tecnologias sendo desenvolvidas com a finalidade de dar inteligência a essa rede de páginas interligadas. A Web Semântica tem como finalidade dar um significado à Web para os computadores. E esse é um dos rumos que devem ser tomados hoje. Com isso, os mecanismos de busca entenderiam o que contém as págins da Internet, e assim, a minha pergunta sobre a crise e o pao de centeio seria respondida com uma página relevante.

Um momento por favor: uma página? Um texto? E se a resposta que eu quiser esteja em uma linha de um parágrafo no fim da página? Vou ter paciência para lê-la toda? E por que precisaria fazer isso, se o mecanismo entende o que eu quero? Pois é: iremos muito além.

Deixe um comentário