![]() |
![]() |
![]() |
![]() |
Busca |
|||||||||||||||||
| Pesquisar na web Pesquisar no site |
|||||||||||||||||||||
![]() Hoeschl
(de preto), em encontro científico internacional.
Equipe Ijuris: O Ontoweb é uma ferramenta de busca? Prof. Hoeschl: O Ontoweb é uma ferramenta informacional, que realiza coleta, seleção e análise de informações, basicamente. Acontece que ele faz isso com tanta qualidade que está desempenhando tarefas de uma search engine. Mas é preciso lembrar, uma ferramenta de busca em larga escala deve funcionar de forma semelhante a uma lista telefônica, isto é, deve mostrar onde está o local da informação. O Ontoweb é diferente, ele vai alguns passos adiante e trabalha as informações, gerando conhecimento e diagnósticos, visíveis através de gráficos ou coleções de documentos. No momento ele faz isso no cenário de governo eletrônico. Quando ele fizer isso com todo o conteúdo da internet, será, então, a mais poderosa das ferramentas de busca, com abrangência e qualidade. ![]() Nas
Pirâmides do México: “Saber unir o novo
e o milenar”
Equipe Ijuris: Quando isso vai acontecer? Prof. Hoeschl: Mais breve do que se imagina. O modelo tecnológico já está estável e operando muito bem dentro da sua proposta. Em menos de 15 dias após o seu lançamento o Ontoweb teve acessos de mais de 20 países, e ainda nem lançamos a versão em inglês. Nos EUA, por exemplo, os acessos estão concentrados em três regiões: Nova York (bolsas), Washington (Pentágono) e Vale do Silício. Esse tipo de interesse demonstra o potencial do Ontoweb, e a certeza de que ele está no caminho certo. ![]() Com Marx e Engels em
Berlin:
“O
conhecimento é uma riqueza mundial que precisa ser melhor
distribuída”.
Equipe Ijuris: Professor, o Sr. costuma falar que existem várias gerações em termos de buscadores. Quais são as principais diferenças entre eles ? Prof. Hoeschl: As diferenças são baseadas no tempo, no nível de tecnologia e nas funcionalidades, basicamente. Existem outras classificações, essa é uma sugestão. Os diretórios tinham (e têm) muita informação inserida de forma manual, e estão estruturados em classificações de sites, por temas, onde se pode encontrar a informação “buscando” ou “navegando”. Isso passou a ser feito, posteriormente, de modo automatizado, com robôs digitais visitando as páginas e fazendo as categorizações. Quando alguém pensou em juntar, em um único resultado, as informações de vários motores de busca, vieram os metabuscadores. É quase lógico querer mais, e o foco passou a ser a melhor seleção das informações, quando o AllTheWeb foi a novidade, fazendo exatamente isso. Na seqüência, veio o Google, com um rankeamento de importância das páginas, onde uma pagina muito “votada” (apontada por links ou pointers) é mais importante que as demais, além de utilizar também outras tecnologias. Mas agora a nova onda é a precisão em termos de “essência”, e os ontobuscadores representam o novo. Equipe Ijuris: Os buscadores atuais ainda não ajudam na montagem dos contextos. Os ontobuscadores ajudariam as buscas nesse sentido? Prof. Hoeschl: Sim, os buscadores genéricos de hoje não conseguem tratar com eficiência e facilidade os cenários de contexto. Nesse sentido, os ontobuscadores são o futuro. Existem muitos projetos científicos internacionais em andamento que tratam disso. No caso do Ontoweb o futuro já é o presente, dentro do seu escopo de atuação e considerando principalmente as suas fontes de informação e o seu universo temático. Ele é fruto de extensas e densas pesquisas realizadas no Brasil, desde 1993, com validação em fortíssimos ambientes internacionais, e a sua idéia básica é procurar a máxima correspondência entre a “essência” do que se busca e do que se encontra. Em termos de aproximação conceitual, o rankeamento por “votação” (links) é ultrapassado e pouco consistente, pois não significa que um documento contém o melhor conteúdo, significa apenas que ele é mais consultado ou o mais sugerido. Além disso, a possibilidade de alguém pagar para ter a preferência sobre uma palavra ou conceito é algo que nem se pode comentar aqui, pois é puro comércio, e não há nada de técnico nisso. Enfim, quando se está falando de um “conceito” ou de uma “avaliação qualitativa”, pouco importa quantos links apontam para um documento, desde que ele contenha a melhor definição ou a maior aproximação com a temática procurada. Equipe Ijuris: Como funcionam essas buscas conceituais do Ontoweb ? Ele é diferente das ferramentas tradicionais ? Prof. Hoeschl: Sim, os métodos de busca são diferentes. Um buscador tradicional usa, basicamente, tecnologia. Mais e melhores tecnologias geram melhores resultados. O Google, por exemplo, tem uma grande estrutura de computadores de alta performance (algo em torno de 150.000 máquinas ou mais), que respondem às buscas. O Ontoweb tem uma proposta inovadora, que mescla altas tecnologias inteligentes (Pesquisa Contextual Estruturada – PCE, Representação do Conhecimento Contextualizado Dinamicamente – RC2D, Mineração de Textos e Raciocínio Baseado em Casos) com antigos e milenares conhecimentos e práticas da filosofia, materializados na Engenharia de Ontologias, aonde se vai à essência dos conceitos e objetos. Por exemplo, um conceito pode ser igual a outro, ou pode ser similar, ou pode ser simplesmente conexo ou relacionado. Um objeto pode “ser parte” de algo, ou, dentro da sua estrutura, pode ter “diferentes partes” no seu todo. Uma porta automotiva, por exemplo, faz parte de um carro, mas também tem suas próprias partes, e também pode ter similaridades com a porta de uma casa. A inovação do Ontoweb é transformar isso em um coeficiente de hierarquização de documentos, de forma a que, quando procuro por “chave”, por exemplo, alguns desses conceitos do objeto “porta” podem ter relevância (fechadura), e outros não (vidro, forração). Não se chega a um resultado satisfatório, nesse campo, somente com tecnologia, é necessário um outro tipo de desenvolvimento, onde se “programa” diretamente o conhecimento, organizando-o adequadamente. Isso é a Engenharia de Ontologias. A grande inovação do Ontoweb é exatamente mostrar que isso é possível, através de ambientes e ferramentas próprios, e que os resultados melhoram sempre que se organiza melhor o conhecimento. No seu universo de coleta de informações e ontologias, e falando de buscas com volumes expressivos de textos (15.000 caracteres) nenhuma ferramenta supera hoje o Ontoweb em respostas qualitativas. Está previsto que em breve ele fará isso com todo o conteúdo da internet, e suportando consultas com algo em torno de 210.000 caracteres (ou 30.000 palavras), e aí teremos uma nova virada de pagina da história das ferramentas de busca. ![]() Na
subida do Vulcão: “Desafiando os
gigantes”.
Equipe Ijuris: Por quais razões o Google é o mais utilizado? Prof. Hoeschl: O Google é o mais utilizado pela mesma razão que Windows domina o mercado de sistemas operacionais e o formato VHS dominou o mercado de vídeos caseiros, e, no caso do Brasil, o Fusca foi um campeão de vendas: ele é fácil de usar e acessar, mostra rápido suas qualidades e tem pouca complexidade (de uso) no modelo básico. Outros buscadores são mais complexos, com mais estrutura conceitual e contém mais variações. Mas quem consegue reunir mais qualidades genéricas em um único clique, atualmente, é o Google, não há duvida. Porém, sabemos que todos os exemplos citados possuem defeitos crônicos, o que não os impediu de serem líderes de mercado. A evolução do Google é fantástica, e eles fizeram algo muito significativo pela cultura digital, e isso deve ser reconhecido. Mas o usuário da informação digital quer sempre mais e melhores informações. Mais consistentes e mais fiéis. Melhor organizadas e melhor selecionadas. Na mesma linha de comparativo, o VHS e o Fusca ainda têm espaço no mercado, mas já não lideram seus segmentos. No âmbito das ferramentas de busca, isso já aconteceu antes, com as outras gerações, e vai acontecer de novo. E o futuro aponta para as ontologias. Equipe Ijuris: Professor, o Sr. pode sugerir métodos para que as pessoas melhorem suas buscas na internet? Prof. Hoeschl: Usar mais texto é uma forma mais cômoda e eficiente de melhorar as buscas. Os usuários têm o importante papel de pressionar os produtores de tecnologia para fazer com que as ferramentas tenham melhor desempenho. Chega de buscas com uma ou duas palavras. Estamos entrando na era da informação qualitativa, onde pouco adianta ter um resultado com 10 milhões de documentos, pois ninguém vai ler isso. As pessoas lêem, em média, 7 ou 8 resultados. Então, o que precisamos são de buscadores que nos dêem os 7 ou 8 documentos efetivamente relevantes, mas que, ao mesmo tempo, possam utilizar aqueles milhões para fazer análises históricas e contextualizadas, com resultados em gráficos acoplados a textos. O Ontoweb faz isso, em uma temática específica (fontes eletrônicas de informações governamentais). Um dia, todas as ferramentas de busca irão realizar esse tipo de tarefa. ![]() Necessidade
de inovar: “Mais e melhores
informações”.
Equipe Ijuris: Quais os buscadores são melhores, e por quais razões ? Prof. Hoeschl: Este é um assunto que, além da técnica, envolve gosto pessoal, como um carro ou um time de futebol. O A9 (www.a9.com), por exemplo, traz imagens junto com os textos, é uma proposta interessante, embora a sua tecnologia de busca textual não seja inovadora. Para varreduras, o Metacrawler é legal, pois vai no Google, Yahoo!, MSN Search e Askjeeves em uma só busca. Quando se pensa em um catálogo, o Google é um excelente produto, e gosto de utilizá-lo. Mas, para análises históricas e buscas com grandes volumes de texto, ele é ineficiente e foi superado pelo Ontoweb. Equipe Ijuris: Como estão os estudos sobre o assunto, em nível acadêmico? Prof. Hoeschl: Estamos preparando um curso sobre Gestão do Conhecimento e Ferramentas de Busca, que terá início na UFSC no primeiro trimestre de 2006. Vamos tratar exatamente desse cenário, com comparativos e estudos científicos sobre os principais motores de busca do mundo, cotejando-os diante de modelos representacionais e engenharia de ontologias, que são o grande diferencial da gestão do conhecimento neste inicio de milênio. O grau de complexidade do trabalho com as ontologias é algo diferente de tudo o que já se viu em termos de tecnologia da informação. Um jovem e habilidoso hacker pode, por exemplo, derrubar o site da Nasa. Mas se o desafio for construir ontologias, dificilmente ele vai passar da primeira página. Organizar conhecimento é algo muito mais sofisticado, e, quando se fala de ontobuscadores, nem as melhores e mais depuradas linhas de código de programação têm um bom desempenho se a organização do conhecimento for inadequada. Dentro da escala evolutiva equipamento/software/conhecimento, chegou a vez, agora, dos engenheiros do conhecimento. (*) De acordo com o Ministério da Ciência e Tecnologia (Portal da Inovação).
|
![]() |
©
2005-1999 IJURIS - Instituto de Governo Eletrônico,
Inteligência Jurídica e Sistemas Powered by WBSA
- Web Intelligence Systems Recomendamos: IE
5.0+ e Res. Monitor Mínima 1024 x 768 pixels |