Está em curso um enorme esforço para tornar a web, o ambiente gráfico desenvolvido no final dos anos 1980 e que tornou a internet fácil de usar, mais que um repositório de dados. Esse trabalho, realizado por filólogos, sociólogos, cientistas da informação e, claro, os profissionais do software, deverá impactar a forma com que as coisas são percebidas, descritas, enunciadas, caracterizadas e classificadas em nossa sociedade, no nosso tempo. Alguma das muitas questões que essa gestação tem sugerido: dela resultará uma forma de conhecer nova? Qual a prosa do mundo que poderá emergir?
As perguntas evidenciam uma ambição que é proporcional ao projeto de construção de uma web semântica, o próximo passo evolutivo do ambiente desenvolvido pelo físico Tim Berners-Lee no final dos anos 1980. A evidência mais comum desse esforço (a ponta do iceberg) chega aos usuários comuns da rede mundial de computadores na forma das etiquetas, ou hashtags. A pergunta que não quer calar é: o que é, ou o que virá a ser, uma web semântica?
“É extensão da atual world wide web, resultado de uma série de providências que acrescentam informações extras aos dados já disponíveis e aos futuros dados que vierem a ser incorporados para dar-lhes significados”, explica Alex Sandro Gomes, pesquisador do Centro de Informática da UFPE. “No fundo, é um trabalho de criação de vocabulários que contribuem com a catalogação de informações”, complementa Carlos Cecconi, da W3C, o consórcio de empresas que planeja padrões para a internet. A biblioteca de Alexandria já fazia isso, portanto, não é propriamente uma novidade que nenhum estudante de ciência da informação (anteriormente conhecida por biblioteconomia) desconheça. O que há de novo é que essa monumental tarefa precisa ser feita de tal forma que torne possível às máquinas gerar inferências para usos não humanos.
O que isso significa? “Bem, pretende-se que na web semântica toda a informação seja organizada de forma que não somente seres humanos possam entendêla, mas principalmente as máquinas entre si”, afirma Alex Sandro Gomes. O próximo passo evolutivo da web incorpora o significado às informações. Isso permite um ambiente em que máquinas e usuários trabalhem em conjunto. Na medida em que cada tipo de informação é devidamente identificado, fica mais fácil para os sistemas encontrarem informações mais precisas sobre um determinado assunto – reduzindo a ambiguidade. O ambiente de que estamos falando terá informações devidamente identificáveis, onde sistemas personalizados possam manipular, compartilhar e reutilizar de forma prática as informações providas pela web.
“Hoje, um dos principais problemas é que a capacidade de gerar informação – útil e inútil – excedeu a habilidade para gerenciá-la”, já lembrou Clay Shirky, escritor e professor em Novas Mídias de Comunicação, da Universidade de Nova York no documentário Web 3.0, realizado pela psicóloga Kate Ray e disponível na web . Em termos pessoais isso é fácil de constatar. É possível afirmar que estamos nos afogando em nossa própria riqueza. Não é à toa que ganhou importância e procedência nos últimos anos o extenso cardápio de reflexões sobre a chamada economia da abundância, a economia do imaterial, à qual estão vinculadas a crise do conceito de valor e de várias outras categorias da economia política clássica e neoclássica. Mas isso fica para outro dia. “Dispomos de toda essa informação, todos esses pontos de acesso e verdadeiramente não há uma maneira efetiva de ajudar a controlar tudo”, complementa Shirky. Exceção à velha estratégia do esquecimento, posto que esquecer também salva. Que o diga, aliás, Funes, o personagem memorioso de Borges, cuja incapacidade de esquecer se converteu numa doença - “Sabia as formas da nuvens austrais do amanhecer do trinta de abril de mil oitocentos e oitenta e dois e podia compará-las na lembrança aos veios de um livro encadernado em couro que vira somente uma vez e às linhas da espuma que um remo levantou no rio Negro às vésperas da batalha do Quebracho”.
É justo pela falta de mecanismos mais sutis de desambiguação e pelo excesso de informação que hoje a escolha do que é de fato útil tem de passar necessariamente pelo escrutínio manual. A maior parte dos profissionais envolvidos com a construção de uma semântica para a web vê a oportunidade de que possamos descrever nosso mundo em termos que sejam mais práticos para que a máquina possa trabalhar com eles – o que não é o mesmo de fazer com que as máquinas pensem exatamente como as pessoas. O que está em pauta é uma reorganização da informação de nosso mundo real (de nossa cultura, vale dizer) disponíveis na rede – e não a construção de cérebros de silício.
É nesse sentido que a incorporação do símbolo # às palavras como regra para concentrar e indexar assuntos e informações de interesse comum – hashtags – é apenas a ponta do iceberg. Até porque usuários dos canais IRC e de chats já faziam há anos uso desse procedimento, que se popularizou graças à penetração do Twitter – a rede de microblogs mais acessada atualmente.
Mas de que maneira esse trabalho de etiquetamento (muitos experts usam a feia palavra tagueamento) pode ter impactos tão ambiciosos – e que serão nos próximos anos no mínimo interessantes de acompanhar? Primeiro, porque a ambição dos principais envolvidos nessa hercúlea tarefa vai além da redução da ambiguidade das informações em rede. “O que se pretende é que seja possível criar sistemas que possam explorar essa web e resolver problemas, responder perguntas complexas, fazer grandes descobrimentos e interconexões entre áreas diferentes do conhecimento”, afirma Cecconi. Há quem considere logo ali no horizonte a real chance de materializar a noção de inteligência coletiva com a qual Pierre Levy vem martelando seus leitores há anos. Segundo, porque atribuir sentido às informações disponíveis na rede implica na criação de vocabulários a partir dos quais as máquinas possam desenvolver inferências, interpretações. O que não deveria ser visto como algo completamente novo ou estranho.
Uma certa arqueologia permite expor a dimensão do possível para a web semântica. A arqueologia em questão é a do conhecimento, desenvolvida por Michel Foucault na década de 1960. É interessante recordar como o filósofo francês revisita a episteme do século 16 ao século 19 na tentativa de identificar as condições necessárias para que o homem passasse a se tornar objeto do estudo científico.
Nesse percurso, Foucault identificou o século 16 como a Idade da Similitude, na qual as relações entre as palavras e as coisas eram marcadas pela semelhança, pela correspondência direta. A semelhança mágica ou tradicional entre palavra e coisa permitia a ação sobre o mundo, através das palavras. Até o fim do século 16, a linguagem era semelhança, repetição da realidade, e assim desempenhou um papel construtor no saber da cultura ocidental – com as suas respectivas consequências. E seguiu assim até o alvorecer do século 17 e meados do século 18, a Idade da Representação. O saber se reconfigura. As palavras e as coisas separam-se como amantes na madrugada. Foucault afirma que nesse segundo momento o pensamento deixa de se mover no elemento da semelhança. A compreensão entre as palavras e as coisas passa a ser marcada pela mediação científica, a episteme busca sua fundamentação na Representação.
E é a figura do cavaleiro da triste figura que exprime a primeira brecha para que o homem e não as coisas se torne o objeto do saber: a verdade não está nos livros, na tradição ou na magia. A loucura de Dom Quixote é o exílio possível de um mundo em que se rompeu o laço que atava as palavras e as coisas.
A segunda brecha só vem acontecer no curto século 19, como o nascimento da Filologia, da Economia e da Biologia, com a busca dolorosa das estruturas atrás dos fenômenos e a superação do racionalismo ingênuo da idade clássica, a linguagem volta-se para a descrição dos esqueletos dissimulados dos objetos. Ou seja, o terreno da Interpretação. Como diz Foucault, cala-se a plenitude clássica do ser e instaura-se a era das interpretações. A partir das ideias de finitude e de historicidade, este homem – moderno, demasiado moderno – é uma invenção recente que passar a ocupar o ‘posto’ de sujeito de um conhecimento de validade temporária.
Mas e daí? Qual a relação da arqueologia do conhecimento desenvolvida por Foucault e a web semântica que vínhamos comentando? É que o advento da forma moderna de conhecer, segundo o filósofo francês, parece ser aprofundada e radicalizada com o desenvolvimento de vocabulários que possam ser utilizados por máquinas lógicas para a geração de inferências e de Interpretações.
Essa perspectiva se recobre de uma certa dramaticidade se lembrarmos que a soberania do homem como objeto e artífice do conhecimento para Foucault é ilusória – ou não é definitiva. A ideia moderna do homem é resultado das mudanças na forma do saber, de modo que, de acordo com Foucault, quando essa episteme se modificar o homem ‘morrerá’ – afirmação pela qual o filósofo foi acusado de anti-humanista e que o levou, ao menos em parte, à produção de A Arqueologia do saber, anos depois de finalizar As palavras e as coisas.
A expectativa de que os esforços para a construção da web semântica permitam a criação de sistemas modernos, a solução de problemas, a resposta a perguntas complexas encerra uma certa faceta enciclopedista em busca desse desdobramento da web. É também a que autoriza uma reflexão sobre o aprofundamento da episteme moderna, na qual a linguagem volta-se para a descrição dos já mencionados esqueletos dissimulados dos objetos.
Restam, como esperado, diversas dúvidas em torno da edificação da web semântica: A possibilidade dessa organização do mundo real em base digital pode mesmo conduzir à questão do sentido do mundo – a velha questão em torno da qual se debate a filosofia ocidental? Abre-se então a possibilidade de realizarmos uma interpretação desse mundo? Com base em que linguagem? Escrita por quem?
Luiz Carlos Pinto é jornalista e doutor em sociologia.
LEIA MAIS:
Escolha: ele vai pro trono ou não vai?, por Diego Raphael
Um moderno revelado, por Sueli Cavendish