Usuários e software fazem a web semântica

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Com Carlos Augusto Hentges*

Exercitar o pensamento voltado para o futuro exige o convívio com uma série de riscos. Um deles é próprio da futurologia: os eventos escapam da lógica prevista e atinge-se um resultado completamente diverso do esperado. Essa diversidade, porém, é parte imanente da função daqueles que tem na observação da tecnologia e seus desdobramentos o ponto de partida para a inovação.

Um exemplo muito claro dessa situação pode ser observado na trajetória da internet. Seus dez anos de existência comercial no Brasil foram comemorados em 2005. Antes, o uso era restrito, em maior parte, ao ambiente acadêmico.

Mais recentemente, a internet passou a ser associada ao termo 2.0. A ?nova? rede, na verdade, é o resultado combinado de tecnologia de acesso à quantidade de usuários. Em uma simplificação grosseira dos desdobramentos provocados por mais de uma década de evolução, pode-se afirmar que o contingente de 1 bilhão de usuários freqüentes da internet atualmente, com conexões de melhor qualidade, avançou um passo no que diz respeito ao relacionamento com o conteúdo online. De espectador, passou a produtor.

Compartilhar essa informação não passa de um refinamento do quadro já estabelecido, portanto.

YouTube, MySpace e, em certa medida, o Orkut, para ficar apenas nas ferramentas mais populares, são a aplicação efetiva dos conceitos de produção compartilhada de conteúdo, próprios da internet 2.0.

Mas é claro que, em algum lugar, alguém está pensando em uma nova associação de idéias, que resultará em outra novidade nesse universo virtual tão amplo quando dinâmico. Bem, seu nome é internet 3.0, ou web semântica, e a idéia nem é tão nova assim. Tim Berners-Lee, o inglês que ?inventou? a internet em 1990, é líder do World Wide Web Consortium (W3C), e um de seus grandes visionários.

No que consiste a web semântica? Trata-se de um conjunto de medidas que pretende criar significado, ou sentido, para tudo que habita a rede.

Por exemplo: você acessa uma ferramenta de busca online e faz uma pesquisa pelo termo ?casa?. Vão surgir mais de 400 milhões de referências. Claro que é sua obrigação refinar a pesquisa. Ainda assim, a chance de haver muita informação que você não deseja é enorme. Isso acontece porque os programas de computador não são capazes de realizar a série de associações contextuais que são próprias da cognição humana.

Tornar a internet ?inteligente?, e capaz de entender a essas necessidades, é o objetivo da web semântica. Em outras palavras, ela pretende que máquinas e seres humanos se comuniquem através de uma linguagem mais próxima.

E evolução consiste no fato de que a internet, inicialmente projetada para ser compreendida apenas por seres humanos, terá suas informações compreendidas também por máquinas. A estrutura semântica da informação deve levar a um trabalho mais cooperativo entre usuários e agentes de software.

Tentar prever o resultado disso, e mais ainda, sua aplicação comercial, leva aos riscos anotados no primeiro parágrafo. A observação do que vem ocorrendo com a internet 2.0, porém, fornece algumas pistas. O YouTube apenas há pouco tempo passou a receber a publicidade fundamental para sua capitalização. Outros nichos, como o Orkut, ainda estudam formas de adotar a prática sem que isso seja interpretado pelos usuários como uma invasão.

O sucesso da empreitada, nos parece, passa pela melhor interação do usuário com sua máquina pessoal, e desta com o universo da internet. O simples ato da compra de uma passagem aérea, no contexto da web semântica, implicaria na automática reserva de espaço em uma agenda virtual, o eventual direcionamento de e-mails para uma caixa previamente definida, e a alocação de arquivos importantes durante tal deslocamento para local próprio.

Outro exemplo possível, esse fornecido por Berners-Lee em The Semantic Web, trata de um serviço essencial: medicina. O usuário pede que o computador encontre um médico dentro de certos parâmetros ? ele deve ser acadêmico e atender em um bairro próximo. Após navegar e encontrar algumas opções, o computador apresenta as opções de agenda do profissional escolhido. Basta ao usuário escolher o horário que lhe for mais conveniente e marcar a consulta.

O refinamento de funções como essa ainda está distante, mas são essenciais para que o conceito de web semântica se afirme, diferente do que aconteceu com tantas outras modas virtuais que ciclicamente surgiram na internet na última década. [Webinsider]

……………………………………….

* Carlos Hentges é redator web da e21 Digital, jornalista e publicitário.

.

Fabiana Iglesias (fabi.iglesias@gmail.com) é consultora de negócios web.

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Mais lidas

12 respostas

  1. Estou começando a estudar web semântica para aplicação em meu TCC e deu para captar algo do texto e muito mais da troca de idéias. Obrigado pessoal!

  2. Ae pessoal, estou estudando ontologias e Web Semântica há alguns meses e também achei o artigo sem um foco bem definido, serve para ter uma idéia inicial, supercificial do conceito. Sobre a discussão, concordo com algumas opiniões do Nelson mas me parece que ele está pensando o conceito de forma parcial… Sim, é importante criarmos sites semanticamente corretos, ou seja, o que é título deve-se usar uma tag e não por exemplo uma . Mas a Web Semântica mesmo precisa de muito mais do que isso, como o Diogo Falou, utilizando OWL e suas camadas anteriores. Além disso, para extrair e usar o conhecimento modelado em ontologias precisamos também de um reasoner (classificadores), que são os programas responsáveis pela inferência de novas informações da ontologia.

    Para finalizar deixo um exemplo simples: se pesquisarmos no Google por aparelho de porcelana, ele encontra itens referentes à aparelho ortodôntico de porcelana mas também encontra itens referentes aos jogos/aparelhos de porcelana para tomar chá, jantar, etc… É exatamente esta separação semântica (significados diferentes) que o robô do Google não sabe fazer. Outro exemplo é pesquisar por carvalho, vai encontrar sobrenome e árvores…

  3. Olá!

    O texto não está bom. Para quem entende do assunto, web semântica, o texto não traz novidades, e para um iniciante, não explica quase nada. Faltou foco. Tentou agradar gregos e troianos…

    Os comentários estão ótimos. Parabéns!

    um abraço!

  4. Nelson

    Acredito que o principal motivo dessa discussão reside no fato de você estar confundindo uma série de conceitos que não tem relação intrínseca com a Web Semântica. Você está fazendo uma salada desconexa de buzzwords. Sobre as folksonomias, por exemplo, eu acredito que já deixei claro que elas, por si só, não são capazes de expressar significado *que seja processável por máquina*. Veja bem, uma coisa é um ser humano entender o significado da informação, outra são programas o fazerem: isso é Inteligência Artificial, a base da proposta da Web Semântica!

    Quanto à sua afirmação:

    Um site Semânticamente correto é: construir ele separando suas determinadas informações usando as tags adequadas.

    Está imprecisa! Se você consultar um dicionário pela palavra *semântica* você vai obter aproximadamente isso: diz-se do que se ocupa do estudo da significação das palavras. Essa definição, isoladamente, já descredita uma frase do seu primeiro comentário, que foi o que me motivou a postar nesse site: Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.; realmente o significado é próprio à informação, mas esse significado ou sentido que você cita, é para consumo humano e não para máquinas. O diferencial da Web Semântica é atribuir metadados, que são semânticos (provenientes de ontologias) e, portanto, possibilitam aos computadores — e não às pessoas — entender os significados das informações. Recomendo, sinceramente, que você leia o artigo do Berners-Lee que o Luis apontou, e reflita se a sua definição está correta; eu senti que você não captou o que estamos dizendo quando falamos de semântica: talvez por lá isso possa ficar mais claro.

    Enfim, você, de uma forma ou de outra, destilou uma série de temas da moda nos seus comentários, como folksomias, Web 2.0, design tableless, microformats, etc, para sem sucesso justificar a sua definição — imprecisa — de Web Semântica. Realmente esses tópicos podem cooperar entre si para um melhor aproveitamento da informação da Web. Mas, antes de tudo, é preciso delimitar bem quando começa um assunto e termina o outro.

    PS: O Google, e os sistemas de recuperação de informação em geral, podem muito bem aproveitar-se de todos esses recursos que eu citei no parágrafo anterior, concordo. Mas não faz sentido justificar que a Web Semântica não é semântica (se você prestar bem atenção, é isso que você está dizendo) baseando-se na forma como o Google estabelece a relevância, ou ranking, dos documentos. Um tema não justifica o outro. Os algoritmos empregados pelos mecanismos de busca mais populares, arrisco dizer, pouco ou nem ao menos consideram que as informações que eles indexam possuam metadados semânticos (ressaltando, segundo a conotação de semântica defendida pelos estudos relacionados à Web Semântica).

  5. Luiz Santana

    1 e 2) Web Semantica é simples. Não tem mistério. Por exemplo: se o titulo do meu site é carros e sua descrição é um site sobre carros, motoristas e mecânicos, Para que vou colocar mais informção em cima da descrição e o título se os próprios ja definem o objetivo da informação por si só?

    Um site Semânticamente correto é: construir ele separando suas determinadas informações usando as tags adequadas.

    Suas Resalvas:

    1) Não pense que estou sendo grosso, mas se vc não consegue ver a relação entre Web semântica e Folksonomia, é melhor estudar mais sobre o assunto, aproveita e da uma pesquizada sobre Microformats.

    2) Coloquei a errata da frase logo depois que postei, tira a palavra achar e poem discordar.

    Mas só para clarear, para quem não sabe, o google avalia melhor a relevância da informação indexada por tags, e sites Semanticamente corretos são muito mais fáceis de aparecer nas primeiras páginas da pesquisa. A grosso modo falando: é melhor colocar o titulo e/ou a descrição do seu site desntro de tags como h1, h2 e etc. do que colocar a informação jogada dentro de uma tabela junto com mais um monte de outras coisas escritas.

    Sabendo disso, se alguem diz para mim que web semantica não tem nada a ver com separar a informação determinando sua relevância por tags, então mande um email para o google dizendo que o metodo de pesquisa e seus bots estão completamente errados!

    E coloco o Revolução Etc como base não pq sou fã do Henrique Costa Pereira, mas pq ele estuda e se baseia nos melhores como O?Reilly por exemplo.

  6. Caro Nelson,

    concordo com o Diogo. Dentre os pontos dos quais discordo do seu primeiro texto, destaca-se:

    1. Processo de separar e refinar a informação definindo sua relevância por tags..

    Acredito que uma forma inicial de atingir os objetivos da Web semântica seria esse processo que vc cita. Contudo, a Web Semântica vai muito além.

    2. Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.

    Na minha opinião, apesar da Web Semântica não lidar com forma em que o conteúdo é criado, sem a Web Semântica esse conteúdo não passa de um conjunto de bytes sobre o qual um computador não pode fazer qualquer tipo de inferência lógica.

    Do seu segundo texto, tenho essas ressalvas:

    1. Pq vc mandou uma revisão sobre Folksonomia, sendo que o tema do artigo é Web Semântica?

    2. Se ainda sim vc achar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.

    Se eu entendi bem o significado dessa frase, gostaria de saber onde no texto do Diogo estão escritas essas afirmações?

    Finalmente, talvez vc devesse procurar fontes melhores, como o artigo onde Tim Berners-Lee cita pela primeira vez o termo Semantic Web. Ele está disponível em:
    http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21

    Se ainda assim vc discordar, continue a discussão, pois é bastante interessante.

    Luiz Henrique.

  7. refazendo a ultima fraze:

    Se ainda sim vc discordar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.

  8. Diogo Santana Martins

    Trecho retirado do Revolução Etc.
    http://revolucao.etc.br/archives/folksonomia-e-a-maneira-com-que-nos-colocamos-ordem-nas-coisas/

    Folksonomia é uma forma relacional (criar relações entre coisas) de categorizar e classificar na web. Ao invéz de utilizar uma forma hierárquica e centralizada de categorização de alguma coisa, o usuário escolhe palavras-chaves (conhecidas como ?tags?) para classificar a informação ou partes de informação. Tag em inglês significa ?etiqueta?, ?identificação?. ?Taggear? é identificar, etiquetar alguma coisa. Não confunda o termo tag abordado aqui com as tags de HTML, eles são dois processos distintos de classificar (dar significado?) as coisas.

    Classificando

    Diversas aplicações web, comumente aquelas que estão relacionadas a ferramentas sociais e colaborativas, utilizam esta forma de classificação (folksonomia) que é entregue na mão do ?povo?, ou seja, dos usuários e dos autores. Classificar suas fotos e compartilhar com amigos no Flickr taggeando cada foto que você insere no seu album, bookmarks sociais no Del.icio.us onde você insere várias keywords (palavras-chaves) para classificar seus bookmarks, ferramentas de blogs como o WordPress onde os autores classificam suas entradas ou artigos em várias ?tags? (categorias) ao mesmo tempo, mecanismos de busca especializados em blogs como o Technorati, que fazem buscas relacionadas com as tags que você insere no seu site, editor de texto online como o Writely, que permite você taggear todos seus documentos de texto e, mesmo que nem todos estejam compartilhados, facilita a maneira com que você pode encontrar os documentos que estão relacionados com palavras-chave específicas. São muitas as aplicações que podem utilizar este tipo de classificação conhecida como folksonomia.

    Taggear é classificar

    O resultado disso no mundo é uma enciclopédia de meta-informação visual gerada pelos usuários. A lógica é a seguinte, quando escrevemos, postamos imagens no Flickr ou taggeamos qualquer coisa na web, nós estamos relacionando um objeto a uma ou mais ?tags? (palavras-chave) classificando este objeto. Ou seja, o que fazemos é relacionar determinada informação, como uma página web (Del.icio.us), uma foto (Flickr), um post (blogs) com um determinado conjunto de palavras-chaves. Isso é gerar meta-informação on the fly.

    Como assim avaliar?

    ?Rating? em inglês, significa ?avaliar?. Avaliar alguma coisa é fazer apreciação, analisar. Quando você taggeia um artigo no seu blog você está associando um conjunto de tags com o conteúdo, ou seja, você está criando um tipo de ?rating? (avaliação) sobre aquele objeto. Você classificou determinado artigo por exemplo, em um conjunto de palavras-chaves. Quando o Google ou o Technorati (e centenas de outros mecanismos de busca) encontram o seu site, eles podem tratar a meta-informação que recebem de várias maneiras. Uma delas é verificar a relação das palavras-chaves que você inseriu com o próprio conteúdo taggeado e confirmar a relevância existente.

    Outros bons Links sobre o assunto:
    http://revolucao.etc.br/archives/a-relevancia-dobrada/
    http://revolucao.etc.br/archives/qual-o-papel-dos-web-standards-na-arquitetura-da-informacao/

    Se ainda sim vc achar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.

    []s

  9. Discordo do primeiro comentário. A Web Semântica não é Processo de separar e refinar a informação definindo sua relevância por tags. Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.. A Web Semântica busca, sim, atribuir significado (processável por máquinas) às informações da Web, usando-se tecnologias de representação de conhecimento que vêm há décadas sendo refinadas na comunidade de Inteligência Artificial.

    Embora toda informação possua inerente semântica, as tecnologias correntes da Web só permitem que seu significado seja interpretado por seres humanos, pois como o autor do artigo muito bem coloca, Isso acontece porque os programas de computador [ou mais precisamente, os programas que são capazes de processar informações semânticas] não são capazes de realizar a série de associações contextuais que são próprias da cognição humana. Para que os programas possam apresentar um comportamento minimamente parecido com o processo cognitivo característico dos humanos, torna-se necessário representar formalmente o conhecimento presente nos conteúdos Web; ou seja, fornecer metadados que sejam semanticamente interpretáveis por máquinas.

    Tags têm recebido grande atenção nos últimos tempos e é uma das forças alavancadoras da Web 2.0. Embora esse movimento tenha contribuído bastante para a evolução da Web, não se pode confundí-lo com os objetivos mais ambiciosos da Web Semântica (cujo sinônimo recentemente cunhado é Web 3.0). As tags nada mais são que vocabulários criados pelos usuários e cujo aproveitamento se dá pelo uso de folksonomias, que por sua vez permitem estabelecer relações entre objetos de conteúdo e usuários. Isso nada mais é do que uma forma de aproveitamento de redes sociais que se formam ao redor de uma base de conteúdos (como Flickr, YouTube, Delicious, etc.) e da exploração do inteligência coletiva que emerge desses cenários.Já a Web Semântica não se fundamenta na mera atribuição de tags, mas na atribuição de metadados formal e logicamente representados, ou melhor, instâncias de modelos de conhecimento denominados Ontologias (cujas tecnologias recomendadadas pelo W3C são RDF, RDF-S e OWL, ordenadamente por poder de expressão).

    As ontologias são modelos para representação de conhecimento sobre um determinado domínio e seu formalismo lógico é que permite a agentes (inteligentes) de software raciocionar sobre as informações da Web Semântica. O uso de tags só pode ser entendido como uma prática da Web Semântica se as mesmas são, de alguma forma, relacionadas a instâncias de conceitos presentes em ontologias ou alguma outra variante de representação de conhecimento que possa ser aproveitada por máquinas.

  10. Prezados,
    penso que o artigo está bom para este fórum. As novidades para o ponto de vista do mercado geralmente já foram problemas estudados ou resolvidos na academia, há tempos.

    Tive oportunidade de pesquisar sobre semantic web durante o mestrado e concordo que ainda há muito para a academia e a indústria resolver em relação a melhor composição de tecnologias (frameworks e padrões, como foi mencionado por um dos comentários).

    Mas cabe acrescentar que as possibilidades da utilização da semantic web vão além da pesquisa com melhor precision e recall; busca-se uma atuação mais autônoma e inteligente dos programas de computador para que facilitem a vida de pessoas (físicas e jurídicas) em problemas considerados complexos, pelo volume de processamento X tempo de resposta X confiabilidade da resposta.

  11. aff!

    Agora que eu vi que as tags não apareceram no meu texto, vou refazer o trecho confuso:

    Por exemplo: defini-se que titulos sempre serão na tag h1 e texto será sempre dentro de p. Na hora que o usuário buscar a informação, o robo de busca irá dar mais enfoque ao titulo e depois ao texto. Ou se vc procurar somente por titulo ele irá ler somente oque esta em h1 e não se preocupará com o conteúdo dentro do p.

  12. Acho que pecaram muito em fazer um artigo sobre Web Semântica e não fazer nenhuma referência a Microformats.

    A definição sobre web 2.0 no começo esta muito boa, só que web semântica não é uma futura web 3.0. Web Semântica ja é realidade agora da web 2.0.

    Nesta frase do artigo:
    No que consiste a web semântica? Trata-se de um conjunto de medidas que pretende criar significado, ou sentido, para tudo que habita a rede.

    Eu ja discordo desta afirmativa. Pelo oque eu conheço, Web Semântica é:
    Processo de separar e refinar a informação definindo sua relevância por tags. Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.

    Por exemplo: defini-se que titulos sempre serão na tag e texto será sempre dentro de . Na hora que o usuário buscar a informação, o robo de busca irá dar mais enfoque ao titulo e depois ao texto. Ou se vc procurar somente por titulo ele irá ler somente oque esta em e não se preocupará com o conteúdo dentro do .

    E é por isso que Web Semãntica está ligada a Web Standards pois todo esse processo de refinamento e separação pode ser prejudicado com códigos sujos e javascript obstrutivo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *