Focando os dois lados da organização da informação na web, temos a cruz e a espada: se de um lado temos as tags (folksonomia), que permitem uma democratização e a ampliação nas possibilidades de busca e recuperação da informação, temos os problemas que ela causa, como polissemia, erros de grafia, flexões de gênero e número e duplicidade de termos, entre outros.
Defendo a ideia de que a folksonomia tanto pode levar a informação até o usuário quanto fazer com que este nunca encontre o que está procurando.
Por outro lado temos os tesauros (vocabulários controlados), que são cuidadosamente elaborados por profissionais para que o site e as informações que este contém mantenham uma unidade de termos e seja simples a “encontrabilidade” de informações. Porém os tesauros exigem que os profissionais sejam capacitados e dominem a linguagem do usuário.
Para isso é preciso que o profissional “traduza” o que o usuário quer dizer e monte uma árvore hierárquica de termos próximos, análogos e/ou relacionados, para que a busca seja eficiente. O grande problema dos tesauros é que este exige o usuário também conheça e domine os termos indexados (o que limita as possibilidades de busca do ponto de vista do usuário).
Geralmente o que o usuário está pesquisando não é algo que ele conheça bem; muito pelo contrário, ao entrar num site o usuário está buscando justamente aquilo que não domina ou não conhece bem. Como podemos exigir então que ele saiba os termos que descrevam o conteúdo daquilo que está buscando?
Cada uma das soluções (uso de tags ou vocabulário controlado) tem pontos fortes e fracos. Um exemplo que eu sempre recomendo aos meus colegas é o do Google, Você pode pesquisar Jornal na Intnet (com erro de grafia mesmo) e ele retorna os resultados: Você quis dizer Jornal na Internet? E no final da página têm-se:
?Pesquise também: Jornal On-line, Jornal na Web, além de publicidade: Adquira jornais com o menor preço?.
Analisando a estrutura acima temos uma referência cruzada que remete de um termo não usado para o termo utilizado pelo sistema (como nas bibliotecas), e simultaneamente temos o feedback de outros termos que se relacionam com o termo pesquisado.
Resumindo: indexação com usabilidade e boa arquitetura de informação é isso! Não forçar o usuário a decorar termos, retornar os resultados e trazer variações desses termos, além de propor sugestões. Não devemos ser inimigos da usabilidade tampouco dos nossos usuários, afinal o arquiteto de informação, o bibliotecário e os profissionais de TI estão a serviço da clareza e da organização da informação.
E quanto menos o usuário perceber os passos realizados pelo mecanismo de busca do site, e quanto menos for evidente a arquitetura de informação e os processos internos de classificação, catalogação e indexação, mais eficiente e eficaz será o site.
Afinal do que adianta dizer ao usuário que ?a pesquisa não encontrou nenhum documento correspondente?? [Webinsider]
.
Rafael Marinho
Rafael Marinho (rafaelmarinho71@gmail.com) é arquiteto de informação, consultor em gestão da informação e mantém o blog Bibliotecário Virtual
9 respostas
Paz e bem!
Raphael:
Conheces a tese:
—–
Autor principal: Laan, Regina Helena van der
Orient.: Krieger, Maria da Graça
Título: Tesauro e terminologia : uma inter-relação lógica
Imprenta: 2002.
Descrição física: 262 f. : il.
Nota bibliog. etc.: Inclui bibliografia e anexos.
Trab. de conclusão: Tese (doutorado) – Universidade Federal do Rio Grande do Sul. Instituto de Letras. Programa de Pós-Graduação em Letras, Porto Alegre, BR-RS, 2002.
Resumo: Estudo compreendido como uma inter-relação lógica entre tesauros e Terminologia, mais especificamente nos princípios da Teoria Comunicativa da Terminologia ? TCT. Analisa um tesauro do ponto de vista da sua organização estrutural. Estuda os descritores verificando sua representatividade como um elemento de representação e recuperação das informações de uma área de especialidade. Sinaliza para uma nova abordagem em relação ao tratamento dos descritores aproximando-os a uma unidade lexical terminológica. Tem como pressuposto de trabalho que a relação que se estabelece entre um sistema de recuperação da informação ? SRI e os usuários do sistema é uma relação de comunicação. Apresenta algumas considerações e recomendações.
Texto completo: http://sabix.ufrgs.br/ALEPH/AC43R58X386ECLP1LGAG318D8U3Y9LV9CKC85LTP9B5FFCNRKY-08448/file/service-0?P01=000339228&P02=0026&P03=TAG
—–
Aponta a terminologia via intermediária entre a folksonomia e os thesauri.
Interessante a matéria. Estou tendo Introdução ao tratamento temático e percebi que vários termos utilizados nesta matéria são pertinentes a disciplina.
simplesmente fantástico. Parabenns
http://www.megadigitalbrasil.com
Na internet tudo é pra ontem. Por isso devemos de uma forma geral facilitar os caminhos e ser objetivos. Não basta apenas tratarmos bem o usuário é necessário que ele receba um tratamento VIP, as opçoes são grandes para ele, por isso esse tratamento.
Olá Rafael, achei fantástica essa metodologia que vocês estão usando e a forma de recuperação da informação. e Alessandro, eu percebi isso já há algum tempo e até mesmo como usuário eu prefiro recuperar alguma coisa que seja pouco relevante para o que estou procurando do que receber uma mensagem de erro desse tipo: busca sem resultados ?a pesquisa não encontrou nenhum documento correspondente???
Isso é frustrante!
Oi Rafael (Chará), interessante a matéria.
Acabou sendo pertinente a realidade de um projeto que participo (http://www.AcheCerto.com.br), onde já estamos pensando assim há algum tempo.
Teste lá pra ver nossa implementação de tolerância fonética (que esta em constante evolução) e erros de grafia para nossa busca…
Veja estes exemplos:
(Digitando Shopping Center como xop senter)
http://www.achecerto.com.br/xop-senter_estado_rio-de-janeiro.html
(Digitando Habibs como rabibes)
http://www.achecerto.com.br/rabibes_estado_rio-de-janeiro.html
Caso não seja possível encontrar, aplicamos a sistemática parecido com o Google (you did mean? sugestão de termos)
Veja estes outros:
(Digitando Shop Iguatemi como Shop Igautemi)
http://www.achecerto.com.br/igautemi_estado_rio-de-janeiro.html
(Digitando Jornal Globo como Joranl Gobo)
http://www.achecerto.com.br/joranl-gobo_estado_rio-de-janeiro.html
Teste ai com outros termos, fique a vontade!
Abraços
Raphael Vieira
É um assunto super atual, e que quase sempre é tratado superficialmente talvez por despreparo, ou importância, prazos, enfim …. Mas a questao é que o usuário tem que ter o que ele procura; caso contrario irá atras de outro que o traga seus desejos de busca…
Afinal do que adianta dizer ao usuário que ?a pesquisa não encontrou nenhum documento correspondente??
Ótimo artigo;
Interessante artigo, parabéns!
Muito interessante, precisamos de cada vez mais profissionais que organizem as informações nessa terra de ninguém que é a internet.