Taxonomias, vocabulário controlado e buscas (final)

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Os administradores do site Americanas.com parecem ter compreendido que, para o ser humano lidar com um grande número de itens, é melhor reunir aqueles que têm uma ou mais características comuns em “caixinhas” ou classes.

Na medida em que a população de itens dessas classes começa a ficar muito grande, criam-se, respeitando uma lógica de subordinação de assunto, novas subclasses. Para cada característica nova ou para um conjunto combinado delas, cria-se uma classe ou subclasse diferente.

E é exatamente esse processo de hierarquização que traduz a ideia-chave da taxonomia, ou seja, a prática e a ciência da classificação. Uma vez que o propósito da taxonomia, no campo da arquitetura da informação, é simplesmente facilitar a organização e a localização das informações por meio da classificação.

Outro buscador tradicionalmente conhecido por ter inovado com a utilização de filtros ou categorias é o do Yahoo!. Essa estratégia é e foi bastante citada e analisada na literatura na década de noventa e até considerada como um dos principais motivos que tornou o Yahoo! bastante conhecido e que o diferenciou dos demais concorrentes que, na maioria, já não existem mais.

A estrutura de categorias do Yahoo! é definida e mantida por uma equipe de editores que visitam e analisam os web sites, portanto a classificação das informações bem como a criação, edição ou exclusão de categorias não é feita com a participação direta dos usuários. Assim, é possível que uma determinada categoria ou classificação possa parecer totalmente estranha aos olhos de um usuário.

Tesauro

O tesauro e a taxonomia são os tipos de VC mais complexos e a lista e o anel de sinônimo são os mais simples. Mas na escala de complexidade dos VC, o tesauro é o mais completo ou complexo. Além da relação hierárquica, que é comum à taxonomia (alías é justamente essa a relação semântica que diferencia o grupo mais complexo (taxonomia e tesauro) do mais simples (lista e anel de sinônimo)), o tesauro possui as relações de sinonímia e associação.

Em um tesauro não existem palavras órfãs, todas elas estão conectadas por, no mínimo, uma das três relações semânticas básicas (sinonímia, hierarquia e associação) e que são representadas pelos indicadores de relacionamento que tornam explícitas e claras as relações de significado entre todos os termos. Em um tesauro não há espaço para ambiguidades, pois os problemas comuns da LN, que causam confusões como a homografia e a polissemia, estão controlados em um VC.

Na existência de uma relação de equivalência entre duas palavras, a forma variante preferida é chamada de termo preferido. E em torno desse termo preferido é construída todas as demais possíveis relações semânticas (fig. 11).

tesauro

Figura 11: relações semânticas básicas de um tesauro.

Um tesauro, dependendo do tamanho, pode ser “fatiado” em microtesauros, ou seja, em tesauros menores. Cada microtesauro representa uma determinada área do conhecimento ou especialidade que possuirá um número “x” de palavras-chave ou termos que, juntos, representam o núcleo-base da terminologia utilizada pelos especialistas.

Dessa forma fica mais fácil agrupar e gerenciar uma grande quantidade de palavras de diferentes especialidades. Vamos tomar como exemplo uma instituição como o Sebrae que trabalha com vários setores da economia e que possui um tesauro com vários microtesauros.

taxonomia_pao

Figura 12: relações semânticas do termo pão em um microtesauro da especialidade alimento.

O termo baguete do microtesauro de “Alimento” do exemplo da figura 12 recebe um qualificador que especifica o significado desse termo. Esse qualificador especifica o contexto ou o domínio de origem do significado.

Enquanto no microtesauro “Madeira e Mobiliário”, o termo baguete é acompanhado de um qualificador que, como uma glosa, contextualiza o significado do termo.

taxonomia_baguete

Figura 13: relações semânticas do termo baguete em um microtesauro da especialidade Madeira e Mobiliário.

O projeto do portal Sebrae

A integração tecnológica entre as taxonomias, as bases de dados e o Google Search Appliance

Falar sobre o perfil do cliente do Sebrae pode ser uma boa alternativa para introduzir e contextualizar o projeto do portal Sebrae e toda a complexidade da infraestrutura dos sistemas de informação: as bases de dados, o mecanismo de busca e o VC.

Primeiro porque será possível ao leitor dimensionar o tamanho e a complexidade dos desafios desse projeto e demais projetos a ele relacionados e, segundo, permitirá que os próprios leitores possam traçar linhas comparativas com instituições do mesmo porte ou do mesmo segmento.

O cliente Sebrae e suas facetas

A ideia-chave da arquitetura da informação do portal Sebrae foi criada baseando-se na segmentação dos perfis de necessidades do clientes. E com base nessa segmentação, foram “fatiados” e desenvolvidos microtesauros a partir do Vocabulário Controlado Sebrae (VCS).

Segmentação do cliente por momento empresarial, setor econômico e estado

O empreendedor, na trajetória empresarial dele, a contar desde o momento em que tem a perspectiva ou a decisão de conceber uma ideia de negócio até a concretização, consolidação e expansão do empreendimento, passa por momentos de vida empresarial específicos e bem delineados. Esses momentos empresariais ou estados são uma das principais formas que o Sebrae definiu para segmentar, analisar e entender os clientes (Sebrae, 2008).

Então, segundo o momento empresarial, o cliente Sebrae pode passar pelas seguintes fases: ser um potencial empresário; ser um candidato a empresário; ter um empreendimentos de 0 a 2 anos e ter um empreendimentos com mais 2 anos.

Contudo, para facilitar a comunicação com o usuário, essa terminologia técnica foi referenciada no portal Sebrae de maneira menos formal, sendo assim representada: o que o Sebrae pode fazer por mim; quero abrir um negócio; tenho uma empresa com menos de 2 anos, e tenho uma empresa com mais de 2 anos. Além dos momentos empresariais, o cliente pode ser segmentado de outras duas formas: o setor econômico de interesse e a região geográfica (estado) onde o empreendimento está ou será estabelecido.

Assim, as principais necessidades de um cliente do Sebrae podem estar agrupadas em uma ou mais facetas segundo o momento empresarial, setor e estado. Se considerarmos que o cliente do Sebrae pode ser segmentado por momento empresarial, setor e estado e que temos para cada uma dessas facetas, respectivamente, quatro momentos empresariais e 29 segmentos de negócio – a meta é abranger 38 segmentos por meio do portal Sebrae – e 26 estados; existem, então, um total de 3.016 possíveis combinações diferentes entre os valores de cada segmento.

Assim, em um primeiro momento, o grande desafio do projeto do portal Sebrae foi a dificuldade de criar uma arquitetura da informação que fosse aderente aos diferentes modelos mentais e às necessidades dos clientes, que são motivadas principalmente em razão do momento empresarial, setor de interesse e/ou localização. Além disso, essa arquitetura da informação deveria oferecer uma lógica de navegação que permitisse ao usuário, de acordo com essas facetas, seguir em tempo real a trilha correta, para que ele pudesse chegar ao lugar certo e encontrar as informações relacionadas aos temas de seu interesse.

O projeto do portal Sebrae e os primeiros passos para a solução dos desafios

Desde 2005, o Sebrae vem desenvolvendo ações planejadas de tematização de produtos e serviços já existentes, porém não havia a preocupação em ter uma abordagem segmentada, visando atender clientes cujo perfil necessitava uma ou mais das facetas apresentadas acima.

Por exemplo, o curso chamado Aprender a Empreender, criado originalmente para capacitar clientes candidatos a empresário de quaisquer segmentos econômicos, foi adaptado para dois segmentos, surgindo assim o “Aprender a Empreender: pousadas e hotéis” e o “Aprender a Empreender: têxtil e confecção”.

Essas primeiras experiências provaram ser exitosas e, hoje, a orientação é que esse processo de tematização seja crescente com o objetivo de atender aos clientes dos demais momentos empresariais, setores e estados.

Se já em 2005, o Sebrae avançava na tematização dos produtos e serviços no portal da instituição, por outro lado, ele ainda era um mural institucional estático e desintegrado desses processos. Apesar de encarado como um canal de comunicação com grande potencial, o portal era subutilizado e não dava vazão ao grande volume de informações e serviços capazes de contribuir para a massificação do atendimento da crescente população de empreendedores conforme pesquisas oficiais.

A ideia central do projeto do novo portal era, ao contrário do velho portal, dar maior ênfase aos conteúdos e serviços orientados para o atendimento ao cliente, buscando assim um equilíbrio entre os conteúdos de interesse dos usuários e os institucionais, que até então eram muito privilegiados e contribuíam muito pouco, na forma de resultados concretos, para a formação, consolidação e expansão dos pequenos negócios.

Para tanto, na fase denominada Equacionamento, junho de 2005, foram coletadas, equacionadas e alinhadas as informações tanto no âmbito da diretoria quanto no das unidades estratégicas do Sebrae Nacional visando aprimorar o portal como meio de atendimento aos clientes.

Após a fase de Equacionamento, as visões e expectativas foram consolidadas e sistematizadas em sete Eixos Referenciais, que permitiram o desenvolvimento das fases seguintes: Diagnóstico, Planejamento, e Implantação. A última fase do projeto, Implantação, foi finalizada em outubro de 2007, quando a primeira versão do portal foi ao ar com quatro sites de momento empresarial, 10 sites setoriais e 26 sites estaduais. Hoje, já existem 29 setoriais e a meta é chegar a 38.

Os eixos referenciais do projeto do portal Sebrae

Os eixos referenciais foram divididos em duas grandes classes, nucleares e ambientais. Os eixos nucleares são: governança do portal, arquitetura da informação, gestão de conteúdo e tecnologia da informação. Esses eixos são os que compõem o núcleo do projeto do portal na medida em que abrigam ações consideradas como fatores críticos de sucesso para o projeto. Os eixos ambientais são: Processos de Atendimento, Pessoas e Organização.

eixos_portal_sebrae

Figura 14: eixos referenciais do projeto do portal Sebrae.

Os eixos nucleares: arquitetura da informação, gestão de conteúdos e tecnologia da informação

Os eixos ambientais contêm processos cuja responsabilidade transcende as que foram definidas para o escopo do projeto, mas fazem interface com os eixos nucleares e, com isso, contribuem para a organização e o sucesso do projeto. Contudo, esse artigo limita-se a comentar apenas os eixos nucleares, porque foram a partir deles que emergiram ideias e propostas de criação do VCS, bem como a integração deles com as bases de dados, o mecanismo de busca Google Search Appliance (GSA) e o portal Sebrae.

Além dos desafios propostos pelo eixo Arquitetura da Informação, o projeto do portal Sebrae teve outros desafios, igualmente complexos. Eles foram investigados e equacionados sob os eixos Gestão de Conteúdos e Tecnologia da Informação.

Aliás, a arquitetura de informação do portal não poderia ter sido trabalhada sem que antes fossem resolvidos os problemas advindos da gestão de conteúdos, representada por uma “ecologia” de plataformas tecnológicas desenvolvidas durante anos, ou seja, todo o legado de sistemas de informação do Sebrae.

Eram ao todo 11 bases de dados – na época e atualmente coordenadas de forma descentralizada por diferentes áreas de negócio e desenvolvidas em diferentes linguagens de programação -, onde estão armazenadas quase a totalidade de informações e conteúdos sobre o portfólio de produtos e serviços do Sebrae.

Compilar e exportar todo esse pool bases para o CMS do novo portal exigiria tempo e recursos não disponíveis. Além disso, essa ação seria conflitante com uma das premissas do projeto, que queria evitar a redundância de informações.

Então, como abastecer o novo portal Sebrae com informações armazenadas em diferentes aplicações e em tempo real? Assim, inicialmente, para vencer essa etapa, que precedia qualquer ação de concepção e implantação de uma nova arquitetura da informação, todos os esforços foram concentrados nos eixos nucleares: Tecnologia da Informação e Gestão de Conteúdos. Com isso, os eixos nucleares foram desdobrados em demandas e ações estratégicas.

Abaixo, seguem as principais demandas dos respectivos eixos:

Tecnologia da Informação

a. Concepção e implantação de uma arquitetura tecnológica orientada a serviço, Service-oriented architecture (SOA), que permita a interoperabilidade entre o Content Management System (CMS) do portal e 11 sistemas de informação heterogêneos, cujas informações e funcionalidades convirjam, na forma de serviços, nas páginas web do portal que são administradas por esse CMS.

Esses serviços e informações são entregues à camada do portal por meio de Web Services (WS), evitando-se assim a redundância de informações de quaisquer das 11 bases de dados ou mesmo a manipulação do código fonte de suas respectivas aplicações.

Assim, sem o ônus de tempo e elevados custos, que são exigidos para a migração de sistemas e bases para uma nova plataforma de portal, ou pesados esforços em desenvolvimento para a integração de sistemas, obteve-se uma arquitetura em que o CMS do portal cumpre o papel de agregador de serviços e informações extraídas em tempo real desses 11 sistemas legados (fig. 15);

webservices

Figura 15: arquitetura tecnológica do portal Sebrae: integração entre as bases de dados e o CMS por meio de web services.

b. Integração das 11 bases de dados com o CMS do portal;

c. Integração do VCS com 6 do total de 11 bases de dados;

portal_sebrae_integracao

Figura 16: arquitetura tecnológica do portal Sebrae: integração entre o VCS, as seis bases de dados e o CMS por meio de web services.

d. Integração do Google Search Appliance (GSA) com o VCS, com as 11 bases de dados e com o CMS do portal;

portal_sebrae_integracao_17

Figura 17: arquitetura tecnológica do portal Sebrae: integração entre o GSA, o VCS, as 10 bases de dados e o CMS por meio de web services.

Gestão de conteúdos

a. Classificação de todos os registros de cada uma das 11 bases de dados segundo o momento empresarial, setor econômico e estado.

classificacao_registros

Figura 18: classificação dos registros das seis bases de dados segundo o momento empresarial, setor e estado.

b. Concepção e implantação da Base de Informação para o Atendimento (BIA), cujo objetivo é consolidar, em uma única base, os textos sobre atendimento ao cliente que se encontravam duplicados e/ou descentralizados em diferentes sites do Sebrae;

c. Concepção e implantação do VCS, que inicialmente continha 5.000 termos para indexação dos registros das bases de dados;

d. Indexação de todos os registros de seis das 11 bases de dados que alimentam o portal Sebrae.

indexacao_registros
Figura 19: Indexação dos registros das bases de dados com os termos do VCS.

Arquitetura da informação

Concepção, implantação de uma arquitetura de informação que proponha uma navegação simples e personalizada, de acordo com milhares de combinações possíveis de perfis de usuários; e que possibilite, sem poluir visualmente ou “ocultar” ou “dificultar” o acesso ao grande volume de produtos, serviços e informações relacionadas aos momentos empresariais, setores e estados, que se encontram armazenados em diferentes bases de dados.

Essas foram, de maneira sintética, as ideias-chave (na forma de demandas) que predominaram na concepção e implantação da plataforma tecnológica, da gestão, e da arquitetura da informação. A partir dessa infraestrutura tecnológica e dos processos de classificação e indexação, emergiram as variadas possibilidades de uso do VCS, com o objetivo de inovar e tornar positivas as experiências de navegação e recuperação das informações dos clientes do Sebrae.

Primeiros resultados (semânticos)

Quando bem integrado à arquitetura de informação e ao sistema de busca, o tesauro atua como uma mão invisível auxiliando na solução das equações semânticas e contribuindo para uma ótima apresentação na interface com o usuário.

As possibilidades de novos serviços de busca e de navegação oferecidos por um tesauro são muitas. Na prática, é bastante rico o potencial da quantidade e da qualidade dos resultados que podem ser obtidos a partir da soma de um tesauro com um mecanismo de busca.

Então como explorar em um portal essa inteligência semântica definida no tesauro? Já foi mostrado que um tipo de VC é mais “inteligente” na medida em que “controla” mais relações semânticas.

E um VC pode ter, no máximo, três relações semânticas básicas: sinonímia, hierarquia e associação. Por exemplo, o tipo tesauro é mais “inteligente” que o taxonomia, pois este último “controla” um número menor de relações semânticas que o primeiro. Da mesma forma, um buscador integrado a um tesauro é mais “poderoso” que outro integrado a uma taxonomia.

Mas uma integração tecnológica entre um mecanismo de busca e um VC não basta. A proposta de arquitetura de informação para o processo de busca é fundamental para favorecer ao usuário final uma experiência de busca e navegação capaz de entregar ao usuário o que a ele interessa, ou seja: a resposta para a pergunta dele.

Essa resposta pode ser um produto, um lugar, uma pessoa, um artigo, um livro, uma informação, etc. Os caminhos que levam a resposta podem consumir muito tempo e causar estados de frustração, impaciência, ansiedade, raiva ou confusão no usuário. Claro que o objetivo é desenhar um sistema de busca no qual a experiência do usuário seja no mínimo positiva e rica em descobertas afortunadas e casuais (serendipismo).

Assim, a tarefa de levantar recursos para comprar um bom mecanismo de busca (p.ex.: um daqueles que se encontram no Quadrante Mágico do Gartner) deixa de ser a única preocupação, pois é necessário considerar também o desafio de criação de um projeto inovador de customização e implantação desse buscador na camada de um web site.

Há diferentes formas de agregar valor ou “inteligência” a um mecanismo de busca. Uma delas é transformar um simples buscador que já vem de fábrica não “entendendo” as relações semânticas entre as palavras, em um buscador semântico capaz de eliminar ou diminuir, por exemplo, as “falsas recuperações”, gerando assim resultados de busca com maiores índices de precisão e revocação.

Os VC são ferramentas capazes de conferir essa inteligência a um buscador. Nesse sentido, a equipe do Sebrae explorou a múltiplas possibilidades para criar uma experiência de busca semântica a partir da integração tecnológica entre o GSA e o VCS.

A seguir, alguns exemplos de usos agrupados, segundo as relações semânticas.

Relação de sinonímia

A relação semântica de sinonímia ou equivalência trata da palavra ou termo que tem exatamente ou quase o mesmo significado que outra palavra. Nesses casos, em um VC, quando as palavras são homógrafas, utilizam-se os qualificadores. Nos bastidores de um site, esses qualificadores servirão como “pistas diferenciadoras” para que o “mecanismo de busca” possa “compreender” essas diferenças semânticas, cumprindo também esse objetivo na interface com o usuário.

Assim, o uso dos qualificadores é bastante útil no agrupamento dos resultados por contexto e eliminação da ambiguidade. Por exemplo, em uma busca com o termo “controle de qualidade” são gerados resultados onde os mesmos são agrupados por contexto, facilitando assim a navegação (fig.20).

Por exemplo, os documentos que falam sobre “controle da qualidade (alimento)”, no contexto alimentação, são agrupados separadamente dos documentos que falam sobre “controle da qualidade (bebida)”, contexto bebida.

resultado_busca

Figura 20: resultados de uma busca com o termo controle da qualidade.

sinonimia

Figura 21: relação de sinonímia para o termo educação a distância no VCS.

Quando os termos são grafados de formas diferentes e possuem o mesmo significado, essa relação de sinonímia é registrada no VC, indicando-se a forma preferida (termo preferido) e todas as possíveis variantes (termos não-preferidos) (fig.21).

Assim, uma pesquisa por EAD resulta em uma lista de resultados cujos documentos possuem, na íntegra do texto ou nos metadados, esse termo e/ou sinônimos. Além disso, são recuperados os documentos que não possuem EAD, mas quaisquer das variantes definidas nos VCS, “educação a distância” (escrito por extenso), “ensino a distância”, “educação pela internet” (fig. 22).

Então, o resultado dessa pesquisa tem um alto índice de revocação, pois o número de registros relevantes recuperados representa quase a totalidade de registros relevantes sobre esse tema existentes nas bases de dados.

busca_ead

Figura 22: resultados de uma busca com o termo EAD.

Relação de associação

Associação é a relação em um VC que leva um termo a outro termo que seja correlato e é, geralmente, expressa pelo indicador VEJA TAMBÉM ou TR (Termo Relacionado) (fig.23).

termo_cachaca

Figura 23: relação de relacionamento para o termo cachaça no VCS.

O uso dessa relação pode gerar na camada de busca sugestões para os usuários. Por exemplo, uma pesquisa com o termo cachaça, o resultado é acompanhado de uma caixa lateral chamada “Termos relacionados” que funciona como um lembrete sugestivo, ou seja, “Tente também uma busca com os termos caipirinha e/ou cachaça light” (fig.24).

termo_cachaca_relacionados

Figura 24: resultados de uma busca com o termo cachaça e seus termos relacionados.

Relação hierárquica

Como visto no capítulo Relações hierárquicas, no VC a hierarquia diz respeito à relação todo-parte que, geralmente, é indicada por meio de uma sintaxe TG (Termo Geral) e TE (Termo Específico) ou uma indentação para facilitar visualmente a identificação de uma relação de subordinação entre os termos.

No portal Sebrae as estruturas hierárquicas do VCS foram utilizadas como referencial para a criação de menus e submenus dos sites setoriais, pois essas estruturas contêm uma relação lógica de subordinação de assuntos. O Sebrae não explorou todas as possibilidades dessa combinação (tesauro + bases de dados + buscador + portal), o estudo e a criação da especificação técnica da relação semântica de hierarquia, traduzida em funcionalidades e serviços de navegação e busca que, quando da redação desse artigo, estava em curso e com uma perspectiva de diferentes alternativas para a criação de novos serviços por meio da combinação dessas tecnologias.

Esforço da integração tecnológica

O desafio para a implantação e alcance de resultados inovadores em um sistema de busca e navegação é multidisciplinar. A integração tecnológica entre sistemas heterogêneos (tesauro, várias bases de dados legadas, mecanismo de busca e CMS) deve envolver necessariamente diferentes profissionais e competências.

Como “transferir a inteligência” de um tesauro para um buscador que já vem de fábrica “ignorando” todas as possíveis relações semânticas entre os termos de um determinado idioma e especialidade técnica?

Como integrar um tesauro recém criado com um ou mais sistemas de informação que já existem na empresa há mais de uma década e que não têm planos e nem perspectivas de migrar para uma nova plataforma tecnológica? Tal como a linguagem natural um VC é dinâmico e precisa de atualizações continuadas, pois novos termos emergem e antigos termos caem em desuso. Então, como atualizar, simultaneamente e em tempo real, milhares de documentos indexados em diferentes bases de dados e armazenadas em diferentes servidores (que se encontram em diferentes localidades geográficas)?

E como garantir que a “inteligência uma vez transferida” para o buscador receba simultaneamente todas as atualizações feitas no tesauro?

Todas essas perguntas surgiram ao longo do projeto de criação, implantação e progressiva integração do VCS com as bases de dados, com o GSA e com o CMS do Portal Sebrae. Cada resposta foi concebida e trabalhada na forma de regras de validação e, hoje, formam os esquemas de WS (fig. 25).

Para cada pergunta surgida nesse processo, existe uma resposta-solução escrita na forma de esquemas que automatizam a rotina de intercâmbio de dados entre diferentes aplicações por meio de uma linguagem comum, XML.

ws_vcs

Figura 25: arquitetura do WS que existe entre o VCS e suas aplicações (p.ex.: GSA e bases de dados).

A criação desses esquemas teve início em 2006. Na época, a norma ISO 2788, Guidelines for the establishment and development of monolingual thesauri não era atualizada, desde 1985. Assim, sem referenciais teóricos e práticos, a atual arquitetura de WS do VCS foi construída e aperfeiçoada após inúmeras reuniões, testes e homologações equivocadas de esquemas.

Após o uso intensivo no ambiente de produção, alguns erros foram revelados, porém os ambientes de integração, entre o VCS e as aplicações cliente, são estáveis e possuem um bom desempenho após estudos e melhorias continuadas.

Em março de 2010, a International Standart Organization (ISO) liberou o acesso ao draft da norma ISO/DIS 25964-1, “Thesauri and interoperability with other vocabularies – Part 1: Thesauri for information retrieval”, que revisa e estende o conteúdo das normas ISO 2788 e ISO 5964, “Guidelines for the establishment and development of multilingual thesauri”.

Este projeto da ISO foi iniciado em maio de 2008 com o objetivo de atender a crescente demanda por interoperabilidade em uma realidade digital e em uma sociedade em rede. A Parte 1, oficialmente numerada ISO/DIS 25964-1, sugere um esquema XML desenvolvido para intercâmbio dos dados de um tesauro.

Hoje, os técnicos desenvolvedores do VCS estão estudando esses esquemas e os confrontando com os esquemas do WS do VCS que foram concebidos a partir de 2005. O objetivo dessa comparação é extrair algum aprendizado do trabalho realizado pelo ISO Technical Committee 46 (Information and documentation) Subcommittee 9 (Identification and description) e publicado na ISO/DIS 25964-1. A nossa feliz surpresa é notar que estávamos no caminho certo, pois o esquemas propostos nessa norma têm se revelado, ao longo desse estudo comparativo, muito similares aos criados no Sebrae meia década antes da sua publicação.

Conclusão

Em entrevista publicada no dia 29 de março de 2010 a Johnny Holland Magazine, Peter Morville, autor dos livros “Information architecture for the World Wide Web: designing large-scale web sites” e do mais recente “Search patterns: design for discovery” – o primeiro em parceria com Louis Rosenfeld e o segundo com Jeffery Callender -, diz que a busca é a inovação mais disruptiva do nosso tempo porque é ela que influencia o que compramos e para onde vamos.

Desenhar um projeto de busca para um portal é muito mais do que interessante, é essencial. O projeto deve ser feito com responsabilidade e com o objetivo de facilitar a navegação do usuário.

Peter Morville, na verdade, quando fala de inovação disruptiva se refere ao mesmo conceito dado por Clayton M. Christensen, quem originalmente criou esse termo. Clayton em seu mais recente livro, publicado em 2008, “The innovator’s prescription: a disruptive solution for health care”, dedica quase todo o primeiro capítulo dessa obra à revisão do conceito “tecnologia disruptiva”, termo criado há mais de 15 anos por ele e pelo colega dele e também pesquisador Michael E. Raynor.

Clayton Christensen afirma que provavelmente – desde a introdução desse termo pela primeira vez no dicionário do mundo dos negócios -, da mesma forma que houve muita confusão, houve também elucidação, porque “disrupção” e “tecnologia” carregam, a priori, muitas conotações.

Disrupção conota algo “radicalmente diferente” e “tecnologia” conota formas revolucionarias de se fazer coisas compreensíveis apenas por cientistas Ph.D. e gênios da computação. Como resultado dessas e outras conotações, “muito dos que apenas leram casualmente a nossa pesquisa tem assumido que o conceito de tecnologia disruptiva refere-se a uma tecnologia radicalmente nova”, afirma Clayton Christensen.

Mas Christensen diz que ele e Raynor tentaram dar ao termo um significado bem específico:

[…] “disruption” is an innovation that makes things simpler and more affordable, and “technology” is a way of combining inputs of materials, components, information, labor, and energy into outputs of greater value.

[…] A disruptive innovation is not a breakthrough improvement. Instead of sustaining the traditional trajectory of improvement in the original plane of competition, the disruptor brings to market a product or service that is actually not as good as those that the leading companies have been selling in their market. Because it is not as good as what customers in the original market or plane of competition are already using, a disruptive product does not appeal to them. However, though they don‟t perform as well as the original products or services, disruptive innovations are simpler and more affordable (CHRISTENSEN; GROSSMAN; HWANG, 2008).

E é por meio dessa simplicidade que o Sebrae deseja que os usuários do portal da instituição tenham uma experiência positiva de busca e navegação. O objetivo da complexidade de uma integração entre um VC e um buscador indexando várias bases de dados, tudo isso convergindo em um CMS, é é para resultar em simplicidade e em poderosas ferramentas para que o cliente as use com facilidade ou de forma quase imperceptível na camada de interface do portal.

Para tanto, é necessário o trabalho de equipes multidisciplinares como bibliotecários, tecnólogos, arquitetos da informação, web designers e outros mais para a gestão e implantação de um projeto multiplataforma.

Referências

Hedden, Heather. Better living through taxonomies. Digital Web Magazine, [s.l], 2008. Disponível em http://www.digital-web.com/articles/better_living_through_taxonomies/. Acesso em: 15 nov. 2009.

Merholz, Peter. Metadata for the masses. Outubo, 2004. Disponível em http://www.adaptivepath.com/ideas/essays/archives/000361.php. Acesso em: 16 de nov. 2009.

Morville, Peter; Callender, Jeffery. Search patterns. O’Reilly: Cambridge, 2010. 180p.

Morville, Peter; Rosenfeld, Louis. Information Architecture for the World Wide Web: designing large-scale web sites. 3ed. O’Reilly: Cambridge, 2006. 504p.

National Information Standards Organization. ANSI/NISO Z39.19-2003: guidelines for the construction, format, and management of monolingual thesauri. Baltimore, MD: NISO, 2005. Disponível em: http://www.niso.org/kst/reports/standards?step=2&gid=none&project_key=7cc9b583cb5a62e8c15 d3099e0bb46bbae9cf38a. Acesso em : 21 nov. 2009.

Salz, Peggy Anne. Talkin’ bout a B2B revolution. Econtent, Medford, NJ, v.32, n.7, p.10, sep. 2009.

A série completa:
Taxonomias: o que são e para que servem (1)
Taxonomias: uma palavra, muitos significados (2)
Taxonomias: etnoclassificação não é panacéia (3)
Taxonomias: os tipos de vocabulário controlado (4)
Taxonomias: equivalência e relação hierárquica (5)
Taxonomias: o relacionamento todo-parte (6)
Taxonomias: associar termos relacionados (7)
Taxonomia ou sistema de classificação (8 – final)

[Webinsider]

…………………………

Conheça os serviços de conteúdo da Rock Content..

Acompanhe o Webinsider no Twitter.

Geraldo Magela Souza (geraldo.souza@sebrae.com.br) é analista do Núcleo de Informação do Sebrae e mantém o blog Experiência Semântica.

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Mais lidas

0 resposta

  1. Geraldo,

    Excelente artigo, aliás bem como toda a série. Taxonomia ainda é (infelizmente) uma disciplina negligenciada nos projetos web. É um dos motivos por que atualmente o maior problema dos usuários é encontrar as informações de que precisam.

    No painel com fabricantes de plataformas para portais que realizamos no Prêmio Intranet Portal, eu perguntei se a classificação do conteúdo era uma demanda dos clientes nos projetos. Todos responderam que não! Basicamente o que se faz é definir termos sem nenhuma preocupação mais profunda de organização. Artigos como os seus são um caminho para aculturar o mercado.

    Parabéns

  2. Geraldo,

    parabéns pela série e excelente fechamento. Exposição rica que vai contribuir muito para que consultores convençam as organizações a investir nesta etapa da construção de um ambiente digital, seja uma intranet ou portal.
    Ter um buscador e indexar todo o conteúdo não basta para garantir a encontrabilidade da informação, como diz o livro “Findability” de Peter Morville.
    Você foi fundo e provou o resultado.
    Outra lição que você passa: não basta comprar o GSA e achar que tudo será encontrado. Há que se alimentar o dicionário do Google e criar essa camada de relacionamento para que o resultado seja uma experiência prazerosa para o usuário. Abs.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *