Nos artigos anteriores, vimos como o vocabulário controlado contribui para a melhoria da performance dos buscadores.
E também como a homografia pode gerar imprecisão nos resultados de busca. Vimos um exemplo de ambiguidade que mostra o espaço entre linguagem natural e vocabulário controlado.
A quantidade de tipos de relações semânticas existentes impacta na complexidade e na construção de um vocabulário controlado.
O conceito de equivalência aparece em diferentes situações em que os termos podem ser considerados sinônimos (apesar de termos exatamente sinônimos ser algo bastante difícil e até raro de acontecer).
As primeiras situações são:
Relações hierárquicas
A relação hierárquica é baseada em graus ou níveis de superordinação e subordinação, onde os termos superordinados representam os “pais” e os termos subordinados representam os “filhos” ou componentes desse todo. E é a relação hierárquica que distingue uma taxonomia ou um tesauro dos outros tipos mais simples de VC, como as listas e os aneis de sinônimos.
A reciprocidade de superordinação e subordinação deve ser expressa pelos seguintes indicadores de relacionamento:
- TG (Termo Geral), para o termo superordinado (termo pai)
- TE (Termo específico), para o termo subordinado (termo filho)
As relações hierárquicas cobrem três situações diferentes e mutuamente exclusivas: relacionamento genérico, por instância e todo-parte. O relacionamento poli-hierárquico é um tipo de relacionamento todo-parte. Vamos detalhar os dois primeiros.
Relacionamento genérico. Esse tipo de relacionamento é o mais comum e indica uma conexão entre uma classe e suas partes. E pode ser testada usando a lógica todo-e-algum abaixo exemplificada.
O exemplo acima indica que alguns membros da classe raiz tuberosa são conhecidos como mandioca e que toda mandioca, por definição e independente do contexto, é uma raiz tuberosa.
E no exemplo abaixo é ilustrada uma situação em que todo-e-algum não se encaixa. Enquanto algumas espécies (membros) da classe planta tóxica são conhecidas como mandioca; algumas, mas não todas, mandiocas são plantas tóxicas.
.
Relacionamento de instância. A relação de instância indica uma conexão entre uma categoria geral de coisas ou eventos expressa por um nome comum e uma instância individual dessa categoria, geralmente um nome próprio.
Regiões desérticas:
- Saara
- Kalahari
Na relação acima Saara e Kalahari estão numa posição hierárquica de subordinação, mas ambos não são tipos e nem partes de regiões desérticas, mas representam exemplos específicos ou instâncias. A relação hierárquica de instância pode ser indicada pelas seguintes abreviaturas:
- TGI = Termo Geral (instância)
- TEI = Termo Específico (instância)
Podendo ser expressa da seguinte forma:
Lendas da Amazônia
- TEI Curupira
- TEI Matinta Perera
No próximo capítulo vamos ver o relacionamento todo-parte.
A série completa:
Taxonomias: o que são e para que servem (1)
Taxonomias: uma palavra, muitos significados (2)
Taxonomias: etnoclassificação não é panacéia (3)
Taxonomias: os tipos de vocabulário controlado (4)
Taxonomias: equivalência e relação hierárquica (5)
Taxonomias: o relacionamento todo-parte (6)
Taxonomias: associar termos relacionados (7)
Taxonomia ou sistema de classificac?a?o (8 – final)
[Webinsider]
…………………………
Conheça os serviços de conteúdo da Rock Content..
Acompanhe o Webinsider no Twitter.
Geraldo Magela Souza
Geraldo Magela Souza (geraldo.souza@sebrae.com.br) é analista do Núcleo de Informação do Sebrae e mantém o blog Experiência Semântica.
Uma resposta
Primeiramente parabéns. Excelente série, linguagem de fácil entendimento e com exemplos práticos que demonstram de forma simples os conceitos.
Muito bom mesmo, ansioso pelos próximos capítulos.