O objetivo deste livro é apre-
sentar um modelo aplicado de
construção e manutenção de
tesauros para bibliotecas univer-
sitárias em âmbito digital e da
web conforme literatura revisio-
nada e normalização atualizada
pela ISO. Destina-se a gestores e
profissionais bibliotecários, com
a expectativa de que possam
utilizá-lo para tornar exequíveis
seus projetos de construção e de
aplicação de vocabulários con-
trolados.
O livro foi idealizado nos
moldes do desenvolvimento da
criação do Tesauro Unesp de
modo a espelhar o planejamento
e organização do plano de ação
proposto pelo projeto de pesqui-
sa “Linguagem de indexação
para bibliotecas na perspectiva
da política de indexação” (FUJI-
TA, 2015). Para levar adiante
esse projeto com duplo desen-
volvimento, teórico e aplicado,
contamos com a parceria inesti-
mável dos autores de todos os
capítulos que constituíram um
grupo de trabalho e de pesquisa
composto de pesquisadores da
Unesp e de outras universidades
nacionais e estrangeiras e biblio-
tecários da rede de bibliotecas da
Unesp que atuam diretamente no
trabalho de tratamento descritivo
e temático de suas bases de
dados digitais online. Tudo
foi
amplamente discutido, testado e
avaliado cujos resultados foram
divulgados em publicações científicas
como este livro. Além dos bibliotecá-
rios, tivemos a contribuição acadêmica
de alunos do Programa de Pós-gradua-
ção em Ciência da Informação da
Unesp e de pesquisadores de outras
universidades que estão presentes nas
autorias dos capítulos.
O contexto profissional e a infraes-
trutura de informação da Unesp foram
fundamentais para o desenvolvimento
de soluções que pudessem viabilizar a
harmonização de toda uma política de
indexação dentro da cultura de serviços
e sistemas de informação de sua rede
de bibliotecas. Provavelmente, outros
contextos deverão ser estudados para
que essa harmonização seja igualmen-
te alcançada e possa subsidiar as
adaptações necessárias à aplicação do
modelo. Linguagens de indexação para
bibliotecas são necessárias, mas
devem, também ser úteis aos propósi-
tos do processo de indexação e de
recuperação dentro do desenho da
cultura e da política de gestão.
Um manual de construção e manutenção de tesauros
para bibliotecas não é usual porque não é comum que
as bibliotecas construam tesauros e os mantenham
atualizados. Porém, acreditamos que essa prática é
necessária tendo em vista a necessidade constante de
atualização de vocabulário especializado e multidisci-
plinar exigido pela divulgação científica. Este livro foi
idealizado nos moldes do desenvolvimento da criação
do Tesauro Unesp e foi organizado de modo a espelhar
o planejamento e a organização de um tesauro no
contexto de bibliotecas universitárias. Assim como
outras bibliotecas, as bibliotecas universitárias estão
sujeitas à evolução tecnológica digital que afeta de
modo especial as práticas bibliotecárias e que as
obriga a se reinventar constantemente. Por isso, muitas
soluções apresentadas neste livro respeitam as condi-
ções ideais dessa mudança renovadora, mas respei-
tam, igualmente, as suas condições de exequibilidade.
Mariângela Spotti Lopes Fujita
Walter Moreira
(Organizadores)



Manual do planejamento,
construção e manutenção
do tesauro Unesp
para bibliotecas:
Manual do planejamento, construção e manutenção do tesauro Unesp para bibliotecas: do conceitual a práxis
do conceitual a práxis
ISBN 978-65-5954-068-6
Manual do planejamento,
construção e manutenção
do tesauro Unesp para
bibliotecas: do conceitual a
práxis
M  ,
  
  U 
:   

Malia/Ocina Universitária
São Paulo/Cultura Acadêmica
2021
M S L F
W M
(O)
UNIVERSIDADE ESTADUAL PAULISTA
FACULDADE DE FILOSOFIA E CIÊNCIAS - FFC
UNESP - campus de Marília
Diretor
Prof. Dr. Marcelo Tavella Navega
Vice-Diretor
Dr. Pedro Geraldo Aparecido Novelli
Conselho Editorial
Mariângela Spotti Lopes Fujita (Presidente)
Adrián Oscar Dongo Montoya
Célia Maria Giacheti
Cláudia Regina Mosca Giroto
Marcelo Fernandes de Oliveira
Marcos Antonio Alves
Neusa Maria Dal Ri
Renato Geraldi (Assessor Técnico)
Rosane Michelli de Castro
Parecerista
Prof.ª Dr.ª Brígida Maria Nogueira Cervantes
Professora Associada do Departamento de Ciência da Informação da Universidade Estadual de
Londrina (UEL).
Ficha catalográca
Serviço de Biblioteca e Documentação - FFC
Editora aliada:
Cultura Acadêmica é selo editorial da Editora UNESP
Ocina Universitária é selo editorial da UNESP - campus de Marília
Copyright © 2021, Faculdade de Filosoa e Ciências
M294 Manual do planejamento, construção e manutenção do Tesauro Unesp para bibliotecas : do
conceitual a práxis / Mariângela Spotti Lopes Fujita, Walter Moreira (organizadores). –
Marília : Ocina Universitária ; São Paulo : Cultura Acadêmica, 2021.
226 p. : il.
Inclui bibliograa
ISBN 978-65-5954-068-6 (Impresso)
ISBN 978-65-5954-069-3 (Digital)
DOI https://doi.org/10.36311/2021.978-65-5954-069-3
1. Tesauros - Desenvolvimento. 2. Organização da informação - Metodologia.
3. Linguagem documentária. 4. Indexação. 5. Registros de autoridade (Recuperação
da informação). I. Fujita, Mariângela Spotti Lopes. II. Moreira, Walter.
CDD 025.47
S
Agradecimento -------------------------------------------------------------------- 7
Apresentação
Mariângela Spotti Lopes Fujita, Walter Moreira -------------------------------- 9
Parte I
Fundamentos teórIcos e metodológIcos sobre tesauro
1. L       
  
Mariângela Spotti Lopes Fujita -------------------------------------------------- 17
. C    :   
          
 U
Walter Moreira --------------------------------------------------------------------- 51
. T:       
 
Maria Luiza de Almeida Campos ----------------------------------------------- 79
6 |
Parte II
dIretrIzes Para o Planejamento, construção e
manutenção do tesauro unesP
. T   U:     
,       
Lucia Silva Parra; Milena Maria Rodrigues Pedrozo
Rosane Rodrigues de Barros Ribas; Rosimara Loego
Telma Jaqueline Dias Silveira ----------------------------------------------------- 97
4.1 A    U
Mariângela Spotti Lopes Fujita, Walter Moreira,
Maria Luiza de Almeida Campos ------------------------------------------------ 100
. T      U: ,
     
Mariângela Spotti Lopes Fujita; Luciana Beatriz Piovezan Rio Branco
José Carlos Francisco dos Santos; Maria Marlene Zaniboni
Minervina Teixeira Lopes --------------------------------------------------------- 149
. P      
U  T
Walter Moreira; Deise Maria Antonio Sabbag;
Cibele Araújo C. M. dos Santos; José Carlos Francisco dos Santos
Luciana Beatriz Piovezan Rio Branco; Érica Fernanda Vitorini -------------- 193
Sobre Autores ---------------------------------------------------------------------- 219
| 7
A
Ao Conselho Nacional de Desenvolvimento Cientíco e
Tecnológico (CNPq) pelo nanciamento do projeto de pesquisa “Política
de Indexação para bibliotecas” (Processo 305648/2009-8) e à Coordenação
de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelas bolsas
de mestrado e doutorado que possibilitaram publicações conjuntas, bem
como, dissertações e monograas de conclusão de curso que integraram
este trabalho, possibilitando a construção de conhecimento contribuinte
para o desenvolvimento da ciência e para os serviços bibliotecários.
À Fundação de Amparo à Pesquisa do Estado de São Paulo
(FAPESP) pelo nanciamento do projeto de pesquisa “Linguagem de
indexação para bibliotecas na perspectiva da política de indexação
(Processo 2015/13410-8) com recursos para bolsa de treinamento
técnico-3, benefícios complementares e compra de equipamentos que
possibilitou o avanço da elaboração da Linguagem Unesp, instrumento
imprescindível para a política de indexação em bibliotecas.
À Coordenadoria Geral de Bibliotecas da Unesp, aos Diretores
de Bibliotecas da Unesp e, em especial, aos catalogadores pela participação
intensa no desenvolvimento dos estudos levados a cabo pelo Grupo de
Linguagem da Rede de Bibliotecas da Unesp, fundamental para a obtenção
Mariângela Spotti Lopes Fujita & Walter Moreira
8 |
dos resultados exitosos de planejamento, construção e manutenção do
tesauro Unesp para bibliotecas.
Aos autores, catalogadores e pesquisadores do Grupo de
Linguagem da Rede de Bibliotecas da Unesp pela convivência que nos
possibilitou compartilhar experiências, conhecimentos e dúvidas para
avaliar de forma crítica e construtiva o desenvolvimento da pesquisa-
ação que propiciou a construção do Tesauro Unesp mediante processo de
compatibilização terminológica entre linguagens de indexação de mesma
fonte dentro do espírito de troca de conhecimentos teórico-práticos.
| 9
A
Não é usual um manual de construção e manutenção de tesauros
para bibliotecas. Não porque não seja possível que bibliotecas possam
construir e manter um tesauro, mas porque essa não é a prática usual de
bibliotecas - terem um tesauro que construíram e que cuidam para mantê-
lo sempre atualizado. Porém, acreditamos que essa deve ser a prática tendo
em vista a necessidade de constante atualização de vocabulário especializado
e multidisciplinar exigido pela divulgação cientíca.
Em muitos casos a linguagem de indexação utilizada é de uma rede
cooperativa de bibliotecas, ou do uso de um mesmo software integrado para
a gestão dos diversos serviços de bibliotecas, ou também de uma linguagem
traduzida. Nessas situações, nem sempre é possível que os catalogadores
possam modicar a linguagem de indexação ou incluir termos, mesmo que
o vocabulário não seja o mais adequado para a representação dos conteúdos
dos documentos em processo de análise e representação. Essa situação gera
frustrações na indexação e resultados ruins na recuperação.
Além disso, o ideal é que a linguagem de indexação, como
ferramenta de conversão, deve ser utilizada, tanto pelo indexador após a
atribuição de conceitos identicados no documento, quanto pelo usuário
antes da atribuição de conceitos extraídos da necessidade de informação
que orientará a estratégia de busca no catálogo. Disso depende a simples
https://doi.org/10.36311/2021.978-65-5954-069-3.p9-14
Mariângela Spotti Lopes Fujita & Walter Moreira
10 |
disponibilização da mesma linguagem de indexação utilizada pelos
catalogadores na indexação para o usuário junto à ferramenta de busca.
A partir dessa providência relativamente simples, cará mais fácil para
o usuário entender que existe o trabalho de um catalogador por trás do
resultado recuperado que satisfez sua necessidade de informação e, por
consequência, gera a valorização do trabalho do catalogador.
Entretanto, a realidade das bibliotecas demonstra ser diferente
dessa conduta aparentemente simples, talvez porque a cultura do
compartilhamento de registros bibliográcos prontos tenha adotado
condutas de aceitação do que foi compartilhado da forma como está,
sem questionamento, não porque foi imposto, mas por uma questão
de respeito ao trabalho de outro prossional. Tal conduta prossional,
embora eticamente responsável, esbarra nos princípios de atendimento
às necessidades de informação de usuários que são sempre contextuais.
O compartilhamento é importante e necessário e não obriga a aceitação
irrestrita sem modicações.
Em pesquisa sobre uso de linguagens de indexação por bibliotecas
da região sudeste no Brasil com questionário aplicado em amostra
de 60 bibliotecas universitárias, as principais conclusões revelam o
desconhecimento de prossionais sobre a função mediadora da linguagem
de indexação, uso de várias linguagens de indexação por 24 bibliotecas
sem representatividade na indexação e na estratégia de busca; nenhuma
dessas bibliotecas disponibiliza a linguagem de indexação para consulta
dos usuários, um terço das bibliotecas desenvolve linguagem própria e
10 pretendem construir, revelam ainda desconhecimento de softwares de
gestão de tesauros e de construção compartilhada pela interoperabilidade
(CRUZ; SANTOS; FUJITA, 2016; FUJITA; CRUZ; PATRÍCIO, 2019).
Entendemos pelos últimos resultados que essa realidade é
propícia para mudanças. A prática prossional em bibliotecas tem
evoluído consideravelmente com as tecnologias de informação e ambiente
web facilitando o uso e manutenção de linguagens de indexação com
possibilidade de interoperabilidade. Por isso, esperamos que o esforço da
mudança de prática prossional realizado pelos catalogadores da rede de
bibliotecas da Unesp possa servir de inspiração à outras bibliotecas.
O livro foi idealizado nos moldes do desenvolvimento da criação
do Tesauro Unesp de modo a espelhar o planejamento e organização do
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 11
plano de ação proposto pelo projeto de pesquisa “Linguagem de indexação
para bibliotecas na perspectiva da política de indexação”. Por isso, dividimos
a organização dos textos em duas partes: Parte 1 – Fundamentos teóricos
e metodológicos sobre tesauro, composta de três capítulos iniciais que
tratam da gênese (capítulo 1) e dos princípios norteadores da construção
e gestão do Tesauro Unesp (capítulos 2 e 3); e Parte 2 – Diretrizes para o
planejamento, construção e manutenção do Tesauro Unesp, que contém
três capítulos dedicados ao “Manual do planejamento, construção e
manutenção do tesauro Unesp para bibliotecas: do conceitual a práxis”.
Tudo começou com o desenvolvimento do projeto de pesquisa
“Linguagem de indexação para bibliotecas na perspectiva da política
de indexação”, relatado no capítulo 1, que consistiu de: a) dimensão
teórica sobre linguagem de indexação, sua elaboração e manutenção com
enfoque em aspectos de conguração hierárquicas, semânticas e léxicas de
principais linguagens de indexação utilizadas por bibliotecas; b) dimensão
metodológica sobre pesquisa participante e pesquisa-ação para desenvolver,
com o Grupo de Linguagem da Rede de Bibliotecas da Unesp composto
de catalogadores de bibliotecas universitárias da Unesp e pesquisadores,
o plano de ação para elaboração, manutenção e uso da linguagem de
indexação; c) dimensão aplicada propiciou a construção emanutenção do
Tesauro Unesp mediante domínio de sua gestão com o software TemaTres,
a disponibilização do Tesauro Unesp junto à ferramenta de estratégia de
busca integrada, a construção da Taxonomia de áreas do conhecimento
da Unesp e a elaboração do Manual do Tesauro Unesp para uso dos
catalogadores.
A dimensão metodológica desse projeto de pesquisa foi essencial
para o desenvolvimento do plano de ação para elaboração, manutenção e
uso da linguagem de indexação. A pesquisa participante e pesquisa-ação
tornaram possível a oportunidade única de envolvimento cooperativo
entre pesquisadora e participantes em torno da situação de elaboração,
implantação, manutenção e uso da linguagem de indexação. Para isso,
destacamos o apoio institucional da Coordenadoria Geral de Bibliotecas
da Unesp no desenvolvimento do projeto junto à rede de bibliotecas
universitárias com a participação dos catalogadores e do Grupo de
Linguagem da Rede de Bibliotecas da Unesp.
Mariângela Spotti Lopes Fujita & Walter Moreira
12 |
Nos capítulos 2 e 3 estão os fundamentos teóricos e metodológicos
inicialmente transmitidos pelos pesquisadores convidados, Prof. Dr.
Walter Moreira e Profa. Dra. Maria Luiza de Almeida Campos, em dois
cursos de capacitação cujos conteúdos devem ser precursores das discussões
sobre a criação ou adequação do tesauro como linguagem de indexação
para bibliotecas. O curso de capacitação “Construção e manutenção de
tesauro”, convertido no texto do capítulo 2 pelo Prof. Dr. Walter Moreira,
esclarece os elementos constituintes de um tesauro, termos, conceitos e
relações conceituais, no contexto da interdisciplinaridade com a área de
Terminologia e os elementos de categoria, faceta e taxonomia da área de
Classicação aplicados aos tesauros com enfoque em relações terminológicas
e relações conceituais. O capítulo 3 “Tesauros: principal aspecto teórico e
metodológico para a sua elaboração” tem conteúdo compatível com o curso
de capacitação de mesmo título ministrado pela Profa. Dra. Maria Luiza de
Almeida Campos aos catalogadores da Unesp. Descreve os principais tipos
de vocabulários com enfoque no Tesauro documentário e seus principais
elementos, os termos, relações conceituais entre termos e a categorização
de um domínio.
Os dois primeiros capítulos da Parte 2 foram pensados com base
nos citados elementos essenciais de um tesauro, conceitos, termos e suas
relações conceituais (capítulo 4) e a categorização (capítulo 5).
O último capítulo (6) é dedicado à operacionalização do tesauro
com base no software TemaTres e tendo como referência o registro de
autoridades em formato de intercâmbio MARC para interoperabilidade
com outras linguagens de indexação.
Nestes três capítulos foi demonstrado como se desenvolveu um
sosticado esquema de compatibilização de linguagens de indexação de
mesma fonte, a Library of Congress Subject Headings (LCSH), para a
produção de um tesauro a partir de registros de autoridades em MARC
já existentes e criados. A criação de novos termos sustenta a veracidade
e indiscutível necessidade de bibliotecas construírem suas linguagens de
indexação ainda mais neste momento de grandes avanços da catalogação.
As ações de cooperação e de promoção de interoperabilidade, vale
ressaltar, não lograrão sucesso sem que as bibliotecas envolvidas nesse
processo estejam comprometidas com a padronização e a qualicação dos
procedimentos de tratamento da informação que realizam.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 13
O contexto prossional e a infraestrutura de informação da
Unesp foram levados em consideração para o desenvolvimento de
soluções que pudessem viabilizar a harmonização de toda uma política
de indexação dentro da cultura de serviços e sistemas de informação da
rede de bibliotecas. Provavelmente, outros contextos deverão ser estudados
para que essa harmonização possa coexistir. Linguagens de indexação para
bibliotecas são necessárias, mas devem, também, ser úteis aos propósitos
do processo de indexação e de recuperação dentro do desenho da cultura e
da política de gestão.
Mariângela Spotti Lopes Fujita
Walter Moreira
CRUZ, M.C. A; SANTOS, L. P.; FUJITA, M. S. L. Linguagens de indexação em
bibliotecas universitárias brasileiras: diagnóstico preliminar das regiões sul e sudeste. In:
ENCONTRO DA ASSOCIAÇÃO DE EDUCAÇÃO E PESQUISA EM CIÊNCIA
DA INFORMAÇÃO DA IBEROAMÉRICA E CARIBE - EDICIC, 10., 2016,
Belo Horizonte. Anais do Encontro da Associação de Educação e Pesquisa Em Ciência
da Informação da Ibero-América e Caribe. Belo Horizonte: ECI/UFMG, 2016. v. 1.
p. 1821-1835. Disponível em: https://pt.scribd.com/document/372647015/Anais-
Edicic2016. Acesso em: 10 jul. 2020.
FUJITA, M. S .L.; CRUZ, M. C. A.; PATRÍCIO, B.O.M. Linguagens de indexação
em bibliotecas universitárias: estudo analítico. Informação &Informação, Londrina, v.24,
p.190 -225, 2019. http://dx.doi.org/10.5433/1981-8920.2019v24n1p190.
Parte 1
Fundamentos teóricos e
metodológicos sobre tesauro
| 17
1. L   
   
  
1
Mariângela Spotti Lopes Fujita
1.1 Introdução
1.2 Linguagem de indexação em Biblioteconomia e Ciência da Informação
1.3 A construção do tesauro Unesp: plano de ação e resultados
1.3.1 Plano de ação para a construção do tesauro Unesp
1.3.1.1 Compatibilização de registros de autoridade
1.3.1.2 Construção da Taxonomia das áreas de conhecimento na Unesp: a
macroestrutura
1.3.1.3 Software para gestão e manutenção do Tesauro Unesp
1.3.1.4 Disponibilização do Tesauro Unesp para consulta e uso na indexação e
recuperação da informação
1.3.1.5 Manual do Tesauro Unesp
1.4 Considerações nais
Referências
Apêndice A – Manual do Tesauro Unesp – Estrutura Preliminar
Apêndice B - Lista das publicações que demonstram o desenvolvimento das etapas do
plano de ação
Projeto de pesquisa desenvolvido no período de novembro de 2014 a nov. 2017 com apoio da FAPESP e do
CNPq
https://doi.org/10.36311/2021.978-65-5954-069-3.p17-50
Mariângela Spotti Lopes Fujita & Walter Moreira
18 |
1.1 Introdução
Este capítulo traz o relato do desenvolvimento do projeto de
pesquisa sobre linguagem de indexação para bibliotecas que se originou da
evolução da política de indexação na rede de bibliotecas da Unesp. Um dos
pontos principais da política é que o processo de indexação necessita de uma
linguagem dotada de vocabulário continuamente atualizado para realizar
a adequada representação dos conteúdos cientícos cuja característica é
justamente a evolução constante. Bibliotecas sempre utilizaram listas de
cabeçalhos de assuntos, cuja pré-coordenação de termos, não acompanhava
a rapidez de atualização do vocabulário cientíco. Esta situação mudou
com a transição de importantes listas de cabeçalhos de assunto para tesauros
tal como a Library Congress Subject Headings, considerada linguagem
de referência mundial por bibliotecas. A decisão de ter uma linguagem
de indexação que pudesse ser continuamente atualizada a partir de suas
fontes originais é uma proposta que se tornou realidade na política de
indexação adotada pelas bibliotecas da Unesp. O objetivo nal alcançado
proporcionou a redação deste manual de elaboração, implantação, uso e
avaliação de linguagem de indexação para bibliotecas universitárias.
A investigação sobre o tema linguagem de indexação tem
como objeto de análise a elaboração, manutenção e uso de linguagem de
indexação em catálogos de bibliotecas universitárias que não dispõem de
instrumental teórico e metodológico para essas nalidades.
A linguagem de indexação, como ferramenta de conversão, deve
ser utilizada, tanto pelo indexador após a atribuição de conceitos extraídos
do documento, quanto pelo usuário antes da atribuição de conceitos
extraídos da necessidade de informação que orientará a estratégia de busca
no catálogo.
O uso de uma linguagem de indexação para escolha do descritor
ou cabeçalho de assunto reduz a diversidade e a ambiguidade do vocabulário
e estabelece uma uniformidade de representação dos termos selecionados
pelo indexador para descrever o assunto dos documentos, já que vários
autores podem utilizar diferentes palavras para expressar uma mesma ideia,
assim como os usuários podem apresentar diversidade de vocabulário
quando da expressão de uma estratégia de busca.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 19
A linguagem de indexação faz-se necessária uma vez que a
qualidade dos serviços de disseminação da informação depende da linguagem
utilizada pelo sistema para a indexação e recuperação dos documentos. Isso
se dá quando a linguagem do sistema permite que se traduza a linguagem
natural do autor sem que se perca a ideia principal e quando permite que se
traduza a linguagem do usuário de modo que satisfaça suas necessidades de
informação. Esse é o foco da representação da informação dentro do processo
de indexação. Para isso, depende de vários componentes para completar o
conjunto de procedimentos e atingir seus objetivos de recuperação, quais
sejam, o indexador, a linguagem de indexação, elementos e variáveis da
política de indexação da biblioteca ou serviço de informação.
A indexação, manual, semiautomática ou automática, tem por
objetivo o armazenamento das representações conceituais dos documentos
para atender as necessidades de informação (GIL LEIVA, 2008, p. 70),
compreendendo, fundamentalmente, duas etapas: 1) Análise de assunto;
2) Representação de conceitos.
As bibliotecas, tendo em vista o modo como realizam a catalogação
cooperativa no sistema de bibliotecas universitárias, tem a necessidade de
sistematizar processos e condutas de indexação e para isso dependem de
uma política elaborada em consenso por catalogadores para o planejamento,
elaboração e implantação de normas, procedimentos, técnicas e manual da
política de indexação com orientações gerais e especícas.
Considerando-se que a investigação sobre política de indexação
em bibliotecas iniciou-se pelos aspectos da indexação, a ordenação do
desenvolvimento da pesquisa foi realizada tendo em vista Lancaster (2004)
e Gil Leiva (2008), examinando-se:
prática de indexação: processo de indexação, tematicidade,
normas sobre indexação, manuais de indexação, indexação
automática;
qualidades da indexação: exaustividade, especicidade,
correção e consistência
ferramentas para a indexação: listas de cabeçalhos de assunto
e tesauros
avaliação da indexação
Mariângela Spotti Lopes Fujita & Walter Moreira
20 |
A proposta de política de indexação desenvolvida e avaliada
tornou-se o “Manual de política de indexação de bibliotecas universitárias
da Unesp” (FUJITA, 2014), um conjunto de condutas, procedimentos e
instrumentos imersos em um contexto de gestão e envolvidos pela cultura
organizacional da biblioteca.
Pelas características de desenvolvimento da pesquisa e da
articulação de ambos os grupos, de pesquisadores e de catalogadores,
signicou que a política de indexação emanou de uma negociação entre as
pessoas que realizaram um consenso, pautados por fundamentação teórica e
metodológica e respaldados pelo conhecimento prático, para promoverem
um serviço estratégico com resultados visíveis para a comunidade. Por isso,
a proposta foi subdividida em três partes principais: os elementos da política
de indexação, o processo de indexação e o instrumento da indexação.
Neste sentido, é importante observar que a pesquisa desenvolveu
um produto altamente qualicado de política de indexação cujos
resultados são, principalmente, a modicação das condutas de catalogação
de assuntos, pois o desenvolvimento do Manual de indexação pautou-
se por sua implantação e avaliação, simultaneamente. Isso signica que
a política de indexação foi aceita, implantada, avaliada e determinante
para a mudança de realidade de atuação prossional dos catalogadores e
do catálogo online ATHENA. Dentre os itens realizados, iniciou-se, em
separado, o trabalho de sistematização da Linguagem Unesp.
A linguagem de indexação da rede BIBLIODATA, anteriormente
adotada para a representação de assuntos no catálogo online da rede de
bibliotecas da Unesp, por não estar disponibilizada na web junto à
ferramenta de busca, nunca foi conhecida ou utilizada por usuários durante
a estratégia de busca. Portanto, nunca existiu a mediação da linguagem
no catálogo ATHENA e, em realidade, não precisaria ser utilizada pelos
catalogadores, pois a linguagem natural era a mais utilizada pelos usuários,
como demonstraram os resultados obtidos do estudo de avaliação realizado
por Boccato, Fujita, Gil Leiva (2011). O estudo de avaliação vericou
o desempenho pelos índices de precisão e revocação de recuperação da
informação de áreas cientícas especializadas em 3 áreas de conhecimento
no catálogo Athena (GIL LEIVA, 2008; LANCASTER, 2004).
Em consequência desse problema, foi observado que, os
catalogadores na tentativa de resolver o problema de recuperação para os
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 21
seus usuários passaram a utilizar o campo 690, além do campo 650 do
MARC autorizado para os cabeçalhos de assuntos da Linguagem da Rede
BIBLIODATA (LCARB)
2
. Nesse campo 690, cada biblioteca resolveu
colocar descritores de outras linguagens mais especializadas e conhecidas
por seus usuários e até termos de linguagem livre por falta de procedimentos
sistematizados de análise documental de conteúdos e, em consequência, a
linguagem não era utilizada em toda a sua capacidade de vocabulário e
de estrutura sintático-semântica. Por esse motivo, o “Manual da Política
de Indexação das bibliotecas universitárias da Unesp” (FUJITA, 2014) se
compõe de três partes: a denição dos elementos da política de indexação
que causam inuência na recuperação dos assuntos no catálogo ATHENA,
o processo de indexação para a catalogação de assuntos dos documentos
das bibliotecas e a linguagem de indexação como instrumento de controle
de vocabulário para mediar a representação temática na indexação e na
estratégia de busca durante a recuperação por assuntos.
Na parte de instrumento de indexação, o texto refere-se ao uso de
somente uma linguagem de indexação que o Grupo decidiu por denominar,
inicialmente, de “Linguagem Unesp” considerando resultados de avaliação
da Linguagem da Rede BIBLIODATA (LCARB) em comparação com
a Linguagem da Biblioteca Nacional. A decisão de usar uma linguagem
construída pela rede de bibliotecas da Unesp foi tomada em função de dois
motivos: a LCARB estava desatualizada e não teria mais manutenção tendo
em vista a desativação do sistema BIBLIODATA pela Fundação Getúlio
Vargas
3
; foi necessário realizar a compatibilização de vocabulário de uma
mesma linguagem a ser utilizada na indexação e na estratégia de busca para
obter resultados de recuperação mais precisa, correta e especíca.
Nessa ocasião, em que foi constatado que a LCARB não atendia
às necessidades das bibliotecas universitárias da Unesp, foi necessário
realizar o processo de substituição dos termos de uma linguagem pela
outra à medida do processo de indexação. Em consulta ao sistema
BIBLIODATA, foi assegurada a importação de registros bibliográcos sem
a obrigatoriedade de adoção de sua Lista de Cabeçalhos de Assuntos para
realizar, durante a indexação, a substituição da LCARB pela linguagem
 A Linguagem da Rede BIBLIODATA (LCARB) foi utilizada até 2013 pelo sistema de bibliotecas da Unesp.
 O sistema BIBLIODATA e sua linguagem de indexação está atualmente sob responsabilidade do IBICT.
Mariângela Spotti Lopes Fujita & Walter Moreira
22 |
da Biblioteca Nacional, Library of Congress Subject Headings (LCSH) e
Medical Subject Headings (MeSH).
As linguagens citadas para compatibilização são atualizadas e
utilizadas por várias bibliotecas no Brasil e no mundo, cujos catálogos são
acessíveis pela web. Além disso, é expressivo o número de descritores que
possuem. A Terminologia de assuntos da Biblioteca Nacional, no Brasil,
adota a LCSH como fonte de vocabulário.
A compatibilidade de vocabulários entre linguagens de mesma
raiz e estrutura formaram a estrutura léxica e lógica da Linguagem Unesp:
Terminologia de assuntos da Biblioteca Nacional
4
, Library of Congress
Subject Headings (LCSH)
5
e Medical Subject Headings (MeSH)
6
. Dessa
forma, a linguagem UNESP foi disponibilizada com o nome de “Tesauro
Unesp
7
ao usuário para consulta com a garantia de compatibilização de
vocabulário utilizado na indexação.
Quando um registro bibliográco é criado, o catalogador faz a
descrição bibliográca do item documentário nos campos devidos e quando
se depara com os campos de assunto, recorre à Base de Autoridades de
Assuntos de Registros de autoridade que formam, atualmente, o Tesauro
Unesp em formato MARC21.
Os registros de autoridade destinam-se a conter informação
autorizada para padronizar nomes e assuntos a serem usados como
pontos de acesso em registros bibliográcos, bem como permitir os
relacionamentos entre eles. Compõem uma base de dados que é consultada,
tanto pelo catalogador ao atribuir os termos que representam assuntos,
quanto automaticamente pelo próprio sistema para correção de termos
e inclusão de remissivas dentro dos registros bibliográcos. Isso signica
que os registros de autoridade têm o objetivo de assegurar a constante
padronização da linguagem de indexação de forma automática e podem ser
transferidos de uma base de dados para outra na formação dos catálogos de
bibliotecas e rede de bibliotecas. Abaixo se demonstra exemplo de registro
de autoridade de termo tópico da Biblioteca Nacional na versão de cha
completa para o usuário e no formato MARC21:
 http://acervo.bn.gov.br/sophia_web/busca/autoridades
 http://id.loc.gov/authorities/subjects.html
 https://www.nlm.nih.gov/mesh/meshhome.html
 https://www.biblioteca.Unesp.br/tesauro/vocab/index.php
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 23
Figura 1- Ficha completa do termo “Contratos de afretamento
Descrição Contratos de afretamento (subdividido geogracamente)
Library of Congress
Charter-parties
Remissiva Ver (US/UF)
Areightment
Afretamento - Contratos
Chartering of ships
Contratos de frete marítimo
Fretes marítimos - ContratosShip chartering
Remissiva Ver Também (TR) TG: Direito marítimo TG: Fretes
Fonte positiva dos dados (R) LCSH
Fonte: Catálogo de Autoridades da Biblioteca Nacional
Figura 2 - Ficha no formato MARC21 do termo “Contratos de afretamento
000 00563cz a2200217o 4500
001 000085744
003 Br
005 20070227114454.6
008 070208d| anznnbabn a ana d
035 __ |a 2007020811064084med
040 __ |a Br |c Br |f Br
150 __ |a Contratos de afretamento
450 1_ |a Areightment
450 __ |a Afretamento |x Contratos
450 __ |a Chartering of ships
450 __ |a Contratos de frete marítimo
450 __ |a Fretes marítimos |x Contratos
450 __ |a Ship chartering
550 1_ |w g |a Direito marítimo
550 __ |w g |a Fretes
670 1_ |a LCSH
750 _0 |a Charter-parties
Fonte: Catálogo de Autoridades da Biblioteca Nacional
Mariângela Spotti Lopes Fujita & Walter Moreira
24 |
Obedecendo ao formato e à Linguagem de indexação adotada, o
catalogador podeformar o cabeçalho, caso não esteja pronto, extraindo os
termos autorizados da Base deAutoridades de Assuntos e os distribuindo
nos campos e subcampos destinados ao assuntodo registro bibliográco.
Outro aspecto a ser colocado é referente à atualização do
vocabulário controlado do Tesauro Unesp com termos novos. Considerando-
se a constante evolução cientíca registrada pelos recursos de informação
presentes nas coleções impressas e digitais das bibliotecas universitárias,
surgiram termos que não são encontrados em nenhuma das linguagens de
compatibilização. Foi necessário investigar procedimentos da criação de
termos novos. Observamos pelos procedimentos que termos novos precisam
estar vinculados à uma ou mais áreas de conhecimento para identicação,
principalmente, de termos genéricos e especícos e isso depende de um
conjunto de estruturas hierárquicas de áreas do conhecimento que oriente
a inclusão e classicação dos termos. Nos Quadros 1 e 2 é possível vericar
a estrutura hierárquica dos termos superordenados e subordinados que
compõe a “Macroestrutura do Vocabulário USP”
8
:
Quadro 1- Macroestrutura com as relações Lógico-Semânticas com as
áreas e terminologia em seus diferentes níveis
CA100 CIÊNCIAS AGRÁRIAS
AGRONOMIA
CA120 ENGENHARIA DE PESCA
CB200 BIOCIÊNCIAS
CB210 BIOLOGIA
CB220 BOTÂNICA
CB230 IMUNOLOGIA
CB240 MICROBIOLOGIA CB250 ZOOLOGIA
Fonte: Vocabulário Controlado da USP: http://vocabusp.sibi.usp.br/Vocab/Sibix652.dll/Mac.
Vericar que este relato se remete à nossa experiência de participação inicial do desenvolvimento pioneiro do
Vocabulário USP pela equipe de pesquisadores e prossionais da USP em “Histórico do Vocabulário Controlado
do SIBI/USP”. http://143.107.154.62/Vocab/imagens/Historico.htm.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 25
Quadro 2 - Vocabulário Controlado do SIBi/USP - Ordem Hierárquica
dos Assuntos
CÓDIGO DA MACROESTRUTURA DESCRITORES
CH712 ECONOMIA
CH712.1 CENSOS
CH712.1.1 CENSO AGRÍCOLA
CH712.1.2 CENSO AGROPECUÁRIO
Fonte: Vocabulário Controlado da USP: http://vocabusp.sibi.usp.br/Vocab/Sibix652.dll/ARV?Hier=CH712
Essa macroestrutura é uma ferramenta de classicação de organização
intelectual e ordem hierárquica dos assuntos do Vocabulário SIBi/USP que
pode ser denominada de taxonomia. A Linguagem de indexação Unesp não
possuía uma taxonomia que precisava ser criada para orientar a alteração
de termos importados da Linguagem da Rede BIBLIODATA (LCARB)
e a inclusão de termos novos pela organização dos registros de autoridade.
Aparentemente, a Terminologia de Assuntos da Biblioteca Nacional (BN) e a
Library of Congress Subject Headings (LCSH) não possuem uma taxonomia
que organiza a ordem hierárquica dos assuntos dentro de seus registros de
autoridade, porém, todos os termos possuem uma organização hierárquica
evidente nas chas dos termos da Biblioteca Nacional que segue a Classication
Web da Library of Congress
9
como se observa nas Figuras 3 e 4:
Figura 3 - Ficha da autoridade – Termo tópico “Engenharia de
Transportes” na Linguagem da Biblioteca Nacional
Descrição Engenharia de transportes (subdividido geogracamente)
Library of Congress
Transportation engineering
Remissiva Ver Também (TR)
TE: Engenharia de tráfego
TE: Engenharia ferroviária
TE: Engenharia rodoviária
TG: Engenharia
TG: Engenharia civil
Fonte positiva dos dados (R) LCSH
Fonte: Terminologia de assuntos da Biblioteca Nacional .
 https://classweb.org/
Mariângela Spotti Lopes Fujita & Walter Moreira
26 |
Figura 3 - Ficha da autoridade – Termo Tópico “Banks and banking,
Cooperative” da LCSH
Banks and banking, Cooperative
From Library of Congress Subject Headings URI(s)
http://id.loc.gov/authorities/subjects/sh85011651 info:lc/authorities/sh85011651 http://id.loc.
gov/authorities/sh85011651#concept
Instance Of
MADS/RDF Topic
MADS/RDF Authority
SKOS Concept
Scheme Membership(s)
Library of Congress Subject Headings
Collection Membership(s)
LCSH Collection - Authorized Headings
LCSH Collection - General Collection
LCSH Collection - May Subdivide Geographically
Variants
Cooperative banks
Credit cooperatives
Peoples banks
Broader Terms
Banks and banking
Cooperative societies
Narrower Terms
Agricultural cooperative credit associations
Credit unions
Rotating credit associations
Closely Matching Concepts from Other Schemes
Banche cooperative
Banques coopératives
Genossenschaftlicher Bankensektor
Fonte: Library of Congress Subject Headings.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 27
O processo de substituição de uma linguagem pelas outras foi
iniciado em junho de 2012 e está em andamento a partir da construção
em formato MARC21 de registros de autoridade de assuntos tópicos e
geográcos para descritores da linguagem Unesp. Esses procedimentos,
descritos em Ribas e Parra (2016), são etapas da construção da Linguagem
Unesp que altera termos importados da Linguagem LCARB ou inclui
termos novos conforme procedimentos da terminograa.
Considerando-se a necessidade de construção da linguagem de
indexação bem como a observação do problema de estruturação hierárquica
de áreas de conhecimento da Unesp, foi realizada a investigação sobre o
processo de construção do Tesauro Unesp a partir da compatibilização de
registros de autoridade de outras linguagens de indexação de mesma fonte
e elaboração da Taxonomia contendo as estruturas hierárquicas de áreas de
conhecimento da Unesp na perspectiva de sua política de indexação.
Para isso, foi realizada sistematização teórica e metodológica
de elaboração de linguagem de indexação com e para bibliotecas com
os objetivos de: elaboração de linguagens para bibliotecas obterem boa
recuperação por assunto de seus catálogos online; fornecer subsídios teóricos
e metodológicos para elaboração, implantação e avaliação de linguagens de
indexação em ambientes de bibliotecas; e avaliar estratégias de intervenção
metodológica mediante formação de equipes de elaboração, implantação e
avaliação de linguagens de indexação em bibliotecas.
1.2 lInguagem de Indexação em bIblIoteconomIa e cIêncIa da
InFormação
A linguagem de indexação é o instrumento de conversão da
linguagem natural do documento durante o processo de indexação e, por
isso, exerce importante inuencia na recuperação da informação cujos
efeitos são controlados e avaliados pela política de indexação adotada
pela biblioteca ou serviço de informação (FUJITA, 2012). No contexto
de sistemas de recuperação da informação dotados de ferramentas e
padrões de representação, as linguagens de indexação são fundamentais
e aceitas no âmbito teórico e metodológico tanto da Biblioteconomia
e Ciência da Informação quanto da Organização do Conhecimento
(MAZZOCHI, 2018)
Mariângela Spotti Lopes Fujita & Walter Moreira
28 |
O uso de uma Linguagem de Indexação
10
, pelo indexador e pelo
usuário do sistema de recuperação da informação, destina-se, de forma
pragmática, à escolha do termo correto para descritor a m de reduzir a
diversidade e a ambiguidade de vocabulário. Desse modo, realiza uma
mediação entre a linguagem do texto e a linguagem do usuário e estabelece
uma representação precisa por meio de termos que correspondem aos
termos utilizados pelo autor para expressar o assunto do texto.
A linguagem de indexação é formada de vocabulário e sintaxe. O
vocabulário se refere à relação dos descritores usados para a identicação
do conteúdo de um documento e a sintaxe se refere as regras utilizadas para
a combinação dos descritores usados para a identicação do conteúdo de
um documento.
Analisados seus aspectos de estrutura e funcionalidade, a linguagem
de indexação como ferramenta de controle de vocabulário apresenta-se por
meio de tipologias diferenciadas pela forma e objetivos diversos.
Nos sistemas pré-coordenados os termos são previamente
combinados de acordo com regras sintáticas estabelecidas pela linguagem.
Por outro lado, nos pós-coordenados os termos serão combinados de acordo
com a sintaxe da lógica de busca. Gil Urdiciain (2004, p.24) conclui que
“[...] nas linguagens pré-coordenadas a relação entre os termos é gramatical
e que na linguagem pós-coordenada a relação é lógica.” As linguagens de
estrutura combinatória, como os tesauros, permitem a combinação de seus
termos a partir da necessidade de indexação.
Os tesauros constituem-se de descritores que podem ser
combinados ou não entre si na indexação, relacionados entre si
semanticamente e genericamente. Representam primeiramente os
conceitos para depois especicar suas relações e são desenvolvidos para
sistemas pós-coordenados. Constituem-se como Linguagem de indexação
alfabética, controlada, pós-coordenada e combinatória.
Listas de cabeçalhos de Assunto são linguagens de indexação
concebidas, anteriormente, a partir de cabeçalhos de assunto cuja
composição prévia de dois ou mais termos realizava uma pré-coordenação.
10
Linguagem de indexação é denominação utilizada por Lancaster (2004) e Gil Leiva (2008), autores
representativos da linha “Indexing” e Linguagem de indexação ou Documental é utilizada por autores como
Guimarães (2008), Gil Urdiciain (2004), autores representativos da linha de “Análise Documentária”.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 29
Apresentam sinônimos, quase sinônimos e homógrafos. Previam regras
especícas tais como forma de entrada do descritor, uso de singular/plural,
uso de abreviaturas e de termos traduzidos. Geralmente são listas gerais
que arrolam termos de todas as áreas do conhecimento, tendo em vista o
contexto de bibliotecas que incluem várias áreas do conhecimento.
A linguagem de indexação criada por bibliotecas é a Lista de
Cabeçalhos de Assuntos. Existem, portanto, muitas listas de cabeçalhos
de assunto, algumas desenvolvidas por bibliotecas individuais que não tem
acesso às redes de cooperação. As principais listas de cabeçalhos de assunto,
atualmente existentes e atualizadas, são:
Quadro 1 - Principais Listas de cabeçalhos de assunto
Lista de cabeçalho de assunto Breve descrição
Library Congress of Subject
Headings (LCSH)
(http://id.loc.gov/authorities/
subjects.html)
“Os cabeçalhos de assuntos da Library of Congress
(LCSH) foram desenvolvidos e são mantidos pela Biblioteca
do Congresso dos EUA, inicialmente para as coleções da
Biblioteca. LCSH, um vocabulário controlado usado para
indexar, catalogar e procurar registros bibliográcos em
catálogos de bibliotecas e bancos de dados eletrônicos,
tornou-se um padrão de fato para bibliotecas que usam
registros de catalogação divulgados pela Library of Congress
ou que catalogam de acordo com os padrões estabelecidos
colaborativamente pela Library of Congress e pela
comunidade de bibliotecas. LCSH é atualizada diariamente
na Classication Web” (AMERICAN LIBRARY
ASSOCIATION, 2019).
Medical Subject Headings
(MeSH)
https://www.nlm.nih.gov/mesh/
meshhome.html
“O tesauro Medical Subject Headings (MeSH) é um
vocabulário controlado e hierarquicamente organizado,
produzido pela Biblioteca Nacional de Medicina dos
EUA. É usado para indexação, catalogação e pesquisa de
informações biomédicas e relacionadas à saúde. O MeSH
inclui os títulos dos assuntos que aparecem no MEDLINE
/ PubMed, no Catálogo NLM e em outros bancos de dados
NLM.” (NATIONAL LIBRARY OF MEDICINE, 2019)
Mariângela Spotti Lopes Fujita & Walter Moreira
30 |
Sears List of Subject Headings
https://searslistofsubjectheadings.
com/page/frontmatter
A lista de Sears, desde 1923 até a atualidade, foi
desenvolvida para interpretar as necessidades das bibliotecas
de médio e pequeno porte mantendo, ao mesmo tempo, as
possibilidades de expansão. Com edições sucessivas, cada
vez mais ampliadas, é destinada, também, para grandes
bibliotecas. Uma adaptação da lista de Sears para a língua
portuguesa, de autoria de Wanda Ferraz, publicada pelo
Instituto Nacional do Livro em 1944 e atualizada em
1972 e 1977, foi uma contribuição às pequenas bibliotecas
brasileiras. Possui versão impressa em formato livro,
disponível em livrarias, e em formato eletrônico mediante
subscrição em base de dados online.
Terminologia de assuntos da
Biblioteca Nacional do Brasil
http://acervo.bn.gov.br/sophia_
web/busca/autoridades
A Biblioteca Nacional do Brasil (www.bn.br) disponibiliza
online a Terminologia de Assuntos como linguagem de
indexação atualizada pela equipe de bibliotecários em
português e inglês com base na Library of Congress Subject
Headings e coordena um consórcio formado por bibliotecas
públicas, universitárias e governamentais.
Lista de cabeçalhos de Assuntos
da rede BIBLIODATA
(LCARB)
A uniformização e padronização das entradas de assunto
são garantidas pela FGV pela manutenção de uma Lista de
Cabeçalhos de Assunto para uso de bibliotecas brasileiras
participantes da Rede. Esta
Lista, representada como a Bases de Autoridades
Assuntos, é fundamentada na Library of Congress Subject
Headings (LCSH), mantendo a estrutura de linguagem
pré-coordenada, respeitando as características da língua
portuguesa (FUNDAÇÃO GETÚLIO VARGAS, 1995, p.
11-12). Atualmente, indisponível está sob responsabilidade
do IBICT.
11
Descritores em Ciências da
Saúde (DeCS) http://decs.bvs.
br/
Utilizado para a indexação e recuperação da informação em
fontes de informação disponíveis na Biblioteca Virtual em
Saúde (BVS), foi desenvolvido a partir do Medical Subject
Headings MeSH.
Vocabulário Controlado USP
(VocaUSP) http://vocabusp.sibi.
usp.br/vocab/
“[...] é uma linguagem documentária construída, a partir
de procedimentos terminológicos e documentários,
pelos bibliotecários do SIBi/USP, com a participação de
especialistas de todas as áreas do conhecimento abrangidas
pelos seus descritores.” (LIMA, BOCCATO, 2009). Surgiu
com base no vocabulário de listas de assuntos compiladas
pelas bibliotecas mais especializadas na elaboração dos
catálogos de assuntos que tem uma mistura de princípios de
cabeçalhos de assuntos e de tesauros.
Fonte: Sistematização com base em informações coletadas na web e texto de Agustín-Lacruz, Fujita e Terra (2014).
11
Conforme esclarecimentos de Cecília Leite Oliveira, Diretora do IBICT, em 01 de julho de 2020, o
BIBLIODATA está passando por processo de revisão e atualização tecnológica e, por essa razão, o acesso ao
serviço tem sofrido instabilidade.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 31
A sintaxe dos cabeçalhos de assuntos se manifesta no universo dos
cabeçalhos compostos de que são exemplos típicos os cabeçalhos-frase ou
as expressões compostas. Os cabeçalhos de assuntos servem para expressar
assuntos ou o conteúdo e/ou forma da informação registrada e entende-se,
como sintaxe de cabeçalhos de assunto, a combinação dos elementos ou
palavras que formam os cabeçalhos compostos.
Atualmente, em sistemas de busca online a pré-coordenação
perde o efeito de sequência e de prioridade porque o programa de busca
não se importa em como as palavras são combinadas durante a indexação,
mas sim na combinação de termos durante a estratégia de busca avançada
que os sistemas de descoberta aprimoraram. Esta evolução tecnológica
dos catálogos online proporcionou às listas de cabeçalhos de assunto
aproveitarem seus recursos de controle de vocabulário acumulados
por muitos anos e adotarem padrões de organização do conhecimento
desenvolvidas por tesauros. Nessa transição, foi necessária a inclusão de
estruturas hierárquicas para se obter as ligações semânticas entre termos de
uma mesma área de assunto.
A lista de cabeçalhos de assuntos é a forma mais antiga de
linguagem de indexação baseado no sistema alfabético de assunto. Sua
prática, desenvolvida na Library of Congress (LC) a partir da elaboração
dos catálogos, sedimentou o uso do cabeçalho de assunto. Entretanto, sua
atualização para uso nos catálogos online transformou sua conguração e
visualização com uma aparência de linguagem de indexação póscoordenada
tal como a dos tesauros que possuem estrutura lógica e hierarquizada entre
os termos.
Ressalte-se que a Library Congress of Subject Headings –
LCSH, a mais importante lista de cabeçalhos de assunto e a linguagem de
indexação alfabética mais completa e especíca da atualidade, evoluiu em
suas últimas edições com a introdução e uso da nomenclatura de relações
semânticas adotadas por tesauros, incluindo uma estrutura lógica de
relações hierárquicas anteriormente atroada na linguagem.
Partindo da ideia de catalogação cooperativa e uso de recursos
tecnológicos a Library of Congress (LC) criou a maior Central de
Catalogação Cooperativa. A introdução da tecnologia computacional na
década de 1960 e o desenvolvimento do formato MARC para padronização
de registros bibliográcos e formatos de intercâmbio reete-se até os dias
Mariângela Spotti Lopes Fujita & Walter Moreira
32 |
atuais nas bibliotecas e centros de informação. Atualmente os registros da
LC são disponibilizados em outros formatos de intercâmbio e possibilitam
acesso a outros vocabulários controlados que utilizam descritores idênticos
e suas variações terminológicas.
O desenvolvimento de tecnologias de software e hardware
juntamente com a Internet, proporcionaram às centrais de catalogação
cooperativa disponibilizarem seus catálogos em meio digital, acelerando a
troca de informações.
Para propiciar o intercâmbio de informações, foram criados,
junto ao formato MARC, os protocolos Z39.50 e ISO-2709 que orientam
sobre a estrutura de um registro e a transferência de dados bibliográcos,
o que “[...] permite que um registro criado para uma máquina por um
determinado software seja lido por qualquer outro software em qualquer
tipo de máquina” (MARASCO; MATTES, 1995, p. 42). Essa evolução
da LCSH, os formatos de intercâmbio de registros bibliográcos e os
catálogos online demonstram que são importantes para a nalidade de
recuperação da informação.
Na perspectiva da gestão e planejamento, a compatibilização
dos registros de autoridade da LCARB feita com a adoção da LCSH,
da Terminologia de Assuntos da Biblioteca Nacional e do MeSH,
linguagens de indexação de mesma fonte, reduziu problemas estruturais
e proporcionou resultados quantitativos e qualitativos para a criação do
Tesauro Unesp, sobretudo no que se refere à atualização contínua do
vocabulário especializado de modo conável.
1.3 a construção do tesauro unesP: Plano de ação e resultados
O planejamento e a gestão de tesauros devem ser realizados por
equipes multidisciplinares em que diferentes prossionais e pesquisadores
especializados precisam realizar uma negociação para obter consenso de
suas propostas e decisões. A aplicação da metodologia de pesquisa-ação
permitiu que as ações fossem negociadas durante o desenvolvimento da
pesquisa para elaboração de um manual da linguagem de indexação com
vistas à sua constante atualização e manutenção.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 33
Considerando que o desenvolvimento desta pesquisa contou com
o apoio da Coordenadoria Geral de Bibliotecas e dos catalogadores das
bibliotecas da Unesp em função dos resultados obtidos na pesquisa “Política
de indexação para bibliotecas
12
que os levou a decidir sobre a elaboração,
manutenção e uso da Linguagem de indexação para suas bibliotecas, foi
possível aproveitar a oportunidade única de envolvimento cooperativo
entre pesquisadora, grupo de pesquisa e participantes em torno da situação
de elaboração, implantação, manutenção e uso da linguagem de indexação.
Nesse sentido, esclarecemos que o Grupo de Política de indexação
da Unesp que elaborou, implantou e avaliou a “Política de Indexação para
as bibliotecas universitárias da Unesp” (FUJITA et al., 2016) discutiu
e decidiu, no bojo da pesquisa-ação, pela elaboração da Linguagem de
indexação da Unesp e para isso foi criado, em 2013, o Grupo de estudos da
elaboração da Linguagem de Indexação que atuou na colaboração efetiva
desta investigação.
A pesquisa-ação propiciou a comunicação de diferentes
perspectivas do contexto de indexação pelos participantes, usuários,
catalogadores, dirigentes de bibliotecas e bibliotecários, assim como
revelaram o que pensavam sobre os problemas e restrições desse contexto,
como seria possível resolvê-los e quais os instrumentos e métodos
necessários, o que ajudou no aprimoramento da política de indexação.
Mais do que isso, deu aos catalogadores a possibilidade de compreensão e,
consequente domínio, de como desenvolver a organização e representação
do conhecimento no contexto de bibliotecas universitárias.
A intervenção da pesquisa-ação foi possível mediante reuniões
quinzenais com equipe formada por catalogadores dedicados à elaboração
de registros de autoridades e pesquisadores da área de Ciência da Informação
de modo a promover a reexão crítica com a nalidade de identicar
problemas ou avaliar mudanças. À cada dúvida, problema ou necessidade
de implantar novos procedimentos foram realizadas duas modalidades de
seminários: de vivências prossionais e acadêmicas ou compartilhamento
de experiências com pesquisadores convidados para transferência de
conhecimento quando o desenvolvimento dependia de metodologias ou
ferramentas a serem implantadas.
12
Projeto de pesquisa desenvolvido no período de 2010 a 2018 (Processo CNPq: 305648/2009-8).
Mariângela Spotti Lopes Fujita & Walter Moreira
34 |
Os pesquisadores do Grupo de Linguagem da Rede de Bibliotecas
da Unesp apresentaram a sistematização teórica e metodológica sobre
linguagens de indexação e experiências de elaboração de linguagens de
indexação com uso de softwares a partir das considerações analíticas e
comparativas do desenvolvimento da pesquisa.
Nos seminários de vivências haviam, após as apresentações
dos pesquisadores, discussões sobre o contexto prossional de modo a
levantar as dúvidas, problemas e restrições para os quais eram apresentadas
propostas que, dependendo da situação eram destacadas para possível ação
dentro do plano. Em alguns casos, outros pesquisadores eram convidados
para transferência de conhecimentos durante as reuniões quinzenais ou
mediante cursos de capacitação que nos ajudassem, de modo viável, a
ter outros pontos de vista para solucionar as questões a serem ajustadas
para o bom desenvolvimento de uma determinada ação. Os pesquisadores
convidados e respectivas ações foram:
Ações Pesquisador convidado
Escolha do software José Carlos Francisco dos Santos (PPGCI/UNESP);
Cibele Araújo C. M. dos Santos (USP-São Paulo);
Tiago Rodrigo Marçal Murakami (SIBI/USP)
Taxonomia de áreas especializadas Maria Luiza de Almeida Campos (UFF)
Deise Maria Antonio Sabbag (USP-Ribeirão Prêto)
Os cursos de capacitação para o Grupo de Linguagem da Rede
de Bibliotecas da Unesp ministrados pelos pesquisadores do grupo e
convidados foram:
A terminologia na elaboração de linguagens de indexação” - 28 de abril
de 2014 -
Profa. Dra. Mariângela Spotti Lopes Fujita
“Procedimentos para autorização de termos novos considerando a
metodologia terminográca” - 28 de abril de 2014
Profa. Dra. Mariângela Spotti Lopes Fujita
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 35
“Construção e manutenção de tesauro” 31 ago. 2015
Prof. Dr. Walter Moreira
Profa. Dra. Mariângela Spotti Lopes Fujita
“Elaboração da macroestrutura da linguagem Unesp: análise de modelos
de categorias” -
23 de outubro de 2015
Dr. Walter Moreira
“Vocabulário Controlado: principais aspectos para o tratamento e a
recuperação de informações” - 12 de Abril de 2018
Dra. Maria Luiza de Almeida Campos
O resultado das discussões e intervenções possibilitou a
construção de um plano de ação para elaboração, manutenção e uso da
linguagem de indexação. Em resumo, o uso da linguagem viabilizou-se a
partir da escolha de um software implementado em 2017 e avaliado pelas
bibliotecas durante o ano de 2018. Com o software TemaTres foi possível
a importação dos registros de autoridade de assunto em formato MARC21
cuja compatibilização havia sido iniciada em 2012. Essa importação
marcou a criação do Tesauro Unesp para consulta de todos os usuários
prossionais da rede de bibliotecas e os usuários da comunidade externa.
O vocabulário, antes invisível para todos por estar em internalizado em
linguagem de máquina, tornou-se aparente, acessível e disponível. Tudo
isso foi possível mediante a elaboração e desenvolvimento do plano de ação
no contexto da pesquisa-ação.
1.3.1 Plano de ação Para a construção do tesauro unesP
O plano de ação, elaborado nas reuniões do Grupo de Linguagem
da Rede de Bibliotecas da Unesp, deniu quatro metas principais:
a) Compatibilização dos registros de autoridade da linguagem
BIBLIODATA com as linguagens de mesmo vocabulário
e estrutura: Library of Congress Subject Headings (LCSH),
Terminologia da Biblioteca Nacional (TBN) e Medical
Subject Headings;
Mariângela Spotti Lopes Fujita & Walter Moreira
36 |
b) Criação e desenvolvimento de uma Taxonomia de áreas do
conhecimento da Unesp formada por categorias e subcategorias
para classicação dos termos contidos nos registros de
autoridade compatibilizados;
c) Escolha de um software para possibilitar a gestão e manutenção
do Tesauro Unesp com a importação dos registros de autoridade
compatibilizados;
d) Disponibilização do Tesauro Unesp junto à interface de busca
integrada que dá acesso ao catálogo.
1.3.1.1 comPatIbIlIzação de regIstros de autorIdade
O contexto de contínua geração de novos conhecimentos e de
inovação da universidade foi determinante para a construção da Linguagem
Unesp. Entretanto, foi necessário desenvolver uma metodologia de
compatibilização para uso colaborativo que consiste na combinação
dos registros de autoridade de assuntos em formato MARC21 de outras
linguagens documentais para linguagem Unesp. O estudo de Fujita;
Santos; Cruz; Moreira e Ribas (2018) desenvolveu processo inovador
de compatibilização de vocabulários de três linguagens de indexação de
mesma matriz terminológica utilizadas por bibliotecas: Terminologia de
assuntos da Biblioteca Nacional, Library of Congress Subject Headings
(LCSH) e Medical Subject Headings (MeSH).
Entretanto, a compatibilização demonstrou que é necessário
incluir termos novos a partir de nova metodologia, criada especicamente
para o Tesauro Unesp. Nesse sentido, foi realizado em abril de 2014, o
curso de formação em serviço “A terminologia na elaboração de linguagens
de indexação” para o grupo de catalogadores, participantes do Grupo de
Política de indexação da Unesp com a nalidade de discutir a elaboração
da Linguagem de indexação da Unesp. Este curso formou o grupo inicial
de estudos da elaboração da Linguagem de Indexação Unesp, capacitando-
os para a inclusão de termos novos e alteração de termos conforme Método
Terminográco.
A proposta teórica e metodológica para elaboração, manutenção
e uso de linguagem de indexação em bibliotecas consiste na combinação
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 37
dos registros de autoridade de assuntos em formato MARC21 de outras
linguagens documentais para linguagem Unesp descrita em Ribas e Parra
(2016) e em Fujita (2017).
Esta meta, implementada pelos catalogadores da Unesp,
possibilitou a compatibilização atual de 89.581 termos
13
e está em
continuidade.
1.3.1.2 construção da taxonomIa das áreas de conhecImento
na unesP: a macroestrutura
A segunda meta, desenvolvida e descrita no Capítulo 5 deste
livro, foi a elaboração da Taxonomia de áreas do conhecimento da Unesp
utilizando os procedimentos para a construção da estrutura hierárquica
do Tesauro Unesp com uso da ferramenta Classication Web da Library
of Congress Subject Headings (LCSH), macroestrutura do Vocabulário
USP e estrutura hierárquica da Terminologia de Assuntos da Biblioteca
Nacional.
As principais considerações referem-se à proposta de uma
metodologia de compatibilização de uso colaborativo para elaboração,
manutenção e uso de linguagem de indexação para catálogos online de
bibliotecas que consiste na construção de macroestrutura a partir da
análise das estruturas hierárquicas das linguagens LCSH, Terminologia de
Assuntos da Biblioteca Nacional (TBN), LCARB e Vocabulário USP.
A metodologia proposta utilizou o método de comitê ascendente
da Diretriz ANSI/NISO2005 com uso do Modelo metodológico integrado,
proposto por Cervantes (2009). A aplicação do método comparou as
hierarquias da LCSH, TBN, LCARB e Vocabulário USP nas áreas de
Física e Matemática, demonstrando ser apropriado para a construção de
macroestrutura de linguagens de indexação que permita a classicação dos
termos e seus relacionamentos.
Vericou-se que a escolha das linguagens LCSH, TBN,
BIBLIODATA e Vocabulário USP foi adequada para a análise das
estruturas de categorias e das hierarquias lógicas. A linguagem LCARB
não possui completa hierarquização de termos e sua utilização é inviável.
13
https://www.biblioteca.Unesp.br/tesauro/vocab/sobre.php.
Mariângela Spotti Lopes Fujita & Walter Moreira
38 |
As linguagens de indexação destinadas à análise de macroestruturas
devem estar constantemente atualizadas e direcionadas a contextos de
uso semelhantes. A LCSH destaca-se por sua exaustividade e diversidade
terminológica. A TBN, embora seja uma versão da LCSH, não apresenta
diversidade terminológica. É necessária a combinação das duas linguagens.
O Vocabulário USP apresenta estrutura diferenciada com características
das áreas de domínio da universidade. As três linguagens demonstram ser
importantes para a construção de estruturas hierárquicas com profundidade
adequada ao âmbito das bibliotecas universitárias.
Com o avanço das discussões sobre a elaboração da estrutura
hierárquica contamos com a colaboração da Profa. Dra. Maria Luiza
de Almeida Campos da Universidade Federal Fluminense que passou a
integrar institucionalmente o Grupo de Linguagem da Rede de Bibliotecas
da Unesp. A participação da Profa. Maria Luiza tem sido muito importante
pela sua experiência na construção de vocabulários controlado, sobretudo
na modelização de conceitos. Muitas informações, conhecimentos
e decisões das reuniões do Grupo foram registradas e forneceram os
principais contributos do trabalho de pesquisa sobre construção e avaliação
da estrutura lógica e hierárquica de linguagens de indexação para catálogos
online.
A proposta teórica e metodológica para elaboração, manutenção
e uso de linguagem de indexação em bibliotecas consiste na combinação
dos registros de autoridade de assuntos em formato MARC21 de outras
linguagens documentais para linguagem Unesp e a elaboração de estruturas
lógico-hierárquicas das áreas de conhecimento existentes na universidade
que permitam a classicação dos termos que representam assuntos e seus
relacionamentos em registro de autoridade de assuntos. A elaboração de
estruturas será, portanto, a de incluir as semelhanças e as diferenças entre as
três estruturas para que a exaustividade e a especicidade sejam contempladas
de modo a garantir profundidade no permanente desenvolvimento da
linguagem de indexação que se pretende para bibliotecas universitárias.
1.3.1.3 soFtware Para gestão e manutenção do tesauro unesP
O estudo de softwares, desenvolvido e descrito no capítulo 6, foi
realizado, inicialmente, por meio de revisão de literatura com enfoque nos
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 39
softwares TemaTres e MultiTes (FUJITA et al. 2017a). O enfoque dado aos
dois softwares foi denido em função das características e funcionalidades
que ambos apresentam para uso na interface de busca do catálogo online
ATHENA e a existência de literatura especíca sobre a avaliação dos dois
softwares. O Grupo de Linguagem da Rede de Bibliotecas da Unesp
escolheu o TemaTres com base em duas variáveis inuentes: a) ser um
software livre, gratuito e com atualizações constantes fundamentadas em
normas internacionais que preconizam a interoperabilidade semântica e
tecnológica; b) ter sido implementado pelo Sistema de Bibliotecas da USP
para gestão e manutenção do Vocabulário USP e servir como interface de
busca por assuntos pela linguagem de indexação.
Portanto, para realizar a implementação do software TemaTres
realizamos reuniões com a participação da Profa. Dra. Cibele Araújo
Camargo Marques dos Santos da ECA/USP, do servidor técnico e
pesquisador do SIBI/USP, Tiago Murakami, do aluno de doutorado do
PPGCI, José Carlos Francisco dos Santos, especialista em Informática,
e do servidor técnico Oberdan Luiz May da Coordenadoria Geral de
Bibliotecas, responsável pelo catálogo online ATHENA e especialista
da área de informática. Atualmente, estamos realizando testes com a
importação dos registros de autoridade compatibilizados e, também, está
em desenvolvimento o aplicativo para fazer a interface do TemaTres com
o Aleph.
1.3.1.4 dIsPonIbIlIzação do tesauro unesP
14
Para consulta e
uso na Indexação e recuPeração da InFormação
Tesauro é uma linguagem articial utilizada em bibliotecas e em
outros sistemas de informação para organizar e representar o conteúdo de
diferentes publicações cientícas de modo que seja possível, a qualquer
usuário, recuperar a informação necessária acerca do conhecimento
cientíco armazenado em suas bases de dados tais como catálogos,
repositórios e bibliotecas digitais.
O tesauro é uma linguagem com a função especíca de
representação do conhecimento durante a armazenagem e a busca em
bases de dados. Para isso, é composto de palavras-chave (descritores)
14
https://www.biblioteca.Unesp.br/tesauro/vocab/index.php.
Mariângela Spotti Lopes Fujita & Walter Moreira
40 |
relacionadas semântica e genericamente com as áreas de conhecimento
especializado. Dessa forma, a escolha de uma palavra-chave do tesauro
garantirá, ao usuário que realiza uma determinada busca, a coincidência
com a palavrachave utilizada para a representação conteúdo de um ou mais
documentos que serão recuperados.
O Tesauro da Unesp tem vocabulário com termos especializados
das áreas de conhecimento de suas atividades de ensino, pesquisa e
extensão. Cada termo compatibilizado e operacionalizado por um registro
de autoridade em formato de intercâmbio MARC21 (vide Figuras 5 e
6 do item 6.2 da Seção 6, p.). A compatibilização do termo mediante
registro de autoridade é realizada, conforme resumido no item 1.3.1.1 e
detalhadamente esclarecido na Seção 5 para que se possa ter atualização do
vocabulário do Tesauro Unesp. O registro de autoridade compatibilizado,
possibilita tanto o controle e correção internos do tesauro Unesp nas bases
de dados em que atua, quanto sua exportação para qualquer outro sistema
externo como é o caso do software TemaTres onde assume o formato
customizado de um tesauro pronto para ser compreendido e usado por
qualquer usuário que necessite empregar seus termos.
É utilizado pelos bibliotecários catalogadores para representar o
conteúdo da informação mais signicativa de livros, dissertações, teses,
monograas, trabalhos de conclusão de curso, artigos de periódicos,
documentos, legislação e etc.
O mais importante é que foi desenvolvido para ser utilizado nas
interfaces de busca integrada das bases de dados das bibliotecas durante
a consulta de assunto por alunos de graduação e de pós-graduação, bem
como por pesquisadores para recuperar informações sobre livros, artigos,
teses, dissertações, monograas, ou qualquer outro documento que tenha
sido indexado em qualquer base de dados da Unesp. Para isso, basta
acessar o link do tesauro Unesp, abaixo da interface de busca, digitar
uma palavra, parte da palavra ou frase na caixa de pesquisa e escolher a
palavra-chave mais representativa da necessidade de informação. Ao lado
direito da palavra-chave tem o link de acesso para a escolha dos registros
bibliográcos.
A construção e manutenção do Tesauro da Unesp é realizada desde
2013 pelo Grupo de Linguagem da Rede de Bibliotecas da Unesp composto
por catalogadores das bibliotecas e pesquisadores da área de Organização
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 41
do Conhecimento, supervisionados pela Profa. Dra. Mariângela Spotti
Lopes Fujita (Programa de Pós-Graduação em Ciência da Informação da
Unesp – Campus de Marília).
A disponibilização do Tesauro Unesp para consulta de suas
palavras-chave é parte fundamental da Política de Indexação das
bibliotecas Universitárias da Unesp (https://www.biblioteca.Unesp.br/
portal/arquivos/manual-politica-indexacao-2017.pdf) com nalidade
de aprimoramento da recuperação da informação mais precisa por seus
usuários durante a busca por assuntos.
O processo de construção e manutenção sempre dará continuidade
à correção das palavras-chave e, principalmente da consistência dos
relacionamentos hierárquicos entre os termos.
1.3.1.5 manual do tesauro unesP
A investigação sobre os manuais fundamentou-se na Norma ISO
25964-1, Parte I- tesauro para recuperação da informação com enfoque na
seção 13 sobre gestão de tesauros que propiciou discussão de proposta de
sistematização de elaboração, implantação, uso e avaliação de linguagem de
indexação para bibliotecas no contexto da política de indexação a partir das
orientações denidas no item 3, “O instrumento de indexação – linguagem
Unesp”, do Manual de Política de Indexação da Unesp (FUJITA, 2014).
Essa discussão resultou na recomendação de uma estrutura preliminar para
elaboração do “Manual do Tesauro Unesp” (Apêndice A) desenvolvida
pelo Grupo de Linguagem da Rede de Bibliotecas da Unesp cuja estrutura,
nalizada, compõe este livro.
1.4 consIderações FInaIs
A indexação na catalogação é a nalidade desta pesquisa de
cunho aplicado para que os catálogos possibilitem a recuperação por
assuntos mais precisa e especíca. A principal contribuição para a área de
Ciência da Informação, em especial da Biblioteconomia, é este manual de
elaboração, implantação e avaliação de linguagem de indexação que faça
parte do Manual de política de indexação para assegurar a qualidade da
recuperação por assuntos na atual conjuntura de catalogação cooperativa.
Mariângela Spotti Lopes Fujita & Walter Moreira
42 |
Recomenda-se aos demais pesquisadores e prossionais a
necessidade de: - Elaboração de linguagens de indexação para bibliotecas
obterem boa recuperação por assunto de seus catálogos on-line;
Contribuir com mais subsídios teóricos e metodológicos
para elaboração, implantação e avaliação de linguagens de
indexação em ambientes de bibliotecas;
Aplicar e avaliar estratégias de intervenção metodológica
mediante formação de equipes de elaboração, implantação e
avaliação de linguagens de indexação em bibliotecas;
Propiciar à formação do indexador o conhecimento e prática
suciente de uma metodologia consistente elaboração,
avaliação e controle de linguagens de indexação capacitando-o
em metodologias da Ciência da Informação e das áreas
interdisciplinares; - Contribuir para o desenvolvimento
curricular de conteúdos programáticos das disciplinas da área
de Organização da Informação de Cursos de Graduação em
Biblioteconomia e de cursos de capacitação em indexação
para formação em serviço de prossionais da informação;
Disseminar a importância e a inuência que a linguagem
de indexação exerce sobre o desempenho da recuperação da
informação por assunto em biblioteca;
Conscientizar e capacitar os responsáveis pela política de
indexação: dirigentes e catalogadores em bibliotecas e sistemas
de bibliotecas.
Considera-se concluído o plano de trabalho do projeto de pesquisa
em apreço com diversas contribuições cientícas em forma de publicações,
porém, as principais contribuições são as experiências de compartilhamento
de conhecimentos entre os membros do Grupo de Linguagem da Rede
de Bibliotecas da Unesp, sobretudo para os alunos de pós-graduação e de
graduação envolvidos na pesquisa que tiveram suas pesquisas fortalecidas
com a riqueza de conhecimentos teóricos, metodológicos e tecnológicos.
Destaca-se, também, as soluções importantes para a construção de uma
Linguagem Unesp com o catálogo em funcionamento para uso de muitos
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 43
usuários internos e externo. Esse projeto de pesquisa teve essa importante
repercussão de conscientizar os catalogadores para a importância de
um controle de vocabulário sempre atualizado e disponível para busca
e recuperação da informação. Com certeza o Grupo de Linguagem da
Rede de Bibliotecas da Unesp continuará atuante por muito tempo pois
a linguagem de indexação necessita de atualização constante e de respaldo
cientíco e tecnológico.
Conforme previsto no plano de trabalho, enfatiza-se a
continuidade das reuniões do grupo de catalogadores agora na composição
da Comissão Permanente do Tesauro Unesp cuja atuação segue os
procedimentos de pesquisa participante com metodologia de pesquisa-
ação. Essas reuniões propiciaram várias orientações, levantamento de
dúvidas, decisões e relatos registrados em atas e anotações que conduziram
vários dos trabalhos publicados, em manuais, artigos, livros e capítulos de
livros com a colaboração dos integrantes do Grupo de Linguagem da Rede
de Bibliotecas da Unesp em um trabalho coletivo de muita participação de
todos os envolvidos. A produção cientíca realizada pelo Grupo (Apêndice
B) atesta de forma inequívoca o acerto da escolha da pesquisa ação como
indutora das decisões inovadoras que proporcionaram os relevantes
resultados à Unesp e à toda comunidade cientíca e prossional.
reFerêncIas
AGUSTÍN LACRUZ, M. del C.; FUJITA, M.S.L.; TERRA, A.L.S. Linguagens
documentais para bibliotecas escolares: o caso da Espanha, Portugal e Brasil. Informação
& Sociedade, João Pessoa, v.24, n.3, p.83-97, set./dez. 2014.
AMERICAN LIBRARY ASSOCIATION. Cataloging tools and resources:
subjectheadings. 2019. Disponível em: https://libguides.ala.org/catalogingtools.Acesso
em: 01 dez. 2020.
BOCCATO, V. R. C.; FUJITA, M. S. L.; GIL LEIVA, I. Avaliação comparada do uso
de linguagens de indexação em catálogos de bibliotecas universitárias para recuperação
por assunto. Scire, Zaragoza, v.17, p.55 – 64, 2011.
CERVANTES, B. M. N. A construção de tesauros e a integração de
procedimentosterminográicos. 2009. 209 f. Tese (Doutorado em Ciência da Informação)
–Faculdade de Filosoa e Ciências, Universidade Estadual Paulista, Marília, 2009.
FUJITA, M. S. L. A política de indexação para representação e recuperação da
informação. In: GIL LEIVA, I.; FUJITA, M.S.L. (ed.). Política de indexação. São Paulo:
Mariângela Spotti Lopes Fujita & Walter Moreira
44 |
Cultura Acadêmica, 2012. p.17-28. Disponível em: http://www.culturaacademica.com.
br/_img/arquivos/Livro%20Politica-deindexacao_ebook.pdf. Acesso em: 01 dez. 2020.
FUJITA, M. S. L. Manual da política de indexação para as bibliotecas universitárias da
Unesp. Marília: Faculdade de Filosoa e Ciências, Unesp; São Paulo: Coordenadoria
Geral de Bibliotecas, Reitoria da Unesp, 2014.
FUJITA, M.S.L (org.). Política de indexação para bibliotecas: elaboração, avaliação e
implantação. Marília: Ocina Universitária; São Paulo: Cultura Acadêmica, 2016.
Disponível em: http://www.marilia.Unesp.br/Home/Publicacoes/politicas-de-
indexacaopara-bibliotecas_ebook.pdf. Acesso em: 01 dez. 2020.
FUJITA, M.S.L et al. Avaliação das características do TemaTres e Multites para o
controle de autoridades nas bibliotecas universitárias. Scire, Zaragoza, v.23, p.63-73,
2017a. Disponível em: http://www.ibersid.eu/ojs/index.php/scire. Acesso em: 01 dez.
2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W.; RIBAS, R.R.
de B. Construction and evaluation of hierarchical structures of indexing languages for
online catalogs of libraries: an experience of the São Paulo State University (UNESP).
Knowledge Organization, Baden-Baden, v.45, p. 220 - 231, 2018.
FUNDAÇÃO GETÚLIO VARGAS. Manual de cabeçalhos de assunto: normas e
procedimentos. Rio de Janeiro: FGV, 1995.
GIL LEIVA, I. Manual de indización: teoria y práctica. Gijón: Trea, 2008.
GIL URDICIAIN, B. Manual de lenguajes documentales. 2. ed. rev. y ampl. Madrid:
Noesis, 2004.
LANCASTER, F. W. Indexação e resumos: teoria e prática. Tradução de Antonio Agenor
Briquet de Lemos. 2. ed. Brasília: Briquet de Lemos, 2004.
LIMA, V. M. A.; BOCCATO, V. R. C. O desempenho terminológico dos descritores
em Ciência da Informação do Vocabulário Controlado do SIBi/USP nos processos de
indexação manual, automática e semi-automática. Perspect. Ciênc. Inf., Belo Horizonte,
v. 14, n. 1, Apr. 2009. http://dx.doi. org/10.1590/S1413-99362009000100010.
Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1413-
99362009000100010&lng=en&nrm=iso. Acesso em: 14 jun. 2014.
MARASCO, L.C.; MATTES, R.N. Avaliação e seleção de software para automação de
centros de documentação e bibliotecas. Cadernos da FFC, Marilia, v. 4, n. 1, p. 40-49,
1995.
MAZZOCCHI, F. Knowledge Organization Systems (KOS). Knowledge Organization,
Baden-Baden, v.45, p.54-78, 2018. doi:10.5771/0943-7444-2018-1-54 .
NATIONAL LIBRARY OF MEDICINE. Medical Subject Headings. 2019. Disponível
em:https://www.nlm.nih.gov/mesh/meshhome.html. Acesso em: 01 dez. 2020.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 45
RIBAS, R.R.deB.; PARRA, L.S. A construção e atualização da linguagem Unesp. In:
FUJITA, M.S.L (org.).Política de indexação para bibliotecas: elaboração, avaliação e
implantação. Marília: Ocina Universitária; São Paulo: Cultura Acadêmica, 2016.
p.6787. Disponível em: http://www.marilia.Unesp.br/Home/Publicacoes/politicas-
deindexacao-para-bibliotecas_ebook.pdf. Acesso em: 01 dez. 2020.
Mariângela Spotti Lopes Fujita & Walter Moreira
46 |
aPêndIce a
manual do tesauro unesP
15
estrutura erelImInar
Introdução [Capítulos, 1, 2 e 3]
Parte 1: Fundamentos conceituais e normativos da elaboração do tesauro
1.Visão geral e objetivos do tesauro [Capítulo 4]
1.1 Símbolos, termos abreviados e outras convenções
1.2 Aspectos conceituais do tesauro (diferenciar o que é conceito e o que é termo,
explicitar o signicado da terminologia utilizada em tesauros, tais como termo
especíco, tesauro multilíngüe e etc)
2. Abrangência temática do tesauro [Capítulo 5]
3. Termos do tesauro [Capítulo 4]
1.1 Forma dos termos (termos simples e termos compostos)
1.2 Forma gramatical de termos (substantivos, adjetivos, advérbios, gênero, número,
maiúsculas e minúsculas, abreviaturas e siglas, hífen, parênteses, elementos
numéricos) 3.3 Esclarecimento e desambiguação dos termos do dicionário
de sinônimos ou controle terminológico para seleção do termo preferido
(Homonímia, antonímia, sinonímia, termos estrangeiros, gírias ou jargões, nomes
comuns e comerciais, nomes populares e nomes cientícos e etc)
3.4 Relação de equivalência
3.4.1 A relação de equivalência, num contexto monolíngüe (Sinônimos,
Quasesinônimos, Termos especícos incluídos num conceito mais
amplo)
3.4.2 Equivalência entre idiomas
3.5 Relações entre conceitos e termos
3.5.1 A relação hierárquica
3.5.2 A relação associativa
3.6 Notas explicativas
3.7 Denição
3.8 Análise de faceta
Parte 2: Planejamento da estrutura e operacionalização do tesauro [Capítulo 6]
5.Estrutura do banco de dados
6 Protocolos do banco de dados usados com o tesauro
7 Apresentação e layout
7 A escolha do software de gerenciamento do tesauro
8 Formato de troca: registros de autoridade em formato MARC
9 Interoperabilidade com outras linguagens de indexação
10 Integração com aplicações de indexação e pesquisa Parte 3: Construção do tesauro [Capítulo 5]
10 A estrutura lógico-hierárquica
11 Atualização do vocabulário
11.1 Correção de termos existentes no banco de dados
11.2 Compilação dedutiva de termos novos
15
Capítulos correspondentes da organização atual neste livro.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 47
aPêndIce b
lIsta das PublIcações que demonstram o desenvolvImento das
etaPas do Plano de ação
artIgos em revIstas cIentíFIcas Indexadas
FUJITA, M.S.L.; SANTOS, L. B. P. Política de indexação em bibliotecas universitárias:
estudo diagnóstico e analítico com pesquisa participante. Transinformação, Campinas,
v. 28, p. 5976, 2016. Disponível em: www.scielo.br/pdf/tinf/v28n1/0103-3786-
tinf-28-01-00059.pdf. Acesso em: 21 nov. 2020.
FUJITA, M. S. L.; SANTOS, L. B. P. A estrutura lógico-hierárquica de linguagens
de indexação utilizadas por bibliotecas universitárias. Scire, Zaragoza, v.22, n.2, p.37-
46, jul./dic. 2016. Disponível em: http://www.ibersid.eu/ojs/index.php/scire/article/
view/4336/3866. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W. Avaliação das
caracterísiticas do TemaTres e Multites para o controle de autoridades nas bibliotecas
universitárias. Scire, Zaragoza, v.23, p.63-73, 2017. Disponível em:http://www.ibersid.
eu/ojs/index.php/scire. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W.; RIBAS, R.R.
de B. Construction and evaluation of hierarchical structures of indexing languages for
online catalogs of libraries: an experience of the São Paulo State University (UNESP).
Knowledge Organization,Baden-Baden, v.45, p.220 - 231, 2018.
FUJITA, M.S.L.; CRUZ, M.C.A.; PATRÍCIO, B.O.M. Linguagens de indexação em
bibliotecas universitárias: estudo analítico. Informação & Informação, Londrina, v.24,
p.190 -225, 2019. http://dx.doi.org/10.5433/1981-8920.2019v24n1p190.
artIgos em revIstas cIentíFIcas não Indexadas
FUJITA, M. S. L. A linguagem documentária na negociação de uma política de
indexação para bibliotecas universitárias: procedimentos e estratégias da pesquisa-ação
integral. Revista Conhecimento em Ação, Rio de Janeiro, v.1, n.1, p.2-17, jan./jun.2016.
Disponível em: https://revistas.ufrj.br/index.php/rca/article/view/3555/2782
Mariângela Spotti Lopes Fujita & Walter Moreira
48 |
trabalhos aPresentados em conFerêncIas nacIonaIs
CRUZ, M.C.A; SANTOS, L.P; FUJITA, M.S.L. Linguagens de indexação em
bibliotecas universitárias brasileiras: diagnóstico preliminar das regiões sul e sudeste. In:
ENCONTRO DAASSOCIAÇÃO DE EDUCAÇÃO E PESQUISA EM CIÊNCIA
DA INFORMAÇÃO DAIBEROAMÉRICA E CARIBE - EDICIC, 10., 2016,
Belo Horizonte. Anais do Encontro da Associação de Educação e Pesquisa Em Ciência
da Informação da Ibero-América e Caribe. Belo Horizonte: ECI/UFMG, 2016. v. 1.
p. 1821-1835. Disponível em: https://pt.scribd.com/document/372647015/Anais-
Edicic-2016. Acesso em: 10 jul. 2020.
CRUZ, M.C.A.; FUJITA, M.S.L.; SANTOS, L.B.P. Linguagem de indexação no
contexto da política de indexação: estudo em bibliotecas universitárias. In: PINTO,
F.A.; GUIMARÃES, J.A.C. (org.).Memória, tecnologia e cultura na organização do
conhecimento. Recife: Ed.UFPE, 2017. v.4. p. 217-224. (Trabalho apresentado no IV
Congresso Brasileiro emOrganização e Representação do Conhecimento – IV ISKO
Brasil, realizado em setembro de 2017 em Recife). Disponível em: http://isko-brasil.org.
br/. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; CRUZ, M.C.A.; PATRÍCIO, B.O.M. A construção de tesauros na
perspectiva dos manuais de indexação. In:ENCONTRO NACIONAL DE PESQUISA
EM CIÊNCIA DA INFORMAÇÃO, 18.,Marilia, 2017. Disponível em: http://
enancib.marilia.Unesp.br/index.php/xviiienancib/ENANCIB. Acesso em: 21 nov. 2020.
SANTOS, J.C.F. dos; CERVANTES, B.M.N; FUJITA, M.S.L. Tesauro eletrônico:
importação no TemaTres e disponibilização na web. In: ENCONTRO NACIONAL
DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 19., 2018, Londrina. Anais do
XIX Encontro Nacional de Pesquisa em Ciência da Informação. Londrina: UEL, 2018. v.
1. p. 1-19.
SANTOS, J.C.F. dos; FUJITA, M.S.L. Tesauro Unesp: Integração do registro de
autoridade para o TemaTres. In:ENCONTRO NACIONAL DE PESQUISA EM
CIÊNCIA DA INFORMAÇÃO, 19., 2018, Londrina. Anais do XIX Encontro Nacional
de Pesquisa em Ciência da Informação. Londrina: UEL, 2018. v. 1. p. 1-20.
FUJITA, M.S.L. Construção de linguagem de indexação para bibliotecas universitárias:
uma experiência da Unesp com a pesquisa-ação integral. In: SEMINÁRIO DO
GRUPO DE PESQUISA MHTX, 3., 2018, Belo Horizonte. Anais do III Seminário
do Grupo de Pesquisa MHTX: perspectivas em representação e organização do
conhecimento: atualidades e tendências na relação universidade-empresa. Belo
Horizonte: ECI/UFMG, 2018. v. 3. p. 36-40.
FUJITA, M. S. L. Construção e manutenção de tesauro em bibliotecas universitárias:
uma experiência de interoperabilidade semântica. In: CAMPOS, M.L. de A. et al.
(org.). Produção, tratamento, disseminação e uso de recursos informacionais heterogêneos.
Niterói: IACS/UFF, 2018, v. 5, p. 110-116. Disponível em: https://app.u.br/riu/
handle/1/9195. Acesso em: 10 jul. 2020.
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 49
trabalhos aPresentados em conFerêncIas InternacIonaIs
FUJITA, M.S.L ; RUBI, M.P. Compatibilidade entre linguagens documentais para
construção, atualização e adequação de vocabulário de bibliotecas universitárias. In:
RODRÍGUEZ MUÑOZ, J.V.; GIL-LEIVA, I; DÍAZ ORTUÑO, P.; MARTÍNEZ
MÉNDEZ, F.J. (ed.). Organización del conocimiento: sistemas de información abiertos.
Actas del XII Congreso ISKO España y II Congreso ISKO España y Portugal, 19 y 20 de
noviembre. Murcia, 2015. p. 345-356. Disponível em: http://www.iskoiberico.org/
congresos/murcia-2015/. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W. La gestión
del lenguage de indización por software: evaluación para uso en control de los
registros de autoridad de catálogos en línea de bibliotecas. In: ENCUENTROS
INTERNACIONALES SOBRE SISTEMAS DE INFORMACIÓN Y
DOCUMENTACIÓN(IBERSID 2017), 22., Zaragoza, 2 a 4 out. 2017. Disponível
em: http://www.ibersid.es/wpcontent/uploads/2017/06/Programa.pdf. Acesso em: 21
nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W. Avaliação das
características do TemaTres e Multites para o controle de autoridades nas bibliotecas
universitárias. Scire, Zaragoza, v.23, p.63-73, 2017. Disponível em: http://www.ibersid.
eu/ojs/index.php/scire/article/view/4430/3901. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P.; CRUZ, M.C.A.; MOREIRA, W.; RIBAS, R.R.
de B. Construction and evaluation of logical hierarchical structures of indexing
languages for online catalogs of libraries In: ISKO UK Conference 2017: Knowledge
Organization: what’s the story?, 2017, Londres. [Trabalho submetido como artigo ao
periódico Knowledge Organization].Disponível em: http://www.iskouk.org/content/
iskomedia. Acesso em: 21 nov. 2020.
FUJITA, M.S.L.; SANTOS, L.B.P. dos; SANTOS, N. de S. dos. A função do registro
de autoridade de assunto na construção e uso de linguagens de indexação para catálogos
online. In: CONGRESO ISKO ESPANA Y III CONGRESO ISKO ESPANA-
PORTURGAL, 13., 2017, Coimbra. Tendências Atuais e Perspetivas Futuras em
Organização do Conhecimento: atas do III Congresso ISKO. Coimbra: Universidade de
Coimbra. Centro de Estudos Interdisciplinares do Século XX - CEIS20, 2017. v. 1. p.
577-586. Disponível em: https://purl.org/sci/atas/isko2017. Acesso em: 21 nov. 2020.
lIvro PublIcado com membros da equIPe como organIzador
FUJITA, M.S.L (org.) Política de indexação para bibliotecas: elaboração, avaliação
eimplantação. Marília: Ocina Universitária; São Paulo: Cultura Acadêmica, 2016.
Disponível em: http://www.marilia.Unesp.br/Home/Publicacoes/politicas-de-indexacao-
parabibliotecas_ebook.pdf. Acesso em: 21 nov. 2020.
Mariângela Spotti Lopes Fujita & Walter Moreira
50 |
caPítulo de lIvro
SHINTAKU, M.; FUJITA, M.S.L; SCHIELSSL, M. Conceitos gerais. In:
SHINTAKU, M. (org.). Guia do usuário do TemaTres. Brasília: IBICT, 2019. v. 1. p. 21-
50. Doi: http://DOI: 10.18225/9788570131553.
| 51
2. C   
:   
     
    
 U
Walter Moreira
2.1 Introdução
2.2 Linguagem documentária e tesauro
2.3 Aspectos normativos na construção do tesauro
2.3.1 Tesauros
2.3.2 Terminologia
2.4 Termos, conceito e relações conceituais
2.5 O conceito de categoria, faceta e taxonomia aplicados aos tesauros
2.6 Relações terminológicas e relações conceituais
2.7 Considerações nais
Referências
2.1 Introdução
O Tesauro Unesp é fruto de um longo processo, resultado do
envolvimento direto e indireto de muitas pessoas, como ocorre com qualquer
https://doi.org/10.36311/2021.978-65-5954-069-3.p51-78
Mariângela Spotti Lopes Fujita & Walter Moreira
52 |
outro projeto dessa magnitude e ainda está, como também se espera, em
construção. Algumas experiências estão relatadas aqui e ali, neste livro, cujo
objetivo também é evidenciar a importância dos tesauros como sistemas de
organização do conhecimento (SOC) utilizados para organizar, representar e
recuperar informações em ambientes universitários ou outros que envolvam
o ensino superior e a pesquisa cientíca. Os relatos de experiência agrupados
neste livro, assim como o que aparece neste capítulo, também visam a inspirar
novos projetos destinados à elaboração e manutenção de tesauros ou outros
SOC. Espera-se que tais iniciativas auxiliem a povoar as redes de bibliotecas
universitárias, formal ou informalmente constituídas, com instrumentos
terminológicos de controle de vocabulário, tendo em vista sua indiscutível
relevância nesses e em outros ambientes de informação.
Apresenta-se neste capítulo uma espécie de síntese geral dos
conteúdos expostos e discutidos em duas ocasiões pontuais com o grupo
de catalogadores da rede de bibliotecas da Unesp que participaram, e ainda
participam, do planejamento e da elaboração da Tesauro Unesp. Trata-se do
oferecimento de dois cursos de capacitação, ambos ministrados a convite e
em conjunto com a Profa. Mariângela Spotti Lopes Fujita, coordenadora do
Projeto, organizados conforme as informações apresentadas no Quadro 1.
Quadro 1 – Cursos de capacitação oferecidos ao Grupo de Linguagem da
Rede de Bibliotecas da Unesp
Curso 1 Construção e manutenção de tesauros
Data de realização 31 ago. 2015
Ementa
O processo de representação temática em suas relações interdisciplinares
(aspectos linguísticos e lógicos) como subsídio à compreensão da
estrutura e funcionalidade de linguagens documentárias. Caracterização
da linguagem documentária como linguagem. As linguagens
documentárias alfabéticas: tesauro e lista de cabeçalho de assunto.
Objetivos
compreender a função e importância das linguagens documentárias no
processo de análise documentária;
diferenciar o uso e aplicação das linguagens documentárias alfabéticas:
lista de cabeçalho de assunto e tesauro;
caracterizar a estrutura e funcionalidade das linguagens documentárias
alfabéticas.
Conteúdo
Linguagem documentária e tesauro
Normas ISO e ANSI sobre vocabulários controlados
Taxonomia de linguagens documentárias
Relações terminológicas e relações conceituais 5 Exercícios
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 53
Curso 2 Elaboração da taxonomia da Linguagem Unesp
Data de realização 02 out. 2015
Ementa
Categorias e campo semântico. Denição de parâmetros para a criação
de categorias. O processo de elaboração da estrutura de categorias de
vocabulários controlados.
Objetivos
Compreender o conceito de categoria e sua aplicação na denição de
taxonomia de linguagens documentárias
Conteúdo
O conceito de categoria
Distinções entre categorização e classicação
As categorias fundamentais de Ranganathan e do CRG 4 Exercícios
Fonte: Elaborado pelo autor (2020).
O que se apresenta a seguir não se refere exatamente aos materiais
ou recursos utilizados nos cursos, tendo-se em vista que a organização deste
texto lhes é posterior e é sumarizadora, mas ao esforço de síntese das ideias
então discutidas como mais um subsídio para compreensão do processo de
construção do Tesauro Unesp.
2.2 lInguagem documentárIa e tesauro
Uma linguagem documentária é uma linguagem construída e
utilizada para auxiliar na representação e na descrição dos assuntos dos
documentos em ambientes de informação, algo que é normalmente referido
na literatura como “representação temática”. A forma de adjetivação
pelo uso da expressão “temática”, nesse caso, é utilizada para diferenciar
o escopo desse modelo de representação da “representação descritiva”,
ainda que esta aparente dicotomia atenda mais a questões didáticas do que
epistemológicas propriamente ditas. Enquanto a representação temática
vincula-se à produção de condensações dos textos, gerando índices e
resumos, a representação descritiva vincula-se à identicação e descrição de
aspectos que possibilitam a identicação material dos documentos. Neste
caso, a identicação dos elementos ocorre por “apreensão instantânea
(KOBASHI, 2008, p. 52).
A distinção entre representação temática e representação
descritiva, rearma-se, não deve ser tomada em aspecto absoluto, pois a
identicação do autor de uma obra, por exemplo, normalmente referida
Mariângela Spotti Lopes Fujita & Walter Moreira
54 |
como representação descritiva, congura-se, também como uma indicação
de assunto, isto é, a partir da identicação do nome do autor é possível,
muitas vezes, saber, com maior ou menor precisão, qual o assunto do
documento.
Dentre as linguagens documentárias, destacam-se, por sua maior
robustez, os sistemas de classicação – tais como a Classicação Decimal
de Dewey (CDD), a Classicação Decimal Universal (CDU) ou o sistema
de classicação utilizado pela Biblioteca do Congresso, nos Estados
Unidos, a Library of Congress Classication (LCC) – e os tesauros, tais
como o esaurus Agrícola Nacional, mantido pela Biblioteca Nacional de
Agricultura (BINAGRI) ou o Art & Architecture esaurus, desenvolvido
pelo Getty Institute Research.
Linguagens documentárias como os sistemas de classicação são
chamadas de linguagens documentárias notacionais, os tesauros, por sua
vez, são denominados linguagens documentárias alfabéticas. As primeiras
utilizam notações (de modo prioritário) e expressões verbais para designar
os assuntos e ordenam os conceitos hierarquicamente. As últimas usam
expressões verbais para designar os assuntos e ordenam os conceitos de
forma prioritariamente alfabética. Enquanto os sistemas de classicação
instrumentalizam o processo de classicação e contribuem para a inserção
dos documentos em classes, em processos de generalização, os tesauros
são aplicados em processos de indexação, contribuindo para buscas mais
precisas em processos de especialização (individualização) dos documentos.
Observem-se, por m, os destaques dados na frase às prioridades, pois
ao nal ambos os modelos de linguagem documentária possuem partes
alfabéticas e sistemáticas em relações de complementaridade.
Os tesauros são sistemas de organização do conhecimento que
possibilitam a identicação e a descrição dos sistemas conceituais que
constituem os domínios, juntamente com as teorias e ontologias que lhes
sustentam. Funcionam também como instrumentos de padronização
das representações de modo a oferecer condições para que pesquisadores
(ou usuários, de modo geral), sistemas de informação documentária e
prossionais da informação responsáveis pela construção de representações
documentárias (indexadores) utilizem a mesma forma verbal ou seus
equivalentes em outros idiomas para se referir a um determinado conceito.
Obviamente que aproximar discussões sobre linguagem, univocidade e
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 55
padronização nunca é algo tão pacíco e que seria uma ideia ingênua, para
dizer o mínimo, imaginar que a complexidade dessas relações pode ser
traduzida e resolvida por meio de qualquer algoritmo.
Um destes aspectos complexos envolve discussões sobre
padronização. Um tesauro, considerando-se os aspectos pragmáticos que
circundam sua construção e seu uso e os aspectos dinâmicos das culturas,
pode promover a padronização por meio da harmonização. No âmbito da
terminologia, a harmonização, conforme a compreensão desse conceito
expressa em Pavel e Nolet (2002, p. 30): “combina o desejo de precisão
conceitual e correção linguística, a adequação do termo à situação de
comunicação e a ecácia da comunicação”. Com a nalidade de torná-lo
mais claro, ao conceito de “harmonização” contrapõem-se os conceitos de
normalização” e de “recomendação” apresentados em Barros (2004, p.
87-88):
A normalização se dá com base em medidas coercitivas, adotadas
por uma autoridade política ou de outra natureza e, normalmente, é
fruto de um contexto sociolinguístico particular. [...] A perspectiva
da recomendação é outra e signica que um termo deve ser
empregado preferencialmente em relação a outros sinônimos [...]
Um termo recomendado poderá eventualmente ser normalizado se
ele conseguir eliminar seus concorrentes. [...]
Tálamo (1997, p. 3), por exemplo, aponta a “tensão entre a
padronização da informação e a possibilidade de inseri-la em sistemas de
comunicação mais potentes” como marca característica do desenvolvimento
dos processos documentários. Há, evidentemente, outros aspectos
semânticos e pragmáticos complexos envolvidos nessa questão e eles são
amplamente discutidos na literatura da ciência da informação. Assim, as
questões relativas à construção de linguagens documentárias constituem
o objeto da linguística documentária. À análise documentária cabem as
questões que dizem respeito ao tratamento e a recuperação da informação
(TÁLAMO, 1997).
O tesauro, um sistema simbolicamente instituído (CINTRA
et al., 2002) e que é utilizado como instrumento comutador, tem por
nalidade facilitar a comunicação. Neste caso, refere-se à comunicação que
ocorre, ou precisa ocorrer, nos contextos documentários e que é mediada
Mariângela Spotti Lopes Fujita & Walter Moreira
56 |
por uma linguagem construída que requer, por essa mesma condição,
regras explícitas para seu uso com recurso de vocabulários controlados.
Atendo-se à sua função, a nalidade precípua do vocabulário controlado
é, anal, fazer coincidir o vocabulário do indexador e o vocabulário do
pesquisador.
As metodologias para construção e manutenção de tesauros
evoluíram signicativamente nos anos recentes e algumas orientações
relativamente abrangentes sobre o assunto podem ser encontradas em
livros, e.g. Broughton (2006), artigos, e.g. Mcculloch (2005) ou páginas
na internet, e.g. Zeng (2005). As normas técnicas, respeitadas as limitações
inerentes à sua natureza, também oferecem subsídios importantes para o
tema. Por m, a teoria da terminologia também tem sido incorporada como
elemento fundamental em relação aos aportes teóricos e metodológicos
que fornece.
Na sequência, apresentam-se alguns aspectos normativos e
terminológicos aplicados à construção e manutenção de tesauros.
2.3 asPectos normatIvos na construção de tesauros
De modo geral, as normas aplicadas à documentação visam a
atender a um desejo universal no universo da recuperação da informação:
viabilizar a realização de apenas uma consulta simultânea e bem-sucedida
em todas das bases de dados, repositórios e outras coleções relevantes,
sem necessidade de qualquer reformulação. Sabe-se que proposta em si é
utópica e envolve aspectos políticos, econômicos e sociais cuja discussão
este capítulo não comportaria. Por ora, pode-se discutir os cuidados que se
pode tomar na construção de tesauros enquanto instrumentos que podem
potencialmente melhorar a qualidade das representações realizadas por
indexadores e usuários de sistemas de informação documentária.
Um dos pontos críticos em relação à intenção de utilizar tesauros
com a nalidade de ampliar o universo de busca, e aproximar-se da “utopia
indicada no parágrafo anterior, diz respeito às ações de interoperabilidade
semântica entre os diversos tipos de SOC como condição necessária. Nesses
casos, as normas internacionais podem efetivamente contribuir, pois no
negócio da informação, ressalta Clarke (2010, p. 43) “o isolamento nacional
está condenado”. A perspectiva internacional, globalizada, também segue
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 57
pela via errada. Espera-se que os tesauros e os outros SOC de modo geral,
atendam às perspectivas da glocalização.
Apesar de ainda se congurar como um neologismo, não
registrado nos dicionários de língua mais conhecidos, o conceito já tem
aparecido com alguma frequência na literatura cientíca. Em busca rápida,
sem aplicação de ltros, foram localizados 554 mil resultados no Google
Acadêmico; na base de dados Scopus, já com alguma restrição na estratégia
de busca por meio da expressão “KEY(glocalization) AND PUBYEAR >
2010”, foram identicados 226 documentos. A glocalização é uma reação
à globalização, à ideia de homogeneização e imperialismo cultural que esse
conceito carrega. A gênese do termo relaciona-se ao slogan utilizado pelo
CEO da Sony, no Japão, Akio Morita: “pense globalmente, aja localmente”,
em tradução livre. De modo simplicado, glocalização é “a integração de
diferenças e práticas culturais locais em iniciativas, programas ou projetos
baseados em uma estrutura de globalização” (FRANCOIS, 2015, p. 62,
tradução livre), isto é, a denição de objetivos em escala global sem perder
de vista as realidades locais.
No que se refere às normas internacionais aplicadas à construção de
tesauro, é preciso car sempre atento aos problemas locais que ultrapassam
os aspectos técnicos que podem ser alcançados por meio de normalização,
aos problemas decorrentes do caráter universalista e aos limites ditados
pelas tendências ou inclinações que o seu contexto de produção lhes impõe.
Embora haja muitas semelhanças de estrutura e de propósitos
entre os diferentes SOC, não existem normas individuais para cada um
deles e muito menos uma norma geral que os contemple a todos. Destacam-
se nesse cenário as normas sobre os topic maps
1
– apresentadas brevemente
neste capítulo apenas para efeitos de comparação e construção do texto –
as normas sobre tesauros e, adicionalmente, as normas sobre terminologia
que se aplicam à construção de tesauros.
Os topic maps são tipos de SOC que surgiram no nal da
década de 1990, como resposta à busca por um modo mais efetivo de
Apesar de alguns registros na literatura brasileira da expressão em português, “mapas de tópicos”, essa expressão
parece ainda não estar consagrada, motivo pelo qual optou-se pela utilização do termo em inglês. Como recurso
para mensurar a popularidade do termo, realizou-se busca no Google Acadêmico, mantendo-se as expressões
entre aspas. Foram localizados 12.500 resultados para “topic maps” contra apenas 191 resultados para “mapas
de tópicos”.
Mariângela Spotti Lopes Fujita & Walter Moreira
58 |
mesclar e organizar índices de nais de livros (COLMENERO RUIZ,
2005; GARSHOL, 2004). Nesse sentido, são inspirados nas técnicas de
classicação bibliográca e da indexação, de modo especial as técnicas de
indexação aplicadas à construção de índices de nal de livro.
Topic maps são mapas de conhecimento organizados a partir
da identicação de tópicos (assuntos ou temas), os quais são utilizados
para representar digitalmente alguma coisa. Seus elementos básicos são o
tópico, a associação e a ocorrência (Figura 1).
Figura 1 – Estrutura básica de um topic map
Fonte: By Hirzel at English Wikipedia - Transferred from en.wikipedia to Commons by Econt., Public
Domain, https://commons.wikimedia.org/w/index.php?curid=3621665.
A norma aplicada aos topic maps é a ISO/IEC 13520, publicada
em 2002 pela International Organization for Standardization (ISO) em
cooperação com a International Electrotechnical Commission (IEC). Essa
norma apresenta elementos de arquitetura e denições dos principais termos
relacionados aos topic maps (INTERNATIONAL ORGANIZATION
FOR STANDARDIZATION, 2002).
2.3.1 tesauros
A norma mais completa sobre construção de tesauros é a norma ISO
25964 – Information and documentation — esauri and interoperability
with other vocabularies (Informação e documentação – Tesauros e
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 59
interoperabilidade com outros vocabulários) (INTERNATIONAL
ORGANIZATION FOR STANDARDIZATION, 2011, 2013).
Essa norma foi publicada em duas partes, respectivamente:
parte 1: thesauri for information retrieval (tesauros para a recuperação
da informação), publicada em 2011, com 160 páginas, e parte 2:
interoperability with other vocabularies (interoperabilidade com outros
vocabulários), publicada em 2013, com 106 páginas.
A parte 1 cobre: a) conteúdo e construção do tesauro, mono ou
multilíngue; b) diretrizes sobre a aplicação de análise facetada em tesauros;
c) diretrizes sobre a gestão do desenvolvimento e manutenção do tesauro;
d) critérios para seleção de softwares para gestão de tesauros e e) modelo
de dados e seu esquema XML derivado. A parte 2 inclui alguns outros
tipos de SOC para efeitos das discussões sobre interoperabilidade, sem
se ocupar dos aspectos de suas normatizações. Desse modo, aborda:
sistemas de classicação bibliográca, sistemas de classicação arquivística,
taxonomias; listas de cabeçalhos de assunto, terminologias, ontologias,
listas de autoridade, anéis de sinônimos. Relativamente a cada um deles
apresenta suas principais características e antecedentes, sua tipologia, seus
componentes e relações semânticas e os aspectos que dizem respeito ao
mapeamento entre o tesauro e tipo de SOC em questão. A referida norma
não menciona, em nenhum das suas duas partes, os topic maps.
A norma ISO 25964 representa a síntese de um processo evolutivo
relativamente recente de normalização de vocabulários controlados. Assim,
o documento sintetiza alguns aspectos basilares já presentes e normas
anteriores e apresenta, em sintonia com as demandas dos ambientes
informacionais digitais, alguns outros aspectos relevantes neste contexto.
Dentre as normas anteriores, a ISO 2788, publicada
primeiramente em 1974 e revisada em segunda edição em 1986, tem como
título: Guidelines for the establishment and development of monolingual
thesauri (Diretrizes para o estabelecimento e desenvolvimento de tesauros
monolíngues). Em 1985, a ISO publicou a norma de número 5964,
complementar à ISO 2788, intitulada Guidelines for the establishment and
development of multilingual thesauri (Diretrizes para o estabelecimento e
desenvolvimento de tesauros multilíngues).
Mariângela Spotti Lopes Fujita & Walter Moreira
60 |
Essas normas foram adotadas como normas nacionais em
diversos países. No Reino Unido foram publicadas como BS 5723 (em
1979 e em 1987) e BS 6723 (em 1985). Depois dessas normas, apenas
os Estados Unidos continuaram a desenvolver separadamente uma norma
própria para a construção e uso de tesauros, a ANSI/NISO Z39-19 –
Guidelines for the construction, format, and management of monolingual
controlled vocabularies (Diretrizes para a construção, formatação e
gestão de vocabulários controlados monolíngues) (CLARKE, 2010),
publicada em 2005 e atualizada em 2010, com uma seção contemplando a
interoperabilidade e incluindo em sua cobertura, além de tesauros, outros
tipos de vocabulários, como listas, anéis de sinônimos e taxonomias.
No Brasil, onde não se desenvolveu uma norma nacional,
foram fundamentais as publicações de alguns manuais que derivaram das
normas internacionais, tais como o “Manual de elaboração de tesauros
monolingues” (GOMES, 1990) e as “Diretrizes para o estabelecimento
e desenvolvimento de tesauros monolíngues” (AUSTIN; DALE, 1993).
Trata-se, este último, de tradução da segunda edição do documento
publicado pela Unesco, em 1981: Guidelines for the establishment and
development of monolingual thesauri (Diretrizes para o estabelecimento
e desenvolvimento de tesauros monolíngues), revisada por Derek Austin
e Peter Dale, com tradução brasileira, sob responsabilidade do IBICT,
realizada por Bianca Amaro de Melo e revisada por Lígia Maria Café de
Miranda.
As normas britânicas BS 5723 e BS 6723, que tratavam,
respectivamente, de construção e gestão de tesauros monolíngues e de
tesauros multilíngues, foram posteriormente fundidas na norma BS
8723, publicada em cinco partes entre os anos 2005 e 2008, a saber:
parte 1: Denitions, symbols and abbreviations (Denições, símbolos
e abreviações); parte 2: esauri (Tesauros); parte 3: Vocabularies other
than thesauri (Vocabulários que não são tesauros); parte 4: Interoperability
between vocabularies (Interoperabilidade entre vocabulários) e parte
5: Exchange formats and protocols for interoperability (Formatos de
intercâmbio e protocolos para interoperabilidade).
A partir de 2007, a BS 8723 e a ANSI/NISO Z39-19 foram
tomadas como base para a revisão das normas ISO 2788 e 5694, resultando
na norma ISO 25964. A partir das análises das normas e de algumas
Manual do planejamento, construção e manutenção do
tesauro Unesp para bibliotecas
| 61
observações apontadas por Clarke e Zeng (2012), passase a indicar as
principais alterações que a norma ISO 25964 apresenta em relação às
normas anteriores. Na parte 1:
a) ênfase na distinção entre termo e conceito e a prioridade ao
conceito;
b) fusão na mesma norma do tratamento de tesauros monolíngues e
multilíngues, com privilégio aos primeiros;
c) abordagem prioritária do tesauro em relação a outros tipos de
SOC;
d) ampliação do conjunto de denições dos termos utlizados na
norma (glossário);
e) respeito às diferenças culturais no tratamento das relações
associativas, principalmente nos tesauros multilíngues;
f) tratamento das relações de equivalência com observância das
variações linguísticas em diferentes idiomas;
g) inclusão de seção que trata da análise facetada e de sua
importância para a construção de tesauros;
h) possibilidade de especicação no uso das tags para indicação das
relações hierárquicas, com possibilidade de distinção entre relações
hierárquicas genéricas, partitivas ou de instanciação;
i) indicações de critérios para seleção de softwares para gestão de
tesauros.
Na parte 2:
a) inclusão de modelos estruturais para mapeamento entre diferentes
vocabulários;
b) discussão sobre tipos de mapeamento: equivalência, hierárquicos,
associativos;
c) uso de mapeamentos para recuperação da informação;
d) tratamento da pré-coordenação, gestão e exibição dos
mapeamentos;
Mariângela Spotti Lopes Fujita & Walter Moreira
62 |
e) descrição geral das características de “outros vocabulários
(expressão presente no título da norma), incluindo para cada
um: componentes semânticos e relações conceituais e relações de
interoperabilidade e mapeamento com o tesauro.
A norma ISO 25964-2 torna explícita a relação entre a terminologia
teórica e os tesauros, na seção de número 22 (INTERNATIONAL
ORGANIZATION FOR STANDARDIZATION, 2013), ainda que,
dada a natureza do documento, não a desenvolva de modo suciente. As
implicações entre a teoria e a metodologia da terminologia e os estudos
sobre construção e manutenção de tesauros têm sido abordadas em diversos
estudos, dentre os quais: Ruiz Pérez (1992), Barité Roqueta (2000), Cintra
et al. (2001), Lara (2006, 2007, 2009), Broughton (2008) e Lima (2015),
entre outros.
2.3.2 termInologIa
Considerando-se as relações teóricas e metodológicas de
proximidade que envolvem os tesauros e a terminologia, é fundamental
conhecer as normas sobre terminologia. A norma ISO 704, publicada em
2009, e a norma ISO 1087 (partes 1 e 2), publicada em 2001, dispõem
sobre o trabalho terminológico, seus princípios e métodos, esclarecendo
sobre termos, conceitos e relações conceituais, bem como sobre os
conceitos as funções da “denição” e da “designação”, além de descrever
sobre suas funções no trabalho terminológico. Apesar da presença da
palavra “métodos” no título da norma ISO 704 – Terminology work –
Principles and methods (Trabalho terminológico – princípios e métodos),
essa norma apresenta pouco conteúdo relativo ao sentido estrito que se
atribui aos procedimentos de pesquisa terminológica. Para esse caos,
é preciso consultar manuais e textos especializados como, entre outros,
Arntz; Picht (1995), Aubert (2001), Pavel; Nolet (2002), Barros (2004) e
Krieger; Finatto (2004).