María Jesús Lamarca Lapuente. Hipertexto: El nuevo concepto de documento en la cultura de la imagen. |
Un tesauro es un vocabulario controlado y estructurado
formalmente, formado por términos que guardan entre sí
relaciones semánticas y genéricas: de equivalencia, jerárquicas y asociativas.
Se trata de un instrumento de control terminológico que permite convertir el
lenguaje natural de los documentos en un lenguaje controlado, ya que representa,
de manera unívoca, el contenido de estos, con el fin de servir tanto para la
indización, como para la recuperación de los
documentos.
Frente a los lenguajes clasificatorios cuya función es
describir el tema de un documento, los
términos contenidos en un tesauro responden al análisis del texto o materia.
Un tesauro recoge todos los conceptos y no sólo los que corresponden al título o
el texto. Un único tema (aquello de lo que trata el documento) suele
desarrollarse mediante una serie de ideas o conceptos que se pueden describir
por medio de una serie de términos o descriptores. El tesauro incorporará todos esos
términos en una base de datos y cada uno de ellos se convertirá en un punto de
acceso para la recuperación del documento.
La estructura de un tesauro se basa en los siguientes
elementos: Unidades léxicas: que pueden
comportar las siguientes categorías: grupos de descriptores que agrupan los
términos de indización bien por campos (temas), bien por clases de términos
(facetas). descriptores: t términos simples o unitérminos: se
emplean cuando el concepto es claro en sí mismo, sin necesidad de añadir ninguna
otra palabra, o cuando se usa como genérico de términos más concretos o
específicos. Ejemplo: Documentos. términos compuestos: la mayoría de los
términos de un tesauro adquieren su verdadero sentido cuando se convierten en términos
compuestos, ya que así se logra una mayor especificidad. La estructura
sintáctica de los términos compuestos suele ser la siguiente: sustantivo + adjetivo: Documentos
digitales sustantivo + sintagma preposicional:
sustantivo + sintagma aposicional:
no descriptores: términos prohibidos.
Al elegir un único término para eliminar la sinonimia del lenguaje natural, se
rechazan los términos restantes, que serán los no descriptores. Relaciones semánticas: son todas
aquellas relaciones
relaciones de equivalencia: se
derivan de la gran proximidad fonética o sémica entre los descriptores y no
descriptores relaciones jerárquicas: s Relaciones género-especie: se
aplica a acciones, propiedades y agentes. (T.G.
Armas/T.E. Armas blancas) Relaciones parte-todo: el
nombre de una parte implica y evoca la del todo poseedor. Se aplica a objetos,
lugares, disciplinas y sus partes de estudio, estructuras sociales, etc. (T.G.
Guerra/T.E. Guerra de Irak) relaciones asociativas:
Atendiendo a diferentes aspectos, los tesauros pueden ser de
diferentes tipos, entre los que cabe destacar los siguientes: Tesauro facetado: se trata de un
tesauro que combina una clasificación facetada sistemática, con un tesauro
alfabético que reemplaza al índice de la clasificación. Tesauro monolingüe: es el que
contiene descriptores en una única lengua. Tesauro multilingüe: contiene
descriptores en más de una lengua. Macrotesauro: se trata de un
tesauro que incluye algunos descriptores básicos comunes y los propios de su
campo o especialidad. En cuanto a su estructura, se pueden establecer 3 tipos de
tesauros: Tesauro lineal: presenta los
descriptores de forma simple, sin conexiones. Tesauro en forma de árbol: se
construye siguiendo una jerarquía en forma de árbol. Cada descriptor posee un
descriptor genérico y varios descriptores con los que se relaciona de forma de
forma ascendente o descendente. Tesauro reticular: tesauro
construido en forma de red en el cual los descriptores se entrecruzan. Cada
descriptor puede tener varios descriptores genéricos y varios descriptores
específicos En cuando a su presentación,
un tesauro puede ser: Alfabético:
los descriptores y no descriptores se agrupan en una única secuencia alfabética
junto con sus relaciones. Sistemático:
estructurado en 2 parte. La primera de ellas o parte principal, contiene las
categorías o jerarquías, y la segunda parte o parte auxiliar, consta de un
índice alfabético que conduce a los usuarios a la sección semántica
correspondiente a la que pertenece el término. Gráfico:
los términos se presentan en forma de figura gráfica donde se asocian los
términos relacionados. Esta representación gráfica suele representarse en forma
de árbol, o utilizar flechas. Los tesauros también suelen comprender un índice alfabético a
modo de parte auxiliar donde se incluyen los no descriptores, notas de alcance,
etc. Por lo general, los tesauros se presentan con una estructura
tripartita, esto es, un apartado jerárquico en donde se presentan los
descriptores en el contexto de su campo semántico, una parte alfabética para
facilitar la entrada en el tesauro por la primera palabra significativa de
descriptores y no descriptores y que expresa las relaciones del vocabulario, y
un índice permutado que permite el acceso por el resto de términos
significativos. Distintos aspectos
referentes a los tesauros Estas normas son las que establecen la
forma de presentación de los términos de un tesauro: cuando usar unitérminos o
términos compuestos, cuando usar el plural o el singular, como deshacer la
homonimia mediante el uso de calificadores, como introducir notas aclaratorias,
etc. He aquí un resumen de las principales directrices con unos ejemplos al
respecto:
Fuente: Félix del Valle Gastaminza.
Lenguajes documentales: los tesauros. Frente a la utilización de encabezamientos o
clasificaciones,
el uso de tesauros ofrece grandes ventajas como una mayor especificidad de los
términos relativos a campos disciplinares concretos, lo que permite un análisis
más preciso de los documentos. Además, al poder utilizar relaciones asociativas,
se crea un universo interdisciplinar que permite una clasificación no estanca. A
esto se añade que los tesauros constituyen un lenguaje combinatorio, puesto que
los descriptores se pueden usar de forma independiente o combinarlos mediante
operadores booleanos y sintácticos. He aquí unas directrices para la elección de los descriptores
de un tesauro:
Fuente: Félix del Valle Gastaminza.
Lenguajes documentales: los tesauros. La estructura de los tesauros están
controlada por estándares internacionales que tienen una notable influencia
sobre los desarrollos de bibliotecarios y documentalistas. En el año 2003 se revisó la antigua norma ANSI/NISO
Z39.19, equivalente a la ISO-2788 para adecuarla a los nuevos requerimientos electrónicos, como por
ejemplo, incluir métodos adicionales de búsqueda y navegación, búsqueda por
palabras clave, uso de metadatos, formatos de
presentación, aplicaciones web, etc. Como resultado de esta revisión se
publicó la norma ANSI/NISO Z39.19 - 2003 Guidelines for the Construction, Format
and Management of Monolingual Thesauri, que
permite una mayor interoperabilidad entre sistemas distintos. Esta norma muestra
cómo formular descriptores, establecer relaciones entre los términos y presentar
la información ya sea impresa o en pantalla. Las ventajas que aporta el hipertexto a los tesauros son
incontables ya que no sólo los enlaces permiten He aquí una pequeña muestra de las herramientas y software existentes para la construcción y gestión de tesauros:
Fuente: Star/Thesaurus.
http://www.cuadra.com/products/thesaurus-screen.html Algunas de estas herramientas son parte de paquetes más
amplios de programas para gestionar la información, como es el caso de: Adlib:
http://www.adlibsoft.com/ LinkFactory:
http://www.landcglobal.com/pages/linkfactory.php LiveLink:
http://www.opentext.com/basis/ Se trata de un paquete integrado para
gestionar bibliotecas que permite la construcción de catálogos, tesauros y
gestión de diversas bases de datos. SchemaLogic:
http://www.schemalogic.com/ Star:
http://www.cuadra.com/products/star.html, un paquete de software para
gestión de bibliotecas especializadas, centros de información técnica, museos,
archivos, etc. y que que incluye una herramienta llamada Star/Thesaurus:
http://www.cuadra.com/products/thesaurus-mgmt.html WebChoir:
http://www.webchoir.com/
Fuente: Live Link.
http://www.opentext.com/media/img/screenshot-basis.gif La mayor parte de estas herramientas permiten la conversión a
HTML y la exportación a la Web
de los tesauros con ellas generados. Lo cierto es que en los sistemas de documentación
digital, sean en línea o fuera de ella, en una
Intranet o en Internet no tiene ningún sentido la
utilización de tesauros impresos en papel. El hipertexto se constituye como una herramienta
que amplía las posibilidades documentales actuales permitiendo
relacionar las fuentes primarias con tesauros, índices o vocabularios. Por
ejemplo, sería posible tomar un tesauro especializado en una determinada
materia y que éste remita a documentos completos. Sin
embargo, la utilización de un tesauro hipertextual siguiendo el modo tradicional
al uso, tampoco ofrecerá grandes funcionalidades, sino muy limitadas. Desde hace
ya bastantes años han existido críticas a la forma de confeccionar los tesauros
tradicionales, como afirma Antonio García Jiménez en
Instrumentos de representación del conocimiento: tesauros
versus ontologías: "anclados en la infrautilización de las relaciones
asociativas, en la falta de modelos que incorporen el contexto discursivo y el
de uso, en la falta de conexión con las posibilidades que los nuevos recursos
informáticos ofrecen". Lo que se
precisa es contar con un tesauro que pueda adaptarse a las necesidades de
interoperabilidad y escalabilidad de la red, y que pueda
soportar la capacidad y potencia estructural que ofrece un lenguaje como
XML. El lenguaje XML sí puede ser un soporte adecuado para
compartir bajo un estándar común y universal una herramienta de control
terminológico como es un tesauro. XML aporta la estructura para que los sistemas
sean interoperables, pero se precisan también una serie de herramientas que
puedan mostrar las relaciones semánticas. Además, los tesauros en línea no son
flexibles ni dinámicos ni pueden tratar objetos. De esta forma, se comenzaron a
utilizar lenguajes, en conjunción con XML, que sí ofrecen
una potente y rica estructuración semántica, como el lenguaje
RDF, RDFSchema
o lenguajes semánticos como DAM-OIL,
OWL y el uso de todo tipo de esquemas y
ontologías, que permiten marcar la información de
tal forma que sea legible por máquina y de una forma flexible y dinámica.
Además, los namespaces de RDF
permiten la
utilización de vocabularios distribuidos. Aunque la idea sea lograr la
automatización de tesauros dentro de la
SKOS Core (http://www.w3.org/2004/02/skos/core/)
es un estándar que soporta la descripción de lenguajes orientados a sistemas de
organización del conocimiento (KOS) tales como tesauros, glosarios, vocabularios
controlados, listas de encabezamientos, terminologías,
taxonomías,
folksonomías y esquemas de
clasificación ya que es un modelo que permite expresar la estructura básica y el
contenido de todo tipo de esquemas conceptuales. SKOS cuenta con una
especificación
SKOS Core
Vocabulary Specification:
http://www.w3.org/TR/swbp-skos-core-spec/ que es
un aplicación de RDF y que puede usarse para expresar un
esquema conceptual como un grafo RDF.
Además, existe una especificación formal del
vocabulario de SKOS Core en RDF/OWL. En la siguiente figura se
muestra la clase skos:ConceptScheme que permite
declarar que un recurso en un esquema conceptual:
Fuente: W3C. SKOS Core Guide.
http://www.w3.org/TR/swbp-skos-core-guide/ Que en sintaxis RDF sería: He aquí otro ejemplo. Un concepto puede participar de
varios esquemas. Se usa la propiedad skos:hasTopConcept
para establecer un enlace entre el esquema conceptual y el concepto que está
en el nivel conceptual más alto de la jerarquía: Fuente: W3C. SKOS Core Guide.
http://www.w3.org/TR/swbp-skos-core-guide/ También existen otros
proyectos como
The Thesaurus Interchange Format (TIF) un formato de intercambio para
migrar los tesauros a ontologías
y para desarrollar e integrar los tesauros en
la Web semántica.
Fuente: Wilson, Michael. "Thesaurus
relations as RDF schema - Example". En resumen, el De cualquier forma, el contenido de los tesauros, algunos de
los cuales abarcan el conocimiento de una disciplina completa, son una
potente base y una herramienta excepcional para la construcción de una
ontología.
ANSI/NISO Z39.19 - 2003 Guidelines for the
Construction, Format, and Management of Monolingual Thesauri
ARANO,
Silvia. "Los tesauros y las ontologías en la Biblioteconomía y la
Documentación". Hipertex.net, núm , 3, 2005.
http://www.hipertext.net/web/pag260.htm
CINDOC.
Controlled Vocabulary .com http://controlledvocabulary.com
COOL. Lexical and Classification Resources.
http://palimpsest.stanford.edu/lex/
CURRÁS, Emilia. Tesauros: Manual de Construcción y Uso.
Madrid, KAHER II, 1998.
CURRÁS, Emilia. Ontologías, taxonomías y tesauros: Manual de construcción y
uso. Gijón, Trea, 2005.
FAST, Karl. LEISE; Fred. STECKEL, Mike. What Is A
Controlled Vocabulary? http://www.boxesandarrows.com/archives/what_is_a_controlled_vocabulary.php
GALLUP FALLEN, Emily. A New Standard for Controlled Vocabularies- NISO
Updates Z-39.19. June, 8. 2004.
http://www.sla.org/Presentations/Nash2004/DITEContentMgmtStds.ppt
GARCÍA JIMÉNEZ, Antonio.
"Instrumentos de representación del conocimiento: tesauros versus ontologías".
Anales de Documentación, núm. 7, 2004.
http://www.um.es/fccd/anales/ad07/ad0706.pdf [Volver]
GETTY.
Getty Thesaurus of Geographic Names ISO 2788:1986 - Guidelines for the establishment and development of monolingual thesauri. International Organization for Standardization (ISO), 1986. ISO 5964:1985 - Guidelines for the establishment and development of multilingual thesauri. International Organization for Standardization (ISO), 1985.
MATTHEWS, Brian. MILLER, K. WILSON, Michael. A Thesaurus Interchange Format in RDF. http://www.limber.rl.ac.uk/External/SW_conf_thes_paper.htm
PÉREZ AGÜERA, José Ramón. Automatización de
Tesauros y su utilización en la Web Semántica.
http://www.w3.org/2001/sw/Europe/events/200406-esp/trabajo-final-extratesauros/trabajo-final-extratesauros.html SAORÍN PÉREZ, Tomás. Generación de un sistema hipertexto orientado a la gestión de Tesauros. Murcia, Universidad, 1993. SeSDL. Taxonomy , Classification and Metadata Resources. http://www.sesdl.scotcit.ac.uk/taxonomy_links.html SLYPE, Georges van. Los lenguajes de indización: Concepción, construcción y utilización en los sistemas documentales. Madrid, Pirámide, 1991. [Volver] Thesaurus. com http://thesaurus.reference.com/
UNESCO. UNESCO
Thesaurus. University of Massachusetts. Classification, Indexing, Metadata, and Thesauri. http://www.library.umass.edu/catalog/class.html VALLE BRACERO, A. REY GUERRERO, A. ; PÁEZ MAÑA, J.; VALLE BRACERO, R. "Tesauros en HTML: un modelo de diseño y estructura para su consulta en la malla mundial (WWW)". Revista Española de Documentación Científica, 2000, vol. 23, n. 2. VALLE GASTAMINZA, Félix del. Lenguajes documentales: Los tesauros. http://www.ucm.es/info/multidoc/prof/fvalle/tesauro.htm
VALLE GASTAMINZA, Félix del. GARCÍA JIMÉNEZ, Antonio; y otros.
"Construcción
de un tesauro para el Centro de Documentación de Telecinco". Scire, vol. 8, nº 1, enero-junio de 2002.
W3C. OWL Web Ontology Language Guide. http://www.w3.org/TR/owl-guide/
W3C. SKOS Core Vocabulary Specification. http://www.w3.org/TR/swbp-skos-core-spec/ W3C. SKOS Core Guide. http://www.w3.org/TR/swbp-skos-core-guide/ Wilpower Information. Software for building and editing thesauri. http://www.willpower.demon.co.uk/thessoft.htm Wilpower Information. Publications on thesaurus construction and use: including some references to facet analysis, taxonomies, ontologies, topic maps and related issues. http://www.willpower.demon.co.uk/thesbibl.htm
WILSON, Michael. MATTEWS, Brian. "Migrating Thesauri to the Semantic Web". ERCIM News No. 51, October 2002. Special Semantic Web.
http://www.ercim.org/publication/Ercim_News/enw51/wilson.html y
http://www.w3c.rl.ac.uk/pasttalks/slidemaker/XML_UK_SW_Thes/Overview.html
Mapa de navegación / Tabla de contenido / Mapa conceptual / Tabla de documentos / Buscador / Bibliografía utilizada / Glosario de Términos / Índice Temático / Índice de Autores
|
|