"El conjunto de la experiencia humana está creciendo a un ritmo
prodigioso,
pero los medios que empleamos para desplazarnos por este
laberinto...
son los mismos que utilizábamos en los tiempos de las
carabelas".
Vannevar
Bush:
As
we may think
El análisis del documento hipertextual, al igual que el análisis de
cualquier otro tipo de documento, se centra en 3 operaciones fundamentales: la
identificación y localización del documento, su descripción formal y la
descripción de su contenido.
La descripción formal abarca operaciones como la descripción
bibliográfica/documental y la catalogación;
y la descripción del contenido se refiere a operaciones como la
indización y clasificación y el
resumen
documental. Sin embargo, estas operaciones no son estancas. La catalogación
introduce elementos que no sólo se refieren a la descripción formal (los
tradicionales encabezamientos o puntos de acceso temáticos son, en realidad,
elementos descriptores similares a los que se usan en la indización de
documentos), y por eso la catalogación de materias se encuentra
en el punto de unión entre la catalogación como descripción de la mera forma
del documento y la descripción de su contenido intelectual. E
igualmente sucede con la tradicional catalogación
analítica que va un paso más allá de la simple descripción formal,
pues el catalogar una a una las partes de que consta un documento, requiere un
análisis algo más detallado que el de la simple forma y se puede considerar a
caballo entre el análisis del contenido y el análisis formal. En el caso del
documento digital,
los lenguajes de etiquetado y los metadatos son, en realidad, un compendio o una
combinación de elementos de descripción formal y de descripción de contenido,
ya que persiguen una descripción total e integral del documento y de sus partes.
El
tradicional análisis documental tiene por objetivo transformar los documentos
originales en otros secundarios que sirvan para identificar a los primeros y,
gracias a los cuales, sea posible tanto su recuperación como su difusión. Los
documentos secundarios deben representar de forma sintética a los originales y,
como su información está más concentrada, pueden ser consultados más
fácilmente que los documentos primarios. Por lo tanto, hay que extraer del
documentos primario “cierta” información contenida, para poder transformar
los documentos originales en otros secundarios. Pero ¿es aplicable este método
tradicional a los documentos de la Web? ¿Son precisas las mismas operaciones que
en la catalogación tradicional para facilitar la consulta y recuperación del
documento? ¿Son útiles los lenguajes documentales y las técnicas tradicionales?
Para
encontrar información en Internet, y más
concretamente en la World Wide Web, podemos recurrir a dos métodos:
-
Hacer búsquedas mediante
buscadores o metabuscadores. El problema radica en el número excesivo de
elementos recuperados, su poca calidad y relevancia. La última tendencia en las
entidades que gestionan los sistemas de búsqueda es vender los primeros puestos
que aparecerán en los resultados de búsqueda, con lo que se desvirtúa por
completo todo el proceso de obtención de resultados. A esto se une que muchas
personas y entidades utilizan, en la descripción de sus documentos, etiquetas
que no tienen nada que ver con el contenido temático real del documento, sino
que lo marcan con términos que se
utilizan mayoritariamente en las búsquedas, con el fin de que las páginas se
muestren a toda costa en los resultados de las búsquedas mayoritarias. Otro
problema es que los robots suelen indizar unidades físicas, y no recursos, puesto que
indizan páginas HTML o documentos completos. Por el contrario, una unidad de contenido como por
ejemplo un artículo, puede consistir en varias unidades físicas como varias páginas enlazadas entre sí a través de una tabla de
contenidos. Si tenemos en cuenta que un recurso electrónico es
cualquier objeto que contenga información del tipo que sea, que
exista y que sea accesible en la red, esto debe incluir tanto a un documento, como a
un libro electrónico, un programa de software, una imagen, un sonido o un servicio (por
ejemplo, una
base de datos, una lista de distribución, un foro de discusión, etc.), y
debería, por tanto, ser posible acceder y recuperar dicho recurso concreto
de forma individualizada.
-
Otra
posibilidad es acudir a una lista especializada de enlaces que suelen ser
más útiles para campos concretos y para temas muy especializados. Sin
embargo, las listas ofrecen una información muy limitada y su mantenimiento no
suele estar actualizado. Para solucionar estos problemas, las Bibliotecas y
Centros de Documentación tradicionales han comenzado a aplicar su experiencia,
conocimientos y técnicas en el campo de la documentación impresa, para
catalogar los recursos digitales. Se han creado así las bibliotecas digitales o
virtuales, buscadores y portales especializados que realizan todo el proceso técnico de la información (descripción,
clasificación y catalogación) adaptando y estableciendo el análisis
documental para la información digital.
Lo que está claro es que el
análisis documental tradicional es útil, pero no suficiente, para analizar los
nuevos documentos hipertextuales. Nuevas técnicas como el uso de
metadatos, el desarrollo de
ontologías y el nacimiento y puesta en práctica de nuevos
lenguajes hipertextuales, así como el
establecimiento de estándares normativos universales
a la hora de crear los documentos/hiperdocumentos, son nuevas técnicas que han
supuesto un salto cualitativo en la ciencia de la documentación. Las peculiares
características del documento hipertextual (conectividad,
digitalidad,
multisecuencialidad, estructura en red,
multimedialidad,
interactividad, dinamismo,
transitoriedad, etc.) han dado un giro a las operaciones técnicas
tradicionales tanto en lo referente al análisis documental en todas sus
vertientes, como a los métodos de creación, acceso y recuperación del documento
y de los elementos que lo componen. Y a este nuevo panorama no son tampoco
ajenos los nuevos avances tecnológicos como el uso de
agentes y robots y otras herramientas que permiten la automatización de
muchos de los procesos tradicionales y de otros nuevos procesos en desarrollo.
|