Metadatos para imágenes

María Jesús Lamarca Lapuente. Hipertexto: El nuevo concepto de documento en la cultura de la imagen.




Inicio   navega al azar mapa conceptual buscar
 

Muchos modelos de metadatos se pueden aplicar no sólo a textos, sino también a imágenes: pinturas, fotografías, películas, etc. Por ejemplo, los elementos de metadatos Dublin Core se pueden usar para describir fotografías, y para ello se utiliza una versión restringida del esquema DC en donde se interpretan de distinta forma las propiedades según los distintos esquemas que la incluyan.

El W3C cuenta con una Recomendación: Describing and retrieving photos using RDF and HTTP http://www.w3.org/TR/photo-rdf/ para describir y recuperar fotos digitalizadas con metadatos RDF. Esta recomendación describe el esquema RDF sobre HTTP usando el esquema Dublin Core junto a otros esquemas adicionales para datos técnicos.

Los metadatos de la Recomendación están separados en 3 esquemas diferentes:

  •  Dublin Core schema. Se utiliza el esquema general Dublin Core que es el típico para libros y artículos, pero que también sirve para películas, pinturas o fotos. Este esquema contiene propiedades tales como autor, editor, título, fecha de publicación y editor. Se usa la versión en formato RDF.

  •  Technical schema. Este esquema es el que captura los datos técnicos acerca de la foto y la cámara, tales como el tipo de cámara, tipo de película, lentes utilizadas, fecha de la película, y datos sobre el escáner y el software utilizado para digitalizar la imagen.

  •  Content schema. Este esquema se usa para categorizar el tema (subject) de la foto por medio de un vocabulario controlado. Este esquema permite que las fotos puedan recuperarse basándose en determinadas características como retrato (portrait), retrato de grupo de personas (group portrait),  paisaje (landscape), edificios (architecture), deportes (sports), animales (animals), boda (wedding), panomama, macro; dibujo abstracto, textura, patrón, etc.(graphic), etc.

Tanto el Technical schema como el Content schema fueron desarrollados para un programa llamado RDFPic. Dicho programa ha sido implementado en Java sobre un marco específico Jigsaw para recuperar el RDF de las imágenes a través de HTTP. Existe una demo y código fuente que puede ser descargado desde aquí. El sistema puede usarse para todo tipo de colecciones.

metadatos para fotos

Fuente: W3C. Describing and retrieving photos using RDF and HTTP.
 
http://www.w3.org/TR/photo-rdf/

Pero además de RDF -que se utiliza como un estándar para estructurar la información en cualquier esquema- y de Dublin Core que puede aplicarse a cualquier dominio del conocimiento y a cualquier formato, existen otros estándares para usar metadatos que describan objetos visuales tales como pinturas, esculturas, grabados, etc. Uno de los más utilizados en museos y archivos es el estándar CDWA o Categories for the Description of Works of Art, un esquema conceptual que fue desarrollado por The Art Information Task Force (AITF) y que consta de más de 30 categorías y subcategorías, entre las que podemos encontrar: orientación, dimensiones, condiciones, inscripciones, tratamiento de conservación, exhibición, etc. http://www.getty.edu/research/conducting_research/standards/cdwa/. También existen los metadatos de VRA Core Categories, que se construyeron sobre CDWA y son una expansión de éstas para describir un conjunto de elementos individuales de metadatos (medidas, material, técnica, autor, fecha, localización, estilo/período, cultura, derechos, etc.) que se pueden usar para describir tanto la obra (pintura, fotografía, escultura, obra arquitectónica, etc.) como las representaciones visuales de ésta. http://www.vraweb.org/vracore3.htm

Otros de los estándares de metadatos más conocidos para aplicar a imágenes son:

  •  EXIF: se trata de un estándar desarrollado por JEITA (Japan Electronics and Information Technology Industries Association) y es el que usan la mayoría de las cámaras digitales actuales (Canon, Sony, Nikon, Olympus, Kodak, etc.). Permite metadatos sobre tiempo de exposición, distancia focal, modelo de la cámara, datos del flash, etc. http://www.exif.org/

  •  IPTC: tradicionalmente conocidos por "encabezados IPTC" estos metadatos han sido desarrollado por el IPTC (International Press Telecommunications Council) primero mediante la especificación IMM (Information Interchange Model) http://www.iptc.org/IIM/ y actualmente bajo nuevas especificaciones como NewsML http://www.newsml.org/, que permite gestionar diferentes piezas de media y que se utiliza, sobre todo, para fotografías o noticias. También incluye varios vocabularios controlados, traducidos a varios idiomas, que se van actualizando de forma continua. Está pensado para facilitar el intercambio de información entre agencias de noticias y ofrece metadatos sobre autor, título, descripción, palabras clave, urgencia, derechos, etc.http://www.iptc.org/NewsCodes/ El grupo IPTC también ha desarrollado IPTC Metadata for XMP: http://www.iptc.org/IPTC4XMP/

  •  XMP o Extensible Metadata Platform. Es un estándar abierto para metadatos en publicaciones que utiliza 3 esquemas específicos para describir fotografías (XML Basic Schema, XML Rights Management Schema y XMP Media Management Schema). Además, incluye otros esquemas como DC, EXIF, etc. Se pueden incluir paquetes XMP en los formatos gráficos más conocidos como .jpeg, .gif, .tif, .psd, .eps, .png, etc. http://xmp.sourceforge.net/ y http://www.adobe.com/products/xmp/overview.html

  •  DIG35: es un estándar de metadatos creado por el Digital Imaging Group (DIG) y la Photographic and Imaging Manufacturers Association  (PIMA) y que es aplicable a imágenes digitales en distintos formatos. Puede ser leído por distintos programas y dispositivos.   http://www.i3a.org/i_dig35.html

  •  PRISM o Publishing Requeriments for Industry Standard Metadata: desarrollado por IDEAlliance se basa en el estándar para metadatos XML pero permite la agregación, sindicación, personalización y postproducción de cualquier tipo de contenido. http://www.prismstandard.org/

  •  JPX: También llamado JPEG 2000, es una extensión del formato JP2 que se prevé que poco a poco irá reemplazando al formato .jpg ya que permite definir un contenedor tanto para la imagen .jpg como para los metadatos que contenga. http://www.jpeg.org/jpeg2000/index.html

  •  PHEED: se trata de una extensión de la especificación RSS 2.0, que incluye algunos elementos específicos para la descripción de fotografías.

ejemplo de metadatos para imagen  DISC

Fuentes : I3A. DIG35 Metadata standards. http://www.i3a.org/i_dig35.html y
DISC. Resource Center/ DISC XMP Custom Panels. http://www.disc-info.org/resources/xmp.asp

Además de estándares específicos para metadatos de imágenes, existen numerosos vocabularios controlados para material gráfico, entre los que podemos destacar:

También pueden aplicarse otro tipo de vocabularios que sirven para describir cosas de forma genérica o específica. Así, se pueden aplicar vocabularios utilizados para la descripción de personas que aparecen en fotografías, tales como:

  •  FOAF: El Proyecto FOAF (The friend of a friend): http://www.foaf-project.org/ tiene como fin crear una web legible por máquina, de páginas principales para describir gente y enlazar a dichas personas con las cosas que han creado y hecho. Cuenta con la especificación: http://xmlns.com/foaf/0.1/ FOAF es una aplicación de XML y RDF. Básicamente se trata de un archivo RDF escrito en XML con el cual se describen personas, documentos, imágenes, etc.

  •  DPD: El Digital Picture Description Vocabulary sirve para describir fotos digitalizadas ya sea creadas con una cámara digital o escaneadas, pero especialmente . http://kanzaki.com/ns/dpd

He aquí un ejemplo de FOAF para describir a una persona:

<foaf:Person>
  <foaf:name>Chusa Lamarca</foaf:name>
  <foaf:mbox_sha1sum>241021fb0e6289f92815fc210f9e9137262c252e</foaf:mbox_sha1sum>
  <foaf:homepage rdf:resource="http://www.hipertexto.info" />
  <foaf:img rdf:resource="http://www.hipertexto.info/foto.jpeg" />
</foaf:Person>

La clase foaf:Image es una subclase de foaf:Document y corresponde a los documentos que contienen imágenes. Las imágenes digitales (tales como JPEG, PNG, bitmaps GIF, diagramas SVG, etc.) son ejemplos de foaf:Image.

Además, mediante la propiedad foaf:img podemos relacionar una persona foaf:Person con una imagen foad: Image que la representa.

<?xml version="1.0" standalone="yes"?>
<rdf:RDF
        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
        xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
        xmlns:foaf="http://xmlns.com/foaf/0.1/">

<foaf:Person>
    <foaf:name>Chusa Lamarca</foaf:name>
    <foaf:Image rdf:resource="foto.jpg"/>
   
    <foaf:img>
        <foaf:Person>
            <foaf:name>Chusa Lamarca</foaf:name>
            <foaf:Image rdf:resource="htttp://www.hipertexto.info/foto.jpg"/>
        </foaf:Person>
    </foaf:img>
   

</foaf:Person>

</rdf:RDF>

FOAF también se puede aplicar a la música. Véase, por ejemplo, Fofafing the Music, desarrollado dentro del proyecto europeo SIMAC (Semantic Interaction with Audio Contents) en el que participa el equipo Music Technology Group (MTG) de la Universidad Pompeu Fabra de Barcelona.

Y, de igual forma, se pueden aplicar vocabularios y ontologías para describir derechos de propiedad, objetos, partes del cuerpo desde distintas perspectivas: artísticas, geográficas, médicas, etc.

De especial importancia son las imágenes relativas a campos específicos como los mapas, en las cuales se pueden usar los estándares de metadatos geoespaciales como, por ejemplo, el estándar FDGC (Digital Geospatial Metadata) http://www.fgdc.gov/metadata/ y otros muchos.

De acuerdo con las distintas especificaciones, los metadatos se pueden insertar automáticamente dentro de las propias fotografías. A menudo las cámaras digitales permiten incluir información técnica en forma de metadatos "automáticos", al igual que muchos programas  para tratamiento de la imagen digital (PhotoShop, Photo Studio, Paint Shop Pro, etc.) permiten la inclusión de metadatos en las imágenes tratadas. De cualquier forma, siempre es posible incluir los metadatos de forma manual por medio de lenguajes de programación utilizando scripts.

También existen programas específicos para catalogar imágenes que permiten no sólo insertar metadatos en las fotografías,  sino también exportarlos a otros formatos, como RDFPicJAlbum, Galery, Kanzaki, etc.

A continuación se muestran dos ejemplos en los que se usan metadatos facetados para imágenes. En el gráfico de la derecha, podemos observar cómo las propias imágenes sirven de interfaz por medio de la cual el usuario puede navegar a través de las imágenes clasificadas por categorías, o hacer búsquedas directas por las distintas facetas y categorías jerarquizadas. Este ejemplo se enmarcan dentro del Proyecto The Flamenco Search Interface (FLexible information Access using MEtadata in Novel COmbinations) desarrollado por la Universidad de Berkeley (California): http://bailando.sims.berkeley.edu/flamenco.html

metadatos facetados para imagenes1  metadatos facetados para imagenes

Fuente: Ka-Ping Yi et. al. Faceted Metadata for Image Search and Browsing.
http://bailando.sims.berkeley.edu/papers/flamenco-chi03.pdf

El Museo Suomi de Helsinki http://museosuomi.cs.helsinki.fi/ y la International Children's Digital Library http://www.icdlbooks.org/ usan interfaces similares a las del proyecto Flamenco.

Curiosamente, bajo el nombre de Bailando (en castellano) acrónimo de "Better Access to Information using Language Analysis and New Displays and Organizations", además de Flamenco, la  universidad de Berkeley desarrolla otros proyectos como Conga, Cha-Cha, WebTango, etc. para hacer el acceso a la información más agradable, mediante el desarrollo de interfaces, minería de datos y evaluación automática de páginas web.  http://bailando.sims.berkeley.edu/

En cuanto a la imagen en movimiento, hay que destacar, principalmente 2 formatos abiertos para la transferencia de contenidos de televisión y vídeo (producción y postproducción): MXF y AAF.

MXF Material eXchange Format: http://www.pro-mpeg.org

En 1999 el comité Pro-MPEG comenzó a trabajar con el objetivo de establecer un formato universal para el intercambio de materiales audiovisuales entre servidores de archivos, plataformas de edición y otros dispositivos para la creación de contenidos. Hasta ese momento, todas estas operaciones estaban basadas en formatos propietarios, por lo que existía poca funcionalidad e interoperabilidad entre diferentes estaciones de trabajo. Además, aunque el audio y el vídeo eran preservados, la mayor parte de los metadatos se perdía o se ignoraba en la transferencia.

El nuevo formato MXF es un formato abierto que permite el intercambio de esencia (imagen y sonido) y sus metadatos asociados, entre diferentes estaciones de trabajo con diversas aplicaciones e incluso con distinta tecnología. MXF contiene la secuencia de cada cuadro de vídeo, junto con el audio, los datos y los metadatos asociados. Otro factor importante es que MXF es independiente del formato de compresión utilizado, ya que puede transportar diferentes tipos de formatos como MPEG, DV o vídeo sin compresión.

La mayor aportación de MXF es que permite guardar e intercambiar no sólo el contenido de un programa, sino también los metadatos asociados.  Por ejemplo, el código de tiempo (timecode) es una forma de metadato. Los metadatos pueden contener información sobre:

  •  La estructura de archivos
  •  El contenido en sí (MPEG, DV 525, DV 625, etc.)
  •  Palabras clave o títulos
  •  Subtítulos
  •  Números de referencia
  •  Notas de edición
  •  Ubicación, tiempo, fecha y número de versión de un clip

A veces ocurre que la información sobre los metadatos puede resultar mayor que el contenido de audio y vídeo. Por tanto, es imprescindible hacer un buen uso de los datos y metadatos para el manejo del material audiovisual.

El formato MXF prioriza la simplicidad en su utilización y el intercambio de imagen y sonido con sus metadatos asociados. Entre sus diferentes aplicaciones encontramos:

  •  Material para la edición (source material)
  •  Transferencia entre servidores sobre redes locales (LAN) o externas (WAN)
  •  Archivado de material en formatos de almacenamiento de datos
  •  Distribución de contenidos

Lo más importante para estas aplicaciones es el hecho de que MXF puede usarse tanto en procesos de transferencia de archivos en tiempo no real (non-real time), como también en aplicaciones de flujo en tiempo real (real time streaming). Otra utilidad puede ser la de servir como material de fuente en un proyecto de posproducción AAF para un programa finalizado o para clips independientes. Ambos formatos son capaces de transportar esencia y metadatos; sin embargo, la prioridad en cada formato es diferente y a la vez complementaria.

AAF (Advanced Authoring Format). http://www.aafassociation.org

En el año 2000, la asociación AAF comenzó buscar un formato de intercambio un poco más complejo que el reciente MXF. La diferencia entre este formato y MXF es que el formato AAF se usa, fundamentalmente, para proyectos multimedia y posproducción, debido a que permite almacenar una mayor riqueza de metadatos y a que posibilita utilizar referencias a materiales externos. Esto significa que un proyecto AAF puede incluir el contenido propiamente audiovisual y los metadatos asociados, pero también puede llamar a otros contenidos (MXF) alojados en un servidor de almacenamiento.

AAF incluye un conjunto muy variado de metadatos para composición, que pueden usarse para describir los componentes del entramado de una producción. Este formato es capaz de catalogar todas las funciones asociadas a una línea de tiempo (time line) de edición: el nombre de cada clip de audio y vídeo, su ubicación, el contenido de ese clip (vídeo, audio, texto, efectos), cómo está presentado en la línea de tiempo, además de los efectos y procesamientos asociados.

Al intercambiar o trasladar datos de un proyecto entre diferentes aplicaciones o estaciones de trabajo, AAF puede transferir el audio, vídeo y metadatos asociados, pero también puede incluir únicamente los metadatos de un proyecto con enlaces o referencias a material externo. Por ejemplo, un archivo AAF puede incluir una secuencia de 1 hora, junto con la información sobre cómo reducirla a 10 minutos, además de una referencia externa a un texto o a imágenes fijas, ubicadas en una plataforma diferente.

AAF es un formato más complejo, pensado para el intercambio de proyectos a través de diferentes plataformas de edición y entre distintas aplicaciones. El énfasis de AAF está puesto en el intercambio de los metadatos de composición, mientras que MXF es un formato para el intercambio simple de material audiovisual (generalmente programas terminados).

El formato AAF permite exportar toda la información de metadatos además del texto, audio y vídeo. Por ejemplo, permite metadatos para referirse al material manipulado: cortes, corrección de color y al ensamblado, ediciones previas, time code , etc.

El funcionamiento de AFF se basa en tomar el contenido de un programa y los netadatos para "envolverlos" en un formato de archivo, les agrega una dirección  y adjunta una etiqueta con una descripción básica acerca de qué hay adentro. Más tarde, otra aplicación compatible con AAF toma esa etiqueta y muestra la información acerca de qué hay adentro, permitiendo trabajar con los contenidos, modificarlos o acoplar otros archivos AAF.

Tanto el contenido de CD-ROM como de un DVD, un vídeo o un programa de radio o televisión interactivos a través de Internet, pueden alterarse mediante este formato aunque el proyecto esté ya terminado. Por lo tanto, todos los archivos contenidos en estos soportes pueden modificarse para incluir los metadatos correspondientes al material audiovisual para facilitar su descripción y posterior búsqueda y recuperación.

En la red, además, del conocidísimo YouTube para compartir vídeos, también existen otras iniciativas como, el Open Vídeo Project que contiene una gran colección de vídeos relacionados con la educación y la investigación. Se pueden hacer búsquedas directas y búsquedas por navegación o combinar ambas. La información ofrecida y la clasificación no sólo constan del autor, fecha, duración, género, etc. sino que se ofrecen varias formas de muestra, como las que se muestran a través de las viñetas del Storyboard del vídeo en cuestión para hacernos una idea de su contenido antes de decidir la descarga del vídeo.

 


Bibliografía

Adobe.Extensible Metadata Platform (XMP). http://www.adobe.com/products/xmp/overview.html

AAF. AAF Technical Information. http://www.aafassociation.org/html/techinfo/index.html

BEKKER, Henry. BELGERS, Ivana. VALKENBURG, Peter. Inventory of Metadata for Multimedia. http://www.surfnet.nl/innovatie/surfworks/doc/mmmetadata/

BRICKLEY, Dan. MILLER, Libby. FOAF Vocabulary Specification. http://xmlns.com/foaf/0.1/

CDWA Categories for the Description of Works of Art. http://www.getty.edu/research/conducting_research/standards/cdwa/

DCMI. DCMI term declarations represented in RDF schema language. http://dublincore.org/schemas/rdfs/

  ERCIM No. 62, July 2005. Special theme: Multimedia Informatics. http://www.ercim.org/publication/Ercim_News/enw62/  http://www.ercim.org/publication/Ercim_News/enw62/EN62.pdf

Exif. org. Home Page. http://www.exif.org/

FOAF. The FOAF Project. http://www.foaf-project.org/

GUTIÉRREZ RESTREPO, Emmanuelle. Recuperación, relación e inserción de metadatos en imágenes. http://www.sidar.org/ponencias/2004/egyrs/tallerws/all.htm

I3A. DIG35 Metadata Standards. http://www.i3a.org/i_dig35.html

 IPTC. IIMv4. Field mapped to Imagings Programme.  http://www.controlledvocabulary.com/pdf/IPTC_mapped_fields.pdf

IPCT. The IPCT NewsCodes. http://www.iptc.org/NewsCodes/

IPCT. Information Interchange Model IIM. http://www.iptc.org/IIM/

 J. Paul Getty Trust. Categories for the description of works of Art (CDWA): List of Categories and Definitions. http://www.getty.edu/research/conducting_research/standards/cdwa/8_printing_options/definitions.pdf

JPEG.org JPEG 2000 Our New Standard. http://www.jpeg.org/jpeg2000/index.html

LAFON, Yves and BOS, Bert (W3C). Describing and retrieving photos using RDF and HTTP http://www.w3.org/TR/photo-rdf/ (Traducción al castellano: GUTIÉRREZ RESTREPO, Emmanuelle. Describir y recuperar fotos usando RDF y HTTP.  http://www.sidar.org/recur/desdi/traduc/es/notas/foto-rdf/Desyrecfotos.htm)

LÓPEZ, Leandro Mariano. FOAF: El proyecto 'friend of a friend' (amigo de un amigo). http://f14web.com.ar/inkel/2003/01/27/foaf.html

Music Technology Group. Universitat Pompeu Fabra. http://www.iua.upf.edu/mtg/

 The Open Video Projetc. http://www.open-video.org/

PRISM. PRISM Digital Image Management Metadata Specification RFC. http://www.prismstandard.org/

Pro-mpeg.org  MXF - the Material eXchange Format. http://www.pro-mpeg.org/

VRA. VRA Core Categories. http://www.vraweb.org/vracore3.htm

W3C. RDF Vocabulary Description Language 1.0: RDF Schema. http://www.w3.org/TR/rdf-schema/

YouTube. http://youtube.com

    Arriba 
 


 

 Título: Hipertexto, el nuevo concepto de documento en la cultura de la imagen
 Autora: María Jesús Lamarca Lapuente (currículo personal)

 Contacta

 Tesis doctoral. Universidad Complutense de Madrid

 URL: http://www.hipertexto.info

 Fecha de Actualización: 08/12/2013   

 184 páginas web. 2.627 archivos. 2.208 imágenes. Tamaño: 52.406Kb.
 34.389 enlaces (10.436 externos y 23.953 internos)
  

Esta obra está licenciada bajo las siguientes condiciones: 
Creative Commons License
Creative Commons Reconocimiento-NoComercial-NoDerivados-Licencia España 2.5.

 


OTRAS PÁGINAS DE LA AUTORA
 

           Blog El Cultural a la PuertaBlog El Cultural a la Puerta:: http://puertadetoledo.blogspot.com/ 

                                                                                                                AGETECA. Base de Datos de Gestión Cultural
                                                                                                                 Ageteca. Base de Datos de Gestión Cultural:
      
                                                                                                    http://www.agetec.org/ageteca

Fundación Ricardo Lamarca, ajedrez y cultura

Fundación Ricardo Lamarca, Ajedrez y cultura http://www.fundacionlamarca.es

 

 

La artesa digital

Blog La artesa digital
http://artesadigital.blogspot.com.es

Especial Poesía: Hasta allí hemos llegado

Blog La artesa digital Flickr La artes@ digital: Galería de fotos mundo
 digital y mundo analógico: http://www.flickr.com/photos/artesadigital/

Blog miembras

Blog Miembras: usos lingüísticos, políticos y sociales del lenguajeBlog Miembras: Usos lingüísticos, políticos
 y sociales del lenguaje http://miembras.blogspot.com

 

Mapa de navegación / Tabla de contenido / Mapa conceptual / Tabla de documentos / Buscador / Bibliografía utilizada / Glosario de Términos / Índice Temático / Índice de Autores