María Jesús Lamarca Lapuente. Hipertexto: El
nuevo concepto de documento en la cultura de la imagen.
Un hipertexto puede llevar incorporado elementos sonoros que se activan
automáticamente nada más abrir la página web o que
pueden activarse a
voluntad del usuario/lector. Existen una gran variedad de formatos de audio que
pueden incluirse en un hipertexto. Además, en una página web no sólo podemos incorporar y escuchar
diferentes formatos de audio, sino que también podemos escuchar música a través de emisoras de
radio y de televisión e, incluso, a través de Internet podemos enviar mensajes
de correo con voz, hablar por teléfono vía Internet o comunicarnos con voz a través de los
chats.
Formatos de audio
Un
archivo de audio digital es un sonido o secuencia de sonidos que ha sido
convertido a un formato numérico para poder ser almacenado en un ordenador.
Podemos distinguir 3 tipos generales de formatos de audio:
Formatos de onda: guardan la información tal como ha sido captada por
un micrófono, almacenando la amplitud del sonido y su frecuencia cada cierto
período de tiempo. Este período de tiempo se conoce con el nombre de sampling rate del
archivo de audio y es usualmente medido en el número de "muestras"
que se toman de lo que escucha el micrófono cada segundo. Valores usuales son
11000 Hz, 22000 Hz y 44000Hz. Mientras mayor sea este número, mejor es la calidad
del sonido. En la red, los formatos más utilizados son los formatos de onda.
Formatos de secuencia: almacenan las notas, leyéndolas desde algún tipo de
entrada MIDI (Music Instrument Digital Interfase); se graban varias secuencias
y se colocan en determinados canales.
Se deja al ordenador y a un estándar internacional (que define, por ejemplo,
que en el canal 0 siempre va el piano), el definir la forma en que se tocará
cada canal. El ejemplo típico es precisamente, MIDI (extensión .mid).
Formatos mixtos: almacenan al comienzo un ejemplo de cómo sonará cada canal, de
manera similar a los formatos de onda de audio, y posteriormente graban una secuencia
de las notas para cada canal. El ejemplo típico de este formato es MOD, el cual
funciona en varios sistemas precisamente por su capacidad para generar una
excelente calidad de sonido y al mismo tiempo ocupar un espacio de disco muy
pequeño al hora de su almacenamiento.
Los archivos de audio poseen diferentes formatos dependiendo
de con qué herramientas o aplicaciones y con qué fines fueron creados. Al
trabajar con una determinada aplicación, el software asigna una extensión
dependiendo del tipo de archivo que se haya creado, con el fin de poder luego
identificarlo.
Los principales formatos de audio -aunque algunos permiten reproducir vídeo- son:
Audio Interchange File Format (AIFF): creado por
Apple se utiliza en los
ordenadores Mac y las aplicaciones multimedia, pero no es muy común en la Web. Extensiones
.aif(F) y .snd
Audio for Unix (AU): Creado por la compañía
Sun y es un formato muy
popular para muestras, que no está demasiado comprimido. Es uno de los más
antiguos en de Internet, sobre todo en plataformas
Unix. Extensión .au, uLaw y MuLaw
Audio-Video Interleaved (AVI): creado por
Microsoft. No es un
formato en sí mismo, sino un contenedor de audio/vídeo. Para visualizarlo se
requiere tener instalados los codecs y el reproductor de Windows. Extensión
.avi
Director (DIR): archivoscreados por
Macromedia Director. Extensiones .dir y
.dxr
MIDI: Music Instrument Digital Interfase.
Este tipo de archivos se generan mediante la utilización de sintetizadores
para PC. Los archivos MIDI representan notas y
otra información de secuencia para que pueda sintetizarse la música. Extensión .mid
MOD: este formato se originó en las
plataformas Amiga, creadas por Commodore.
Es otro tipo de formato para reproducir módulos digitales. A igual que MIDI, S3M, FAR
o MTM, todos estos formatos contienen el modelo musical y una selección de muestras,
para que la música del modelo pueda ser reproducida con el instrumento
apropiado. Extensiones .mod y .dxr
MPEG Audio: creado por MPEG o Motion Pictures Experts Groups.
Se trata de un estándar de formatos de compresión de audio que contempla 3
niveles diferentes de codificación-decodificación de la señal de audio (sólo
MPEG-1 está terminado, los otros son aplicables, pero todavía en fase de
ampliación):
MPEG-1: Codifica imágenes en movimiento y audio
asociado para medios de almacenamiento digital hasta 1,5 Mbits/s
MPEG-2: codificación genérica de imágenes en
movimiento con información de audio asociada (MPEG-3: inicialmente tenía una
aplicación a sistemas HDTV, pero ha sido incluido dentro de MPEG-2). En la
actualidad se sigue trabajando en el formato MPEG-2 para alcanzar una
espectacular comprensión de audio
MPEG-4: codifica objetos audiovisuales
A su vez, MPEG describe 3 esquemas o niveles de
codificación de audio que van de una menor a una mayor complejidad en el
codificador y la calidad del sonido. Los 3 esquemas (1, 2 y 3) son compatibles
jerárquicamente, esto significa que un decodificador esquema-3 acepta los tres
niveles de codificación, pero el esquema-2 sólo acepta el 1 y el 2). Tanto
MPEG-1 como MPEG-2 emplean estos tres esquemas, aunque este último con nuevas
características.
De todos los formatos que conforman MPEG Audio hay que
destacar el MPEG-1 Layer 3, más conocido como MP3 (tercer nivel de
compresión de MPEG-1, y no abreviatura de MPEG-3 como se cree erróneamente)y quedespunta por su gran popularidad, facilidad de manipulación,
codificación-decodificación y almacenamiento. MP3 se ha convertido en el
formato elegido para la grabación y copia de temas musicales fácilmente
accesibles en Internet.Creado por el
Instituto Fraunhofer,
su calidad es similar a la de un disco compacto, pero ocupa mucho menos
espacio ya que consigue una escala de compresión de 1:11 sin pérdida de
calidad apreciable. En un CD-R por ejemplo, se pueden grabar unos 11
CD-Audio,
lo que supone aproximadamente 150 canciones. Existen numerosas páginas web
desde las que se pueden descargar canciones en formato MP3 y también ha
proliferado el intercambio de
archivos entre particulares, bien directamente,
o través de programas y servidores que facilitan este tipo de prácticas.
Además, del ordenador, existen otro tipo de dispositivos y reproductores
portátiles que reproducen este tipo de archivos.
El primero en comercializarse
fue Diamond
Rio, pero ahora existen numerosas marcas y modelos, algunos
verdaderas joyas de ingeniería miniaturizada. Uno de los dispositivos más
conocidos es el iPod de
Apple, que
a través de la tienda onlineiTunes ofrece un
enorme catálogo para descargar música a través de la red, previo el pago
correspondiente. El intercambio de archivos MP3
entre particulares a través de las redes P2P y sin coste alguno, ha planteado una
gran controversia y ha puesto a la industria musical en pie de guerra contra
los defensores del libre intercambio de archivos musicales. Esto ha tenido su
correlato jurídico en una larga serie de demandas y procesos legales iniciados
por las grandes compañías que pretenden la ilegalización de este modo de
intercambio de archivos.
OGG Vorbis: Se trata de un formato de
compresión no propietario y por tanto, gratuito. Posee gran versatilidad para
reproducirse en prácticamente cualquier dispositivo y ocupar muy poco espacio.
Reduce el tamaño de un archivo de audio sin restarle calidad. Es similar a
MP3. Extensión .ogg
Real Audio: creado por Real
Networks es uno de los formatos más extendidos para la transmisión de formato continuado
y por eso suele emplearse para escuchar la radio y noticias. El
formato RealAudio streaming de audio suministra una
calidad de AM con más de 14.4 kbps cercano a la calidad de un CD sobre ISDN y
LAN. Extensión .ra .ram .rm Se precisa descargar un plug-ing para
que pueda reproducirse el sonido, o el programa RealPlayer.
RMF (Rich Music Format):
es un formato de
audio de alta calidad, fundamentalmente para descarga y reproducción.
Extensión: .rmf
VOC: es un formato muy poco flexible que
apareció con las tarjetas de sonido SoundBlaster creadas por Creative, muy
populares en los PCs. Extensión : voc
WAVE / RIFF (Rich Interchange File Format):el
nombre completo para este formato es "RIFF WAVE" y es un formato
desarrollado por Microsoft e
IBM. Se trata de un sonido
almacenado en forma de onda digitalizado (Waveform). En general,
se trata de archivos muy grandes, pero se puede variar la calidad del sonido
para lograr archivos más pequeños. Su
inclusión en Microsoft Windows lo ha hecho muy popular. Extensión .wav
WMF (Windows Media File): recientemente,
Microsoft utiliza el
formato Windows Media File para sus archivos de audio/vídeo reproductibles en
su Reproductor Windows Media. Utilizan la codificación MPEG-4. Extensión
.wmf,
.asf
Reproductores
Para la lectura de los distintos tipos de formatos de audio, se precisa de un reproductor o
player que reproduce el sonido de audio y que suele incluir los llamados plug-ins
o programas que
permiten la audición desde los principales navegadores de la
Web como Internet
Explorer o Netscape. En el caso de MP3, además de por el ordenador, con un
programa reproductor de MP3 podemos escuchar canciones y audio en formato MP3
en otros dispositivos independientes del ordenador, bien a través de un
dispositivo portátil exprofeso para ello, o mediante cualquier otro reproductor
que admita la lectura y reproducción de este tipo de archivos. En la actualidad,
muchos reproductores de DVD o DTV -Digital TV- incluyen esta opción que se puede
combinar con un equipo de Dolby Digital de sonido envolvente, e incluso existen
teléfonos móviles que cuentan con esta posibilidad.
Los reproductores de audio más utilizados en la
WWW (algunos también
reproducen vídeo) son:
Real Media creado por Real
Networks. El programa Real
Media está optimizado para utilizarse con Real Audio y Real Vídeo, y corresponde a los archivos con extensiones .ra, .ram, .rm, aunque también puede
reproducir gran número de formatos distintos Existe una versión
gratuita que se puede descargar de la red y que reproduce los principales
formatos de medios como Real Audio, Real Vídeo, Windows Media, QuickTime, MPEG-4
y DVD. También permite el acceso a estaciones de radio. Muchos navegadores llevan
este programa incorporado, pero también se puede descargar de forma
gratuita en la red. Existe una versión de pago que incluye más opciones.
http://www.real.com/player
Ejemplos de reproductores: Winamp,
MusicMatch, Windows
Media, Real y MusicMatch.
Al hablar de sonido digital, es muy común referirse al
término codec. Se trata de la abreviatura de COmpresor/DEcompressor.
Cada formato está codificado de una forma particular y, lo normal es que para
poder leer un archivo de audio, necesitemos tener descargados esos codecs
particulares en nuestro sistema. Muchos de ellos se pueden descargar de la red.
¿En qué consiste el sonido digital?
El sonido digital se mide por la frecuencia de muestreo, esto
es, hay que medir cuántas veces es digitalizado el sonido durante un determinado
período de tiempo. Las frecuencias de muestreo se indican en kilohercios (kHz),
que indican el número de veces que se muestrea el sonido por segundo. Por
ejemplo, la calidad de sonido CD se obtiene con 44,1 kHz, ó 44.100 muestras por
segundo. En el caso de sonido estéreo, se necesitan dos canales de 8 bits cada
uno; a 16 bits por muestra, esto da lugar a 705.600 bits de datos de un CD,
produciendo un sonido de alta calidad. Si transmitiéramos de esta forma el
sonido a través de la red, la transmisión de esta enorme cantidad de datos
ocuparía casi la mitad del ancho de banda de la red.
Como los usuarios medios de la Web no disponen de tamaño
ancho de banda, se precisa disminuir la frecuencia de muestreo para crear sonido
digital que pueda ser enviado a través de la Web. Una
frecuencia de muestreo de 8 kHz en mono, produciría unos buenos resultados para
aplicaciones sencillas como lenguaje hablado. Hay que tener en cuenta que el
hardware de reproducción consiste, por lo general, en la utilización de una
simple tarjeta de sonido y un pequeño altavoz. Un audio de baja calidad no
precisa de más de 64.000 bits de datos por segundo, pero el usuario debe esperar
a que se descargue el sonido y es casi imposible el sonido continuo.
Los CDs de audio, al igual que los sistema DAT (de datos),
utilizan la digitalización de la señal mediante PCM (Pulse Code Modulation) o
modulación por impulsos
codificados, que es una de las formas más simples de
codificar y que se se ha utilizado y se utiliza comúnmente en telefonía. Sin
embargo, gran parte de la información de audio que almacenan estos sistemas de
codificación puede desecharse, puesto que el oído humano no es capaz de percibir
ciertas frecuencias dentro de lo que se denomina una determinada banda crítica.
La digitalización añade ruido a la señal y para evitar esto, es preciso utilizar
un mayor número de bits en el muestreo y la cuantificación que son las 2 fases
de las que se compone un proceso de digitalización. Para obtener sonido de
alta calidad se utilizan frecuencias de 44,1 kHz en el caso del CD, y hasta 48
kHz en el caso de DAT. En lo relativo a la cuantificación, cuantos más bits se
utilicen más fina será la resolución.
A 44,1 kHz y utilizando 16 bits para cuantificar la señal
(sonido de alta fidelidad), uno de los dos canales de un CD produce más de 700
kbits/s. Gran parte de esa información es innecesaria y ocupa un ancho de banda
que puede liberarse a costa de aumentar el sistema decodificador y perder algo
de calidad. Esto es lo que hacen los diferentes estándares existentes de audio,
combinando en dosis diferentes el ancho de banda, el grado de complejidad del
sistema decodificador y la pérdida de calidad.
TIPOS DE DIGITALIZACIÓN
Calidad
Muestreo
Bits/muestra
Modo
Tasa de bits
Frecuencia
Teléfono
8 kHz
8
Mono
64 kbps
300-3.400 Hz
Radio AM
11,025 kHz
8
Mono
88 kbps
50-5.000 Hz
Radio FM
22,050 kHz
16
Estéreo
705,6 kbps
50-15.000 Hz
CD
44,1
kHz
16
Estéreo
1411,2 kbps
20-20.000 Hz
DAT
48
kHz
16
Estéreo
1536 kbps
20-20.000 Hz
Por ejemplo, en un disco compacto o CD el sonido de audio
utilizado usa 44,1 kHz y 16 bit, esto es, graba 44.100 muestras de 16 bit (2
bytes) cada segundo. Recordemos que un byte es un conjunto de 8 bits y que suele
representar un valor asignado a un carácter.(2 bytes por 44.100 por segundo en cada canal de estéreo).
Según estos datos, para una grabación estereofónica se precisan 2 bytes
por 44.100 por segundo para cada canal de estéreo, lo que significaría que un
solo minuto de CD ocupa 10,09 MB (10.584.000 bytes), así que una canción de 4
minutos, ocuparía alrededor de 40 MB.
Soportes de audio:
Hay que recordar que en 1982 sale al mercado el primer CD de música y ese misma año se
comercializan los reproductores, por lo que el audio digital tiene un corto
período de desarrollo, y más aún la posibilidad de escuchar música o audio a
través de la red.
Los principales soportes de audio digital son los siguientes:
CD-A: Compact Disc Audio o Disco
Compacto de Audio. Se trata de audio de muy buena calidad en soporte digital y
se basa en una grabación digital sin procesado posterior, es decir, se
almacena en el disco compacto toda la información generada en la grabación,
sin compresión. En un CD normal de 650 Mb, esto nos da unos 74 minutos de
tiempo máximo por CD, así pues, cabe toda la información que contenían los
añorados discos de vinilo o LPs de larga duración.
CD-R: Recordable Compact Disc o Disco
Compacto Grabable. Es un disco compacto virgen que no admite reescritura.
CD-RW: Rewritable Compact Disc o Disco
Compacto Regrabable. Es un disco compacto virgen que admite reescritura.
HDCD: High-Definition Compatible Digital,
proceso de codificación de audio desarrollado por la compañía Pacific
Microsonics para la mejora de los CDs de audio estándar. Su implantación
se ha visto truncada por la introducción de los nuevos formatos de audio como
el SACD y el DVD Audio.
SACD: Super Audio Compact Disc. Es un
formato de audio de alta definición en soporte CD que ha sido promovido por
Sony y Philips que usa el sistema SDS o Direct Stream Digital para
generar la señal digital. En el CD se puede almacenar la información estéreo
tradicional, pero hay espacio para incorporar información de canales
adicionales. (http://www.superaudio-cd.com)
DVD Audio: Se trata de un formato de audio de
alta definición en soporte DVD que trabaja con una resolución de 24 bits y una
frecuencia de muestreo de 192 kHz, muy por encima de los 16 bits/44 kHz del CD
Audio.
VCD: Video Compact Disc. Es un formato
de vídeo en soporte CD con prestaciones y de calidad muy inferiores a los del
DVD, pero de extensa implantación.
Algunos enlaces para oír y descargar archivos de audio:
Las posibilidades multimedia de
la World Wide Web eran inimaginables hace apenas unos años. He aquí algunos
ejemplos de utilización de audio en la Web que muestran las posibilidades que
ofrece este medio:
Dinosaursounds:
http://www.dinosaursounds.com/ Reproducción de las voces del pasado de esta
especie hoy extinguida. Whalesounds:
http://www.whalesounds.com
Reproducción de distintos sonidos de las ballenas. Infinite
Wheel: Dub City Rockers.
http://www.infinitewheel.com Una web que permite jugar de forma interactiva con la
música y el diseño Speech Accent Archive:
http://classweb.gmu.edu/accent
En esta web se muestra cómo pronuncian las mismas palabras en inglés, en lugares
muy diferentes del planeta. 300 ejemplos de lectura y análisis de un mismo texto
por nativos de diferentes lugares. Los ejemplos del español son muy curiosos. Universitat
de València. "Ejemplos de sonido". En Guía para escribir documentos HTML. http://sestud.uv.es/manual.esp/sonido2.htm) Escoitar.orghttp://www.escoitar.org
Sitúa sonidos en el mapa de Google Maps y se enmarca dentro de los proyectos de
la llamada Web 2.0. Se
trata de un proyecto de dinamización social abierto y libre cuyo objetivo
principal es la difusión y promoción del fenómeno sonoro y su exploración con
fines sociales y documentales. Arte sonoro.
http://artesonoro.org Se
trata de un portal para la difusión del arte sonoro: artistas, eventos, medios,
net-audio,etc. Triunfa en Internet. Programa 35 Podcast.
http://www.triunfaeninternet.com/media/TriunfaEnInternet-Programa35-Google.mp3
Bastan estos ejemplos para hacerse una idea somera de
que, gracias a la
integración del audio en el hipertexto, el nuevo documento hipermedia permite nuevas funcionalidades enfocadas no sólo al diseño del propio
documento, sino también aplicadas al ocio, la docencia, la investigación, la
información, la comunicación, etc.
La transmisión de audio sobre las redes de telecomunicaciones
está llegando al punto de convertirse en un sistema habitual de comunicación
debido al crecimiento masivo que ha supuesto Internet en estos últimos años. Los
usuarios utilizan Internet para comunicarse mediante la voz,
para descargar música, oír
sus discos preferidos, escuchar la radio y compartir canciones con otros usuarios mediante las
redes P2P; y los autores también usan la red para difundir sus obras, al igual
que las grandes compañías empiezan a ampliar el negocio distribuyendo música
online bajo demanda y previo pago. Sin embargo, el audio también tiene otras
aplicaciones que tienen que ver con el nacimiento de los nuevos tipos de
documento hipertexto/hipermedia. En estos casos, el audio se utiliza para dar
ambiente a nuestras páginas o simplemente para mostrar piezas musicales, para
añadir explicaciones de viva voz, para la lectura y entonación de textos, para
poder escuchar en directo o en diferido conferencias y clases magistrales,
programas de radio mediante podcast, etc. y así poder convertir nuestros antaño documentos textuales en
verdaderos documentos multimediales. Las aplicaciones del audio para la
docencia, para dar clases remotas en la enseñanza de idiomas o de música, para
comunicarse mediante la música o la voz, son hoy algo corriente en la
Web.
Por último, hemos de destacar también el desarrollo y auge de los
lenguajes XML de voz que permiten nuevas y arriesgadas
funcionalidades como
Voice Extensible Markup Language
(VoiceXML), Speech Recognition Grammar
Specification (SRGS) o Gramática de Reconocimiento de habla,
Voice Browser Control Call (CCXML) o
Control de Llamadas para Navegadores de Voz y el lenguaje
Speech Synthesis Markup Language (SSML)
o Lenguaje de Marcado de Síntesis del Habla;y también hay que destacar otros lenguajes XML que
integran audio junto a otros media, como el SMIL (Synchronized Multimedia Integration
Language) o Lenguaje de Integración y Sincronización de archivos
multimedia. El empleo de todas estas posibilidades de la utilización de voz y
sonido sobre la Web es imparable. Por ejemplo, se puede
interactuar con el
navegador mediante el habla, esto es,
que la interfaz sea auditiva y no sólo gráfica. Esto
favorecería muchos problemas de accesibilidad por
parte de ciertos colectivos como los invidentes u otras personas con problemas
de movilidad que no puedan utilizar el ratón.
Otras aplicaciones son la posibilidad de crear diálogos de audio, mejorar la calidad del
contenido sintetizado, manipular y controlar las presentaciones
multimedia, etc. Por otro lado, también es imparable el desarrollo y puesta en práctica de
nuevos modelos para el tratamiento de la información multimedia con el fin de
encontrar métodos potentes y efectivos de recuperación, búsqueda y acceso a todo
tipo de información multimedia que, integra, por
supuesto todos los formatos y tipos de audio existentes a lo largo y ancho de la
World Wide Web.
Ejemplo de
audio con controles para la reproducción
GIL URDICIAN, Blanca. PÉREZ AGÜERA, José Ramón. SÁNCHEZ JIMÉNEZ, Rodrigo.
SMIL, una solución XML para el tratamiento de la documentación multimedia.http://cicic.unizar.es/Ibersid2003/
HUIDOBRO, José Manuel. "Las ventajas de MPEG". Comunicaciones World,
nº 179, junio 2003.