Sonido en HTML II, características del sonido digital

Conceptos básicos del sonido digital.
Vamos a estudiar algunos de los conceptos básicos del sonido digital, aunque sin entrar en demasiadas consideraciones técnicas. Para aquellos que deseen más información, existen multitud de sitios web que estudian específicamente el sonido digital y el hardware necesario para su captura y reproducción.

El sonido tiene una naturaleza ondulante, es decir, se propaga en forma de ondas analógicas desde el objeto que lo produce. Las características propias de cualquier sonido (desde el producido por un automóvil hasta una bella canción), sus diferentes tonos y notas dependen precisamente de las propiedades físicas de las ondas que lo forman.

Para poder viajar desde el emisor al receptor, las ondas de sonido precisan de un medio físico de soporte, ya sea el aire de la atmósfera, al agua, etc. Tanto es así que en el espacio exterior, donde no hay medio físico soporte, no se pueden transmitir sonidos.

Si representamos en un gráfico un sonido complejo, obtendremos la siguiente figura:

En la que podemos apreciar los diferentes valores de onda que va tomando el sonido.

Todos sabemos que los equipos informáticos no trabajan con datos analógicos, sino que lo hacen con datos digitales, formados por estados binarios. Por lo tanto, para representar un sonido, desde el punto de vista informático, es preciso capturarlo en una naturaleza binaria, para lo que se hace un muestreo del mismo, tomando determinados valores de las ondas y representando dichos valores en formato digital. En cada captura obtendremos un punto de la gráfica anterior.

Pero, ¿Cuántas muestras deberemos tomar?. Este es el verdadero meollo de la cuestión, ya que cuantas más muestras tomemos, más fiel será el sonido capturado respecto al original, con lo que tendrá más calidad.

Para medir el número de capturas utilizamos la frecuencia del muestreo. Como un Herzio es un ciclo por segundo, la frecuencia de una captura en Herzios representa el número de capturas que realizamos en un segundo. Así, una frecuencia de muestreo de 20 KHz (20 Kilo Herzios = 20000 Herzios) realizará 20000 capturas de puntos cada segundo.

El oído humano es captar de captar la asombrosa cantidad de 44000 sonidos por segundo, es decir, 44 KHz. Por lo tanto, para que un sonido digital tenga suficiente calidad deberá estar basado en una frecuencia similar a ésta. En general, el valor estándar de captura de sonidos de calidad es de 44,1 Khz (calidad CD), aunque hay capturadoras de sonido profesionales que llegan hasta los 100 Khz, con objeto de obtener un mayor número de puntos sobre la muestra, consiguiendo una calidad máxima.

Otro concepto del que habréis oído hablar en torno al sonido digital es el número de bits de una tarjeta de sonido. El origen de esta magnitud es que, a la hora de capturar el sonido, no sólo es importante el número de muestreos tomados, sino también la cantidad de información capturada en cada uno de esos muestreos.

Una vez capturado el sonido, para su posterior reproducción en un equipo informático es necesario mandar una serie de impulsos o posiciones a los altavoces para que creen el sonido a partir de ellos. ¿Cómo?. Bien, produciendo a partir de esas posiciones movimientos de las membranas de los altavoces, movimientos que transforman de nuevo el sonido digital en analógico, estado en el que es capaz de viajar por el aire y producir los estímulos necesarios en nuestros tímpanos, con lo que somos capaces de percibir el sonido “original”. Cuantas más posiciones de información se envíen a los altavoces, mejor calidad tendrá el sonido reproducido.

Con estas bases, se define el número de bits de un sonido digital como el número de impulsos de información (posiciones) que se envían a los altavoces para su transformación en ondas analógicas.

Las tarjetas de sonido actuales trabajan normalmente con 8 bits de información, con los que se pueden obtener 28=256 posiciones (ceros y unos binarios), aunque hay algunas de mayor calidad que son capaces de trabajar con capturas de 16 bits, que originan 216 = 65536 posiciones de información.

Como dato de referencia, los CDs actuales están basados en sonido grabado a 44 Khz y con un tamaño de muestra de 16 bits. Estas medidas se conocen con el nombre de sonido de calidad CD.

Por último, una vez que el sonido digital llega a nuestros oídos, impactan contra los tímpanos, verdaderas membranas especializadas que vuelven a transformar las ondas analógicas en impulsos eléctricos, que viajan hasta nuestro cerebro, donde son interpretados y producen las sensaciones auditivas que todos conocemos.

Una excepción al sonido anteriormente descrito, que podemos denominar "de datos de sonido", es el sonido sintetizado, en el que no se realiza ninguna captura de ondas sonoras reales, sino que es sonido totalmente digital, generado directamente en el equipo informático por en reproductor digital conocido con el nombre de MIDI (Music Instrument Digital Interface). Cuando se desea reproducir una nota musical concreta, se envía un comando MIDI al chip sintetizador, que se encarga de traducir ese comando en una vibración especial que produce la nota. Mediante este sistema es posible crear melodías bastante aceptables, aunque nunca tendrán la calidad ni riqueza de una onda sonora natural capturada.

Autor

Luciano Moreno

Consultor, diseñador y desarrollador web en ParaRedeBJS. Especialista en usabillidad y diseño centrado en el usuario.

Compartir

Comentarios

Samuel

03/10/2003
Hay un error importante acerca de la descripción del sonido. Aquí se ha confundido frecuencia de muestreo de un sonido con frecuencia de un sonido.

Como bien se dice, la frecuencia de muestreo medida en Hertz (Hz) es la cantidad de muestras de un sonido que se toman por segundo, el número de veces que se mide la amplitud de la onda con que se está trabajando en un segundo. Así, si trabajamos con calidad de CD y estamos grabando un sonido, nuestro ordenador tomará 44100 medidas por cada segundo grabado, ya que la frecuencia de muestreo es de 44100 Hz o 44,1 KHz.

De manera distinta, la frecuencia de un sonido (que es la que los seres vivos percibimos) medida en Hertz (Hz) es el número de veces que un determinado sonido oscila en cada segundo. Por ejemplo la nota que por convenio se establece como LA natural, tiene una frecuencia 440 Hz, es decir, por ejemplo, que al reproducir esta nota, la membrana de nuestro altavoz realizará 440 oscilaciones completas en cada segundo.

¿En qué se relacionan estas dos frecuencias? La respuesta está en que la frecuencia de muestreo limita la frecuencia máxima que puede almacenar un fichero de sonido digital. Así sucede que un archivo con una cierta frecuencia de muestreo, podrá almacenar como máximo un sonido de frecuencia la MITAD que esa frecuencia de muestreo. Por ejemplo, un archivo con calidad de cd, 44100 Hz de frecuencia de muestreo puede almacenar como máximo sonidos con una frecuencia de 22050 Hz (44100/2=22050).

Y hay otro par de errores en el manual. Uno es que la máxima frecuencia audible por el ser humano es aproximadamente de 20000 Hz, es decir, sonidos que vibran 20000 veces por segundo. El otro es que el oído humano y creo que el de todos los seres vivos, no es "digital", no oimos un número de sonidos por segundo, sino frecuencias (oscilaciones por segundo), en el rango 20Hz-20000Hz aproximadamente para el caso de los humanos.

En cuanto a los "bits" de un archivo de sonido, decir que está relacionado con el número de "niveles" de volumen entre el silencio y el volúmen máximo. Si tenemos calidad de cd, que son 16 bits, pues se toman 65535 niveles de volumen posible para cada punto del muestreo. Por supuesto, a mayor número de bits, mayor número de niveles de volumen posible, con lo que el sonido será más fiel al original.

Espero que esta aclaración sirva de algo, y corregidme si he metido la pata en algo. Un saludo y enhorabuena por esta web tan estupenda.

14/7/2004
Cuanda hablan de los bits de informacion que maneja las placas de sonido, no me quedo demaciado claro y se me hizo una ensalada, supongo que a alguien más le puede suceder lo mismo así que voy a tratar de explicarlo un poco mejor.

Lo Bits son los pasos que se pueden obtener.
Supongamos que tengo una regla en centimetros (sin los milimetros), el paso de la regla es 1 cm (va de 1 en 1).

Si yo tengo el valor 4.7 cm , mi regla medira 5 ya que es el más cercano, esto mismo es lo que sucede con los Bits.

En el caso de los bits estos pasos van incrementando de la sig. manera: 2^0 (2 elevado a la 0), 2^1,2^2,...,2^7(1 menos que los bits).Si sumamos todos estos resultado nos da 255=2^8-1(menos uno porque va desde 0 hasta 255, osea 256 elemntos).

En matematica se define como combimnaciones con repeticiones, esto quiere decir que se combinan todos los elementos en culalquier orden y posicion.

Supongamos que tenemos 8 llaves las cuales tienen 2 estados, prendido y apagado (en los bits se traduce a 0(apagado) y 1 (encendido), esto seria el sist. de numeracion binario, o base 2 (elemntos), lo que en nuestro sistema cotidiano seria el sist.de numeracion decimal o base 10(elemtos), aca sucede lo mismo que antes el maximo valor es 10-1=9 van del 0 al 9), y probaramos todas las combinaciones nos daria 2^8=256 con valores que van desde 0(todas apagadas) a 255(todas prendidas). Muchas veces he visto que no tienen en claro todo esto y piensan que por ejemplo 16 bits es el doble de 8 Bits, ya que si hacemos unos simples calculos veremos que no es así; 2^8 = 256 y 2^16 = 65536, como se puede notar la difercia es muchisima más quel el doble.

Vale para todos lo que sea digital, no solo para el audio, ya que la bse es la misma (2 elemntos 0 y 1)

Espero que les haya servido mi explicacion. Si ven algun error reportenlo.

ESPI

27/10/2006
ESTIMADO COMPANERO LOS ALTAVOCES NO SON TRANSDUCTORES DE DIGITAL A ANALOGICO, SON TRANSDUCTORES ELECTRO/MECANICOS/ACUSTICO, OSEA EL CONTRARIO QUE EL MICRO, SI HACES LA PRUEBA DE CONECTAR UNA SENAL DIGITAL A UN ALTAVOZ LA INFORMACION QUE ESTE SACA NO ES NADA AGRADABLE, LOS 44.100 MUESTRA X SEGUNDO SON DEBIDAS A UN TAL NYQUIST, QUE VIENE A DECIR QUE PARA DIGITALIZAR UNA SENAL ES NECESARIO USAR UNA FRECUENCIA DE MUESTREO POR LO MENOS 2 VECES MAYOR QUE LA F MAS ALTA A MUESTREAR, Y POR ULTIMO DECIRTE QUE CUANTO LA PALABRA DIGITAL SEA ESCRITA CON MAS BITS, MAS NUMEROS PREDETERMINADOS DE CANTIDAD DE SENAL HABRA Y POR LO TANTO MAS FIEL SERA LA INFORMACION DIGITAL CON RESPECTO DE LA ANALOGICA, O DICHO DE OTRA FORMA SI LA PALABRA TIENE 8 BITS ESTO NOS DA 2 ELEVADO A 8 IGUAL 256 NIVELES DIFERENTES DE INFORMACION , SI ESTA ESTA ESCRITA CON DIEZ BITS, 2 ELEVADO A 10 IGUAL A 1024 NIVELES DIFERENTES.SIENTO NO TENER E/MAIL PERO LO NDICHO EN ESTE COMENTARIO ES TAN CIERTO COMO QUE SOY OPERADOR DE SONIDO DESDE HACE 12 ANOS

LINA

19/3/2009
TRIPLEHIJUEMALPARICULILAMBIDO

Mindii Ztrellitha Ermoza

07/10/2010
Marikaz Esse Hp k scribio eSTO
Porke Zon Than Marikaz
PorkenO Maduran Imbezilez
Lez Ezthoi Pidiendo Caracterizthikaz
De El Zondo & Miren Lo
k Me Mandan Mkonez

anselher

23/11/2010
Aun no encuentro solucion
Hola, he buscado por tooooda la web y aun no encuentro cun codigo html o algo que me sirva para introducirla dentro de mi pagina para bajarle o subirle el volumen a toooodo el contenido general en ella!! estoy diseñando una pagina donde tengo mucha informacion multimedia, videos flash, windowsmedia, y de todo tipo de player de video que sea compatible en la web, pero quiero instalarle un MASTER CONTROL de volumen para poder controlar el contenido global de la pagina y asi no tener que jugar con el volumen de cada player por separado... me explique bien?? pueden ayudarme?? he visto en muchos foros que lo unico q mencionan es para controlar el volumen solo de archivos especificos, mas no, de la pagina completa como tal.... SE PUEDE HACER ESTO? gracias..!

apfeJRcxB

19/8/2011
aLvOvXrHHlZ
This is the perefct way to break down this information.