Electroacústica

Percepción Sonora

Localización Espacial

Acústica de Salas

 

 

Asier Iza Gallastegui

Curso 2002-2003

 

Índice:

 

INTRODUCCIÓN

PERCEPCIÓN SONORA Y LOCALIZACIÓN ESPACIAL

-         La localización  espacial

-         Un poco de historia

-         Los estudios fundamentales

-         El nivel nervioso

-         Conclusión

ACÚSTICA DE SALAS

-         Introducción

-         La propagación del sonido en un local

-         Espacio acústico subjetivo

-         La escucha musical en una sala mediana

ANEXO: ¿DEBERÍAMOS QUEMAR A FOURIER?

-         Introducción

-         La audición: ¿Es el oído lineal?

-         ¿Cómo oímos?

-         El uso que se hace del análisis de Fourier

-         Conclusión

BIBLIOGRAFÍA

 

 

 

 

Introducción:

 

         En este trabajo he pretendido profundizar en los tres temas arriba mencionados, tratando de no repetir lo ya expuesto en años anteriores en trabajos relacionados con estos temas. Es un trabajo muy descriptivo y he procurado dejar a un lado las fórmulas matemáticas que tanto nos lian y aburren a veces (bastante tenemos con las de clase, ¿no?). Espero que una detenida y atenta lectura del presente trabajo aporte conocimientos útiles a quien lo lea y conozca así un poco mejor esta parte tan interesante y fundamental de la electroacústica. Además al final hay un extenso y muy interesante anexo acerca del uso de las teorías de Fourier que nos invita a la reflexión y que resultará del agrado (espero) de todos los (futuros) ingenieros que hayamos estudiado sus teorías. Que lo disfrutes.

 

NOTA: Muchas características relacionadas con la percepción sonora están tratadas en el anexo.

 

 

 

 

Percepción sonora y localización espacial

 

La localización espacial:

 

         La localización espacial es una cualidad esencial en nuestro aparato auditivo y que se deriva directamente de nuestro sistema de audición binauricular.

 

         El canal acústico de comunicación permite transmitir, con una gran eficacia, informaciones concernientes a un cierto emisor y que interesan a un (o varios) repector(es) del mensaje. La información transmitida a través de los sonidos suministra múltiples informaciones procedentes de la fuente sonora. De ahí que el tratamiento adecuado de las señales permita la interpretación del mensaje al mismo tiempo que la restitución total o parcial de las características físicas del emisor. Por ejemplo: si el Sr. Hiraga se acerca a mí para desearme “un buen día”, yo recibo su mensaje de cortesía, pero esta señal acústica me permite igualmente deducir informaciones relacionadas con el estado de salud y psicológico de mi interlocutor, y naturalmente confirmarme que es de origen japonés. Pero, sumergiéndome aún más profundamente en nuestro universo sonoro, constato que también es fácil saber si mi interlocutor está situado a mi derecha, a mi izquierda, delante de mí o detrás de mí. Es decir, que la señal acústica me muestra la posición espacial de la fuente, y además independientemente del contenido intrínseco del mensaje transmitido.

 

         En la audición musical, la localización de la fuente sonora juega un papel de gran importancia en el proceso de integración perceptiva del mensaje acústico y en la evaluación subjetiva de su resultado global. Es, es consecuencia, necesario, cuando se produce la difusión electroacústica de la música, reproducir las condiciones de distribución espacial de los instrumentos y las voces si realmente se desea recrear las condiciones de escucha que caracterizan la sala de conciertos.

 

Nos gustaría descubrir el puente, aún misterioso, que la naturaleza ha tendido entre los estímulos físicos y la constitución de una imagen perceptiva. Es evidente que la naturaleza ha contruido con suma elegancia nuestro sistema de audición binauricular, que nos permite perfeccionar sensiblemente las prestaciones en la recepción y el tratamiento  de los sonidos con respecto a la vía monoauricular. De nuestra constitución binaural se derivan dos propiedades fundamentales:

-         El sentido de la localización.

-         La mejora del poder de discriminación de las señales en presencia de un ruido de fondo considerable.

 

Esta ventaja que confiere la posesión  de un doble sistema de recepción representa una necesidad vital en ciertos animales en los que la localización precisa de los elementos que forman parte de su entorno se lleva a cabo gracias a las señales acústicas. La optimización de las capacidades de localización auditiva aparece en los animales que poseen sistemas de emisión de sonidos especiales y también sistemas de recepción altamente especializados, lo que les permite realizar operaciones tales como el tratamiento de los ecos derivados de la señales debidas a la presencia de un elemento más o menos reflectante en su camino acústico (principio de funcionamiento del sonar).

 

Un poco de historia

 

         El primer investigador motivado por los problemas relacionados con la localización acústica fue Giovanni Batista Venturi (1746-1822). Sus experiencias consistían en colocar a un individuo con los ojos cerrados en medio de un terreno despejado y hacerle oír el sonido de una campana o de una flauta mientras el experimentador se desplazaba en un radio de 50 metros alrededor del sujeto inmóvil. De este modo, Venturi descubrió que el sujeto mencionado era capaz de localizar fácilmente la fuente de sonido cuando la misma estaba colocada perpendicularmente al eje de su propia cabeza. Por otro lado, al estar obligado a mantener la cabeza inmóvil, nuestro hombre diferenciaba con dificultades la procedencia del sonido cuando el mismo era emitido delante o detrás de él (ángulos de 0º y 180º respectivamente con respecto al eje). Sin embargo, desde el momento en que el sonido llegaba diagonalmente hacia delante o hacia detrás, la determinación de la dirección izquierda o derecha era inmediata. Sin embargo, se constataban confusiones cuando se trataba de determinar la posición frontal o dorsal. Estos problemas desaparecían cuando se permitía al sujeto mover libremente la cabeza. Venturi llegó a la conclusión de que la diferencia de intensidad relativa de los sonidos que llegaban a los dos oídos era suficiente para explicar el fenómeno de la localización espacial. Sin embargo, esta afirmación se reveló inexacta a tenor de las nuevas experiencias realizadas en Europa.

 

         Fue Lord Rayleigh quien puso en evidencia por primera vez la importancia de la combinación del retardo en el tiempo de llegada de una determinada señal acústica a los dos oídos con las características direccionales de cada oído individual. Durante la Primera Guerra Mundial, los laboratorios de investigación de Francia y Alemania se interesaron en la capacidad del oído humano para percibir dichas diferencias temporales, en particular las más pequeñas. Los resultados experimentales mostraron que intervalos del orden de 0,0001 segundos (100ms) corresponden a las prestaciones prácticas del fenómeno de la localización. Evidentemente, estos intervalos son demasiado cortos para ser percibidos como estímulos separados por nuestro sistema de audición binaural.

 

         Dada la insuficiencia de las interpretaciones estríctamente físicas, las grandes líneas de investigación muestran una tendencia hacia el estudio detallado del sistema nervioso vinculado al problema de la localización auditiva. Es decir, nos encontramos frente a un proceso complejo que debe ser analizado con un criterio muy amplio y cuyas partes constitutivas más pequeñas forman una red indisociable que exige un esfuerzo de interpretación global.

 

Los estudios fundamentales

 

         En el enfoque clásico del problema se admiten dos formas principales de estudio de la audición binaural:

-         Utilización de estímulos naturales que lleguen a los oídos en concordancia de fase o con diferencias de fase y de intensidad que varíen según su posición espacial.

-         Utilización de estimulaciones con diferencia de fase e intensidad.

 

Hay que tener en cuenta que para frecuencias inferiores a 1000Hz las diferencias de fase desempeñan un papel de primer orden explicado por el hecho de que en esa banda de frecuencias los impulsos nerviosos reproducen la frecuencia sonora. Por tanto, los sonidos de alta frecuencia son incapaces de proporcionar informaciones válidas en términos de orientación acústica a través únicamente de la fase.

 

Por su parte, las relaciones de intensidad tienen una gran importancia para las frecuencias más altas mientras que carecen de interés para la localización de fuentes que emiten frecuencias bajas.

 

Los investigadores Seyers y Cherry expresaron en los puntos que siguen las diferencias físicas verificadas a nivel de los tímpanos durante la escucha binaural:

-         Diferencia de tiempo interaural.

-         Diferencia de amplitud relativa interaural.

-         Diferencia espacial interaural, que a su vez deriva de los siguientes fenómenos: difracción de la cabeza, propiedades reflectantes del ambiente y diferencia entre los ángulos de incidencia de los frentes de onda que llegan a los oídos.

 

A estos factores físicos, los autores citados añaden las capacidades de movilidad de la cabeza que contribuyen al trabajo de localización y también a la ayuda aportada por el aprendizaje de las manifestaciones acústicas de las situaciones caracterizadas por la integración de las propiedades del entorno. Es de esta manera que sabemos distinguir (con los ojos cerrados) una situación determinada por el ambiente de una habitación cerrada de otra caracterizada por una puerta abierta. La diferencia entre “interior” y “exterior” es también almacenada en nuestra memoria acústica y la percepción del espacio, en este sentido completo, aparece cuando ciertas condiciones nuevas desencadenan el proceso de reconocimiento.

 

El nivel nervioso

 

Antes de nada hay que aclarar que las experiencias relacionadas con esta vía de investigación están basadas en modelos animales. Algunos investigadores han simulado los dos oídos del sujeto con auriculares especialmente concebidos y electrodos colocados en diferentes niveles de las vías auditivas que se encargan de recoger las señales, que a su vez son rápidamente grabadas y analizadas.

 

Los experimentadores concluyen que cada oído es representado de una manera más importante en la región del cerebro que les es opuesta. Durante las experiencias en el transcurso de las cuales de ha hecho variar el intervalo de tiempo entre estímulos izquierdo y derecho, se ha constatado que para intervalos de algunos milisegundos la respuesta correspondiente a la primera señal tiene un efecto inhibidor con respecto a la segunda. Reduciendo el intervalo, las respuestas son fusionadas pero su amplitud refleja el primer estímulo. En definitiva, el caso es que estímulos en el orden derecha-izquierda producen una respuesta más importante en la región izquierda y viceversa.

 

El resultado es análogo si la investigación se concentra en las diferencias de amplitud. Es así que la información en el nivel nervioso refleja en cierta manera los parámetros que caracterizan los estímulos: intervalo, orden en el tiempo e intensidad relativa.

 

Los estudios anatómico-funcionales de las vías auditivas muestran un crecimiento de las interconexiones nerviosas hacia las zonas superiores del sistema. Este hecho sugiere que son necesarios centros superiores en el proceso de localización espacial. Al respecto hay experiencias que ponen en evidencia la importancia del córtex cerebral. Así, las ablaciones bilaterales de las zonas de proyección cortical están en el origen de las pérdidas de las capacidades de localización auditiva, todo ello señalando que varios autores no desprecian el papel desempeñado por las etapas nerviosas inferiores en la tarea de determinación de la posición de una fuente sonora.

 

En cualquier caso, las señales que, procediendo de un oído, suben hacia las zonas superiores tienen una probabilidad creciente de encontrar impulsos nerviosos procedentes del otro. La posición de la fuente con respecto al sujeto determina en ese caso una divergencia en el funcionamiento de los grupos celulares que intervienen en el fenómeno sensorial provocada por la convergencia de las señales. El informe de actividad es así interpretado por el cerebro bajo la forma de coordenadas espaciales de la fuente.

 

Otra conclusión sumamente importante de lo que acabamos de decir es que si a a las conclusiones de orden psicológico añadimos el juicio global de nuestras aptitudes acústicas deducidas de la observación minuciosa del comportamiento acústico humano, podemos por fin comprender que el funcionamiento del oído no se corresponde con el de una cadena de aparatos de medida tal y como la concebimos en el presente estadio del desarrollo tecnológico. Es decir, que un sonómetro, un analizador de frecuencias en tiempo real o un distorsímetro son incapaces de interpretar la respuesta del sistema auditivo por cuanto existe una incompatibilidad funcional entre el aparato biológico y el instrumento físico. Por tanto es preciso distinguir las medidas y las prestaciones físicas de los instrumentos de sus verdaderan propiedades de adaptación a la escucha humana. Las informaciones aportadas por las pruebas técnicas sirven para evaluar la concepción de un aparato y su respeto a ciertos principios físicos. ¿Pero son estos mismos principios los que dirigen el mecanismo biológico? Cualquier ingeniero o biólogo responderá negativamente.

 

Conclusión

 

         El proceso de la percepción auditiva es extremadamente elaborado. La percepción global se efectúa a nivel cerebral mediante la integración de los diferentes datos recogidos por nuestro sistema binaural y de ahí se deriva la percepción del espacio o localización espacial.

 

 

        

Acústica de salas

 

Introducción

 

         Uno de los descubrimientos fundamentales de la acústica es que al estar formado el sonido por ondas vibratorias, se le pueden aplicar las leyes de la óptica geométrica. De ahí que una onda que llegue a una superficie sufrirá una reflexión y una absorción que dependerán de la frecuencia y la materia de la que esté constituida dicha superficie. El bien conocido fenómeno del eco ilustra perfectamente esta noción; así, la reflexión de una onda vendrá acompañada por la creación de una imagen sonora virtual del mismo modo en que en el interior de un espejo se obtiene una imagen óptica.

 

La propagación del sonido en un local

 

         Desde el punto de vista perceptivo, el oído recibirá sucesivamante la onda directa seguida de una onda reflejada que parecerá proceder de la fuente virtual. De todos modos, a nivel cerebral la integración de estos datos permitirá diferenciar la onda directa de la debida a la reflaxión del local siempre y cuando el retardo temporal existente entre ambas supere los 10 milisegundos. Sin embargo, si esta duración está entre unos 2 y 10 milisegundos, la diferenciación no podrá llevarse a cabo y la imagen percibida será borrosa y por tanto estará poco definida. Un pequeño cálculo permite comprender fácilmente lo que sucede: un retardo temporal de 10 milisegundos corresponderá, teniendo en cuenta que la velocidad de propagación del sonido es de unos 340m/s, a un retardo de unos 34cm entre las dos fuentes, es decir, un desfase de 360º a 1000Hz, ya que es el equivalente de la longitud de onda a esta frecuencia. Además, cuando la onda directa y la reflejada están separadas por un retardo tan pequeño se reúnen todas las condiciones necesarias para que se produzca un fenómeno de interferencia con todas las perturbaciones en amplitud que ello implica.

 

         Si ahora la fuente es colocada cerca de la intersección de dos paredes adyacentes, se producirán dos imágenes virtuales, del mismo modo que si la fuente está cerca de la proximidad de una esquina formada por la intersección de tres paredes el número de fuentes virtuales pasará a ser tres, aumentando por tanto la confusión hasta el punto de que la imagen sonora carezca de toda coherencia. El número de fuentes podrá pasar a cuatro si se consideran las reflexiones con techo, suelo y los dos pares de paredes adyacentes.

 

         Evidentemente, lo anterior corresponde a casos extremos ya que la intensidad de las ondas reflejadas es inferior a la de la onda directa al tenerse que considerar la absorción de las paredes; no obstante, aunque la localización se efectuará igualmente, la imagen obtenida no será perfectamente neta sino que vendrá rodeada por una cierta “aureola” de borrosidad. Además, sería utópico imaginar una reproducción doméstica sin ningún tipo de reflexión ya que la presencia de reflexiones es una condición indispensable para recrear un espacio sonoro que sea creíble en términos de anchura y profundidad. Son las fuentes virtuales las que crean la ilusión necesaria puesto que las ondas que parecen proceder de las mismas llegan con un retardo temporal suficiente para no crear dudas en el momento de discriminar entre onda directa y reflejada. En este caso las fuentes ficticias tendrán un papel positivo.

 

         Además, no hay que olvidar que, al efectuarse la reproducción del sonido en estéreo, la interacción de los campos generados por las dos cajas acústicas utilizadas debe recrear una imagen coherente, a lo que contribuye sustancialmente la creación de fuentes virtuales.

 

         El problema planteado por la reproducción sonora es, en el caso de una transducción estereofónica, crear a partir de dos únicas fuentes un determinado espacio musical tanto en anchura como en profundidad. Así, los datos correspondientes a una toma de sonido bien realizada pueden ser captados en función de la amplitud y la fase de las señales procedentes de los micrófonos, un problema igualmente muy delicado que merecería ser ampliamente desarrolado por sí solo. En consecuencia, se puede suponer que estos datos podrán ser recreados, previa memorización en una cinta magnética o un disco, en un determidado local, al que a su vez habrá que exigir que no introduzca demasiadas perturbaciones para no desnaturalizar por completo el mensaje en lo que a campo sonoro reflejado se refiere. De todos modos, el trabajo principal recae en las cajas acústicas, que son las encargadas de retranscribir las mencionadas sutilezas de amplitud y fase para recrear la imagen sonora. Interesa pues, que la distribución de la energía producida por las cajas acústicas sea suficientemente homogénea y coherente para suministrar al sistema de percepción  las componentes básicas que se necesitan para recrear el espacio sonoro.

 

         El tipo de radiación impuesto por la o las fuentes disponibles intervendrá significativamente. En este sentido, resulta fácil comprender que una onda circular de una altura próxima a la de la sala de escucha creará una distribución más homogénea y mejor repartida que la creada por una fuente puntual que se propague después de sufrir varias reflexiones en las paredes y por tanto haya perdido toda su coherencia original como consecuencia de la creación de una multitud de fuentes virtuales; dichas fuentes degradarán el mensaje original puesto que, en función de la frecuencia, un instrumento estará localizado en varios lugares distintos. Todo esto será aún más cierto si el local en el que tenga lugar la escucha es reverberante. Puede utilizarse una analogía óptica para explicar lo anterior: un tubo fluorescente de un metro de largo creará una iluminación más uniforme que la suministrada por una bombilla colocada en el mismo lugar, al ser la distribución de la energía luminosa más homogénea en el primer caso. La ventaja de las fuentes de dimensiones relativamente grandes es, en este sentido, incontestable. Esto constituye una explicación posible de la naturalidad y aireación que poseen ciertos paneles a la hora de restituir las zonas media y media/alta del espectro, en las que el sistema de percepción humano es particularmente apto para  captar las más insignificantes sutilezas y por tanto cualquier incoherencia presente en el mensaje que llega.

 

Espacio acústico subjetivo

 

         Las diferencias físicas de las señales que llegan a nuestros oídos están en el origen de un proceso perceptivo que permite al oyente localizar una fuente sonora en el espacio. Este tipo de referenciación acústica conduce a la formación de un espacio sonoro definido por la yuxtaposición de los mensajes enviados por los diferentes emisores. No obstante, el funcionamiento de nuestro sistema sensorial está lejos de ser representado por una esquematización rígida que reduzca el problema a las leyes de la escucha binaural. El mecanismo de percepción tiene carácter de fenómeno de conjunto: los datos recogidos por los dos oídos e interpretados por nuestro cerebro bajo la forma de coordenadas espaciales de la fuente son combinados con las imágenes correspondientes a la respuesta de las otras partes del sistema sensorial y con los datos almacenados en nuestra memoria. A ello hay que añadir las condiciones espacio-temporales del individuo en el momento de percibir los estímulos. El cúmulo de informaciones es tratado con el más alto grado de sofisticación funcional en el córtex cerebral, operación que tiene como meta la formación del espacio sonoro subjetivo, denominación que expresa la interacción de los datos sensoriales con las particularidades circunstanciales y ontogenéticas del receptor.

 

         Desde el punto de vista de la reproducción sonora,  si se quiere llegar a la recreación completa de las condiciones acústicas originales, a la copia irreprochable de la forma de las señales deben añadirse los elementos necesarios para la creación de un espacio sonoro equivalente al que caracteriza el lugar de la grabación. Una vez más, nos damos cuenta de que el sistema electroacústico que utilicemos debe ser capaz de engañar a nuestros sentidos, de crear una impresión de que (durante la escucha de un disco) nos encontramos en una verdadera sala de conciertos y no en nuestra sala de estar.

 

         Puede imaginarse el espacio subjetivo como una especie de esfera en cuyo centro está situado el observador. Pero dado el carácter subjetivo de esta representación geométrica, no todas las regiones del campo perceptivo citado tienen la misma importancia para el sujeto. El valor relativo de las distintas partes de la esfera imaginaria depende de la atención del observador en tal o cual fuente sonora. Durante la escucha normal, el oyente establece una región preferente que se encuentra delante de él (naturalmente, en el mecanismo que determina las propiedades de la integración perceptiva encontramos la yuxtaposición de elementos acústicos y visuales que corresponden a la imagen de la fuente). Es de este modo que se determina un cono de atención prioritaria en el que los sonidos son percibidos de una manera más limpia, sensación que por lo general expresamos con ayuda del término “presencia”. En las regiones exteriores a este cono, el valor de la  percepción acústica decrece con la distancia con respecto a su eje.

 

         No obstante, hay que notar el carácter subjetivo de esta representación espacial. Es decir, que la posición de un estímulo sonoro en el interior de un cono no corresponde obligatoriamente a la verdadera localización geométrica de la fuente. En resumen, un sonido procedente de una dirección lateral puede ocupar el “cono delantero” si contiene una significación lo suficientemente fuerte para el oyente. Ésta es además la explicación psicoacústica de nuestra percepción “hacia delante” de la fuente musical en el interior de una sala que presente propiedades de reverberación normales. Atribuyamos pues, a los datos numéricos, un valor relativo al ser dependientes de una serie de concidiones psicológicas que estamos muy lejos de poder encuadrar dentro de la formulación matemática.

 

La escucha musical en una sala mediana

 

         La escucha musical en una sala de talla mediana conlleva un cierto número de restricciones. Por un lado, en las potencias más elevadas la dinámica está limitada por la saturación de dicha sala. El extremo grave es truncado y su percepción no es completamente natural puesto que la longitud de la onda sonora  tiende a igualar e incluso a superar la dimensión más grande de la sala. Por otro lado,estas pequeñas dimensiones hacen que resulte imposible colocar el altavoz a una distancia suficiente para que  las primeras reflexiones sonoras en el suelo, el techo y las paredes lleguen con un retardo superior a 10 milisegundos, resultando de ello una disminución de la inteligibilidad del sonido.

 

         Hay además otros parámetros probablemente aún más complicados de considerar. La falta de perspectiva con respecto al altavoz hace que se perciban ondas con una superficie curva mientras que en una interpretación en directo, cuando esa perspectiva es mayor, la forma de las ondas tiende a ser plana.

 

         El campo reverberante de la sala de escucha se añade al de la sala utilizada para la toma de sonido; esta suma hace imposible la percepción de un espacio sonoro completamente homogéneo. Se podría objetar que el amortiguamiento de la sala de escucha reduciría mucho este fenómeno pero desgraciadamente no es agradable escuchar música en una sala muy absorvente por cuanto en la misma se percibe una sensación de ahogo que impide todo intento de naturalidad. La cualidad fundamental del sonido en directo es la naturalidad y además presenta una característica particular: el generador sonoro es perfecto. La toma de sonido es por lo tanto un tema especialmente importante pero que aquí (en este trabajo) no desarrollaremos porque merecería un extenso y detallado trabajo aparte.

 

         Veamos cómo una sala de escucha normal puede llegar a modificar de manera considerable la respuesta de una caja acústica y en consecuencia la calidad de la imagen sonora global.

 

La escucha de música en habitaciones de residencias normales nos confronta a problemas de dos clases diferentes que deben ser tratados simultáneamente:

-         Obtención de las condiciones acústicas necesarias para una buena reproducción de las señales grabadas.

-         Las restricciones que no tienen que ver con la acústica, derivadas de la utilización cotidiana de la sala, del modo de vida de sus ocupantes y de la posibilidad relativa de realizar modificaciones en la decoración de dicha sala.

 

Aunque en principio intentaremos llevar a cabo la optimización acústica del lugar de escucha, es muy importante estudiar adecuadamente el segundo de los puntos mencionados si de verdad se quiere llevar a cabo con éxito la puesta a punto de una sala de escucha porque también es importante establecer un entorno acorde con el placer de la escucha musical: ¿cúal sería la ventaja obtenida si para optimizar, desde el punto de vista físico, una señal acústica se suprimiera el sillón favorito del propietario del equipo?

 

La curva de respuesta en frecuencia de una caja acústica colocada en un ambiente cerrado depende  de la propia caja y de las propiedades físicas del espacio cerrado. Es por esta razón que la curva obtenida en una cámara anecoica corresponde única y exclusivamente a las propiedades de la caja acústica puesto que en condiciones óptimas dicha cámara presenta una clara analogía con el campo libre. La curva obtenida de este modo no “habla” sobre el comportamiento del transductor electroacústico en condiciones de utilización normales, en las que la sala y la posición de la fuente en la misma tienen una influencia preponderante. A frecuencias muy bajas,  la importancia de estos fenómenos de interacción es fácilmente detectable pero a frecuencias más altas las modificaciónes aportadas por la sala son igualmente dignas de atención.

 

Colocación de las cajas acústicas: Los gráficos 1 a 3 muestran que los efectos de reflexiones múltiples en oposición de fase están lejos de ser simplemente aditivas:

 

Por tanto, es necesario esforzarse para colocar el woofer de una caja acústica convencional a unas distancias lo más distintas posible de cada una de las paredes más cercanas con el fin de que los accidentes provocados por las reflexiones en oposición de fase se produzcan a frecuencias diferentes. Cuando todo esto es factible, el equilibrio y la uniformidad de la curva de respuesta en graves son mejorados. La potencia radiada en función de la frecuencia se representa en el gráfico 5 para nuestro sistema de referencia cuando el woofer está colocado a 20 centímetros por encima del suelo y 51 y 122 centímetros de cada una de las paredes más próximas. Otra manera de superar los efectos de las paredes en una sala doméstica consiste en colocar el woofer lo suficientemente lejos de las mismas: si dicho altavoz se encuentra a un mínimo de 125 centímetros de la pared más cercana, todas las perturbaciones aparecerán por debajo de los 100Hz, zona en la que serán menos audibles de lo habitual. Por desgracia, una organización de este tipo no siempre resulta muy práctica.

 

Cada uno de los dos métodos anteriores es defensivo por cuanto ambos limitan los daños pero no los evitan por completo. De ahí que sea preferible realizar un estudio al respecto que básicamente consistiría en diseñar las cajas acústicas teniendo en cuenta los efectos de las paredes de la sala en que estén instaladas y por tanto sacando el máximo provecho de la posibilidad de aumentar la eficacia en las frecuencias más bajas y a la vez superar los problemas asociados a las reflexiones en oposición de fase.

 

 

Las   figuras 1, 2, 3, 4 muestran los resultados de algunas experiencias mientras que la figura 5 representa un resumen de las respuestas a frecuencias bajas en el que resulta muy fácil darse cuenta de las enormes diferencias de nivel derivadas del efecto de las paredes circundantes:

 

Este estudio pone en evidencia la enorme importancia de la colocación de las cajas acústicas  en una sala con unas características independientes del transductor. En efecto, en una sala que presente propiedades acústicas bien conocidas el resultado final puede ser muy variable dependiendo de la interacción física con las cajas.

 

Sin embargo, no hay que olvidar otros parámetros propios de las cajas acústicas, como por ejemplo la directividad, que se plasman en resultados audibles muy concretos como consecuencia de su particular interacción con la geometría, la naturaleza y la distribución de los materiales que constituyen la sala de escucha.

 

Tres ejemplos de adaptación de una sala:

 

Primer ejemplo: Consideremos una habitación destinada exclusivamente a al escucha musical. En ella, tanto los revestimientos como los materiales y el mobiliario han sido escogidos y colocados en función de las necesidades de la acústica. La habitación existía ya antes de la instalación del equipo como sala de estar convencional. El estado primitivo de dicha sala se muestra en la figura 6. Señalemos asímismo que la sala fue objeto de un tratamiento de insonorización adecuado para que la escucha a niveles de presión sonora importantes no provoque ninguna molestia. Las modificaciones aportadas se indican en la figura 7. La sala, originalmente demasiado amortiguada, presenta ahora un tiempo de reverberación de 0,7 segundos y el campo sonoro se muestra homogéneo. Al nivel de oyente, la curva de respuesta en frecuencia obtenida con las dos cajas acústicas en funcionamiento antes de las modificaciones es la de la figura 8. Después de los trabajos, el equilibrio es casi perfecto (figura 9).

 

Segundo ejemplo: Consideremos el caso de un audiófilo que vive en un apartamento de dimensiones muy moderadas y ha ubicado su equipo en una habitación de trabajo en la que hay una gran cantidad de libros colocados en muebles de tipos diferentes. El esquema final (figura 10) nos muestra una sala que ha conservado  su vocación de lugar de trabajo. Se ha añadido la cortina de fondo y, lo que contribuye a la originalidad de la instalación, los libros han sido colocados en muebles especiales dispuestos de tal forma que actúen, conjuntamente con elementos absorventes, como superficies difusoras o reflectantes. El uso de los libros como “materiales acústicos”, aunque sea una solución interesante al problema planteado, tiene un inconveniente adicional para el propietario de equipo: la exigencia de una cierta disciplina en la colocación de los mismos.

 

Tercer ejemplo: Es un caso típico de sala muy decorada en la que no es posible realizar ninguna modificación. Aún así, la curva de la figura 12 constituye una buena referencia para revelar unas condiciones de escucha bastante catastróficas. El tiempo de reverberación a 500Hz es de 0,5 segundos mientras que el volumen de la sala es de 120m3. Una vez realizada una corrección electrónica con ayuda de un ecualizador no paramétrico se obtuvieron los resultados indicados en la figura 13. La escucha es finalmente aceptable gracias a la rectificación de una curva que presentaba una diferencia de nivel de nada menos que 34dB entre sus puntos extremos.

 

 

 

Anexo: ¿Deberíamos quemar a Fourier?

(reflexiones para los que hemos sido adoctrinados con sus teorías)

 

Introducción

 

         En este apartado voy a tratar de discutir las bases sobre las que descansan muchos conceptos relacionados con la aplicación de las teorías de Fourier para las señales acústicas, que son las que nos interesan en este caso.

 

            En este mundo hay muchas cosas que funcionan “porque funcionan”; sin ir más lejos, el transistor no fue inventado sino descubierto y aparatos tan útiles para el avance de la ciencia y la tecnología de vanguardia como el microscopio a efecto túnel se basan en fenómenos de la física cúantica que a duras penas pueden explicar sus propios creadores. Por el contrario, hay “universos” tecnológicos e industriales que han sido erigidos a partir de teorías que sin ser incorrectas tienen al parecer una serie de lagunas en su planteamiento que hacen que en sus aplicaciones prácticas las cosas no acaben de funcionar como cabría esperar. El caso del diseño y la medida de los componentes de audio alrededor de una teoría (el análisis de Fourier) es un claro ejemplo, dado que en algunos aspecto de gran importancia “no funciona”.

 

         En el mundo del audio de hoy en día, las teorías de Fourier son muy utilizadas. Parece que demasiado puesto que, prisioneros de este yugo, los ingenieros de audio no saben comprender los misterios de este campo ni tratar de una manera satisfactoria para nuestros oídos los problemas electroacústicos. Es necesario precisar adecuadamente los límites que se pueden considerar como fiables para utilizar debidamente las teorías de Fourier. No son las teorías matemáticas de Fourier las que pongo en cuestión sino su empleo irreflexivo en un contexto que no responde exactamente a sus condiciones de aplicación. De hecho, estas teorías son una herramienta tan potente que se tiende a olvidar muy rápidamente sus condiciones de validez.  Estamos impregnados hasta tal punto de esta cultura que se necesita todo el absurdo de una ilustración voluntariamente estrafalaria para obligar a tomar conciencia de la impostura científica que tantos estragos hace en el campo del audio. Asi, si alguien nos dice que las pulgas oyen con sus patas y que tal aseveración está perfecta y científicamente establecida, es muy probable que nos quedemos sorprendidos. Si además nuestro interlocutor ilustra su afirmación describiendo la demostración científica de la “verdad” en cuestión, todavía nos sorprenderemos más; de hecho, en un primer momento bastará con entrenar a nuestra pulga para que salte cuando se le diga “¡salta!”. Se constata seguidamente que si privamos a la pulga de sus patas ya no obedecerá más a la orden anterior y por tanto que se ha vuelto sorda. La deducción científica de esta experiencia es que el órgano de audición de las pulgas está situado en sus patas, lo que sin duda empezará a despertar sospechas. Si además nuestro interlocutor finaliza su argumentación diciendo que quienes refuten tal verdad científica son unos inconsecuentes que contestan sistemáticamente toda verdad científica porque este resultado ha sido obtenido de forma independiente por investigadores de diferentes países, con pulgas que no se conocían entre sí, a diferentes horas de día y en idiomas distintos, pensaremos que está en perfectas condiciones para ser enviado a un asilo psiquiátrico.

 

         ¿Qué dicen realmente las teorías de Fourier? En síntesis: que toda función se puede descomponer en una combinación lineal de señales sinusoidales. Esto permite afirmar que todo sistema lineal está perfectamente definido en su comportamineto por señales sinusoidales. De ahí que las señales en cuestión  sean un medio extremadamente potente para analizar los sistemas lineales.  Pero sobre todo, lo anterior no quiere decir que el conocimiento del comportamiento no lineal de un sistema que suponíamos lineal, probado con señales sinusoidales,  permita definir totalmente la manera de actuar de dicho sistema (es decir, con cualquier señal). No obstante, una aseveración de este tipo (tan rigurosa como las afirmaciones anteriores referentes a las pulgas que se vuelven sordas como consecuencia de la mutilación de sus patas) parece ser habitualmente admitida en el mundo de audio; en revancha, proponer lo contrario equivaldría a hacer apología de la anti-ciencia.

 

         Los ingenieros hemos sido formados con las teorías de Fourier. Por lo tanto, nos gustaría que todos los sistemas fueran lineales, lo que obviamente simplificaría mucho las cosas. En consecuencia, actuamos como si realmente lo fueran. Tanto para estudiar los problemas en cuestión como para analizar sus no linealidades, olvidamos las condiciones de linealidad exigidas para aplicar Fourier (¡Al diablo el rigor! ¡Ya sabemos por qué nuestra pulga es sorda!). De este modo todo el mundo está contento, con la excepción de algunos audiófilos gruñones que tienen la imprudencia de cuestionar métodos científicos tan bien establecidos.

 

         Por desgracia, mientras el mundo del audio no comprenda que la aplicación indiscriminada de las teorías de Fourier lo ha llevado a un “impasse” me temo que los progresos que pueda realizar serán nimios. Se puede legítimamente aplicar Fourier a las señales de audio y descomponerlas en señales sinusoidales pero no hay que olvidar que las sinusoides sólo pueden caracterizar por completo a los sistemas lineales.

 

La audición: ¿Es el oído lineal?

 

         Desgraciadamente, la respuesta es negativa.  La audición parte de un sistema de información que no funciona en absoluto como los aparatos de medida, de análisis y de grabación utilizados en la actualidad por los ingenieros de sonido. En consecuencia, no se puede estar sorprendido de constatar las dificultades, a menudo insuperables, con las que se encuentran los especialistas para adaptar las doctrinas y métodos metrológicos de hoy en día con los problemas prácticos de nuestro ambiente acústico que deben tratar. De ahí que sea legítimo preguntarse si los instrumentos y métodos de los que se sirven los investigadores y especialistas están adaptados a los problemas que se pretende resolver con ellos. De hecho, dichos instrumentos y métodos han sido concebidos en función de consideraciones tecnológicas y son perfectamente apropiados cuando de construir y evaluar aparatos acústicos se trata, en los que las medidas físicas son indispensables. Cuando se ha empezado a utilizarlos para estudiar los problemas auditivos, han sido “corregidos” en función del oído, más exactamente de lo que se sabía a través de las investigaciones de los fisiólogos: es así como se han incorporado, por ejemplo, “circuitos de ponderación” en los audímetros  o sonómetros. Pero es evidente que estos sistemas cerrados no pueden compararse con un sistema autoadaptativo como es el oído humano, de ahí las numerosas dificultades.

 

         Es necesario comprender que la audición es un sistema biológico destinado a favorecer la supervivencia de las especies aportando a los individuos un conocimiento suplementario de su entorno mediante el análisis del medio ambiente que los rodea (para nosotros el aire). Hemos desviado este elemento captador para hacer de él un receptor de comunicación y, con la música, una fuente de placer. Pero no estamos ante un receptor que trata la energía como los sistemas de comunicación concebidos por los ingenieros. Nuestra audición no es lineal. De este modo, nuestro campo de consciencia tiene una talla limitada que nosotros ignoramos del mismo modo que ignoramos la mancha ciega de cada uno de nuestros ojos. Cuando este campo de consciencia es dominado por la imagen, las sensaciones auditivas dejan de saber transportar muchas informaciones. De ahí la pobreza de los trucos sonoros en el cine o la impresión de adorno del sonido con un video cuando se corta la imagen  y se deja únicamente el sonido: toda la belleza del sonido de la que no nos dábamos cuenta con la imagen invade entonces nuestro campo de consciencia, con numerosas informaciones que eran rechazadas cuando la imagen estaba presente.

 

¿Cómo oímos?

 

         Nosotros escuchamos con nuestros oídos y nuestra memoria, algo a la vez tan importante como poco tenido en cuenta. Cuando recibimos una llamada telefónica no oímos la misma voz antes y después de haber reconocido a nuestro interlocutor; es nuestra memoria la que, sin que nosotros tengamos consciencia de ello, ayuda a nuestro oído a corregir los defectos de transmisión del teléfono.

 

         Para muchos físicos acústicos y para los ingenieros el oído no es más que un dispositivo de captación analizado con la ayuda de Fourier que responde a un modelo lineal en el que se han introducido unas pocas correcciones (expresadas evidentemente en términos “fourieristas”) para tener en cuenta las más escandalosas rarezas de la realidad. De este modo se consigue llegar, por ejemplo, a las famosas curvas de Fletcher y Munson. Estas curvas son interesantes y ricas en información pero con toda seguridad son muy pocos los usuaros de las mismas que se acuerdan de que han sido establecidas con señales sinusoidales, un tipo de señales que resultan extrañas para el oído. Además dichas curvas no tienen en cuenta los fenómenos transitorios que se producen tanto a nivel de oído medio como del oído interno.

 

         Nuestro aparato auditivo tiene poco de captador y mucho de tratamiento. El captador está lleno de astucias pero es realmente imperfecto cuando se compara con los aparatos de medida que construimos los ingenieros. Combina un análisis temporal de constante de tiempo relativamente elevada (¿Fourier? ¡Ni idea!) con un análisis vagamente frecuencial que podría hacer creer perfectamente a los fans de Fourier que tienen razón. El captador es muy imperfecto, pero en revancha, el tratamiento es extremadamente potente y trabaja sobre una base de datos muy importante que desborda ampliamente el campo sonoro para combinarse con otras bases de datos (datos visuales, táctiles, olfativos, afectivos, etc.).

 

         Entre los tratamientos que han sido llevados a la práctica pueden citarse dos que los ingenieros utilizamos en nuestros sistemas de comunicación o de análisis y que son totalmente olvidados cuando de audición se trata. El primero es muy utilizado en sistemas de radar; se trata de la post-integración, una técnica que consiste en acumular señales que transportan la misma información pero son demasiado débiles para ser utilizadas individualmente hasta que se obtiene una señal utilizable para tratar dicha información. La post-integración permite realzar los límites de sensibilidad, haciendo posible que el oído detecte distorsiones más débiles que las generadas por el captador. Otro  tratamiento conocido (en análisis de datos): el uso de conocimientos a priori sobre la señal, que permite al oído franquear terrenos prohibidos para Fourier y hacer, por ejemplo, que podamos comprender palabras situadas 20dB por debajo del ruido. Ello es debido a que los mensajes sonoros posibles son limitados a una base de datos que corresponde al idioma utilizado y que nosotros aplicamos una especie de correción de errores a las informaciones mutiladas recibidas. Por el contrario, si el idioma nos es desconocido en mayor o menor medida nos sentimos incapaces de regenerar la señal y no adivinamos más que sonidos vagos sumergidos en el ruido y que seríamos absolutamente incapaces de reconocer o reproducir.

 

Todos los análisis realizados sobre la audición utilizando señales sinusoidales se basan en la ilusión de que el empleo de señales elementales (en el sentido de Fourier) permite conocer los tratamientos elementales del mencionado proceso (es decir, la audición) que utilizan para las señales más complejas. Si en ocasiones esta aseveración es cierta, no es menos cierto que está muy lejos de ser la verdad universal que permita comprender el fenómeno de la audición.  Para los procesos que tienen lugar durante la audición, la señal sinusoidal (es decir, el tono puro para los fourieristas) no es un sonido elemental sino un nuevo objeto sonoro para el que los datos memorizados son muy limitados excepto en caso de que uno haya tenido la desgracia de haber sido un cobaya en manos de un loco de Fourier. Esto no quiere decir que entonces se podrá acceder a una sensación elemental no tratada por los procesos de reconocimiento (es decir, los basados en hechos que tenemos ya debidamente cuantificados y memorizados); de hecho, dichos procesos se activarán y ésa es la razón por la cual al escuchar un tono puro decimos: “es como un silbido”.

 

El uso que se hace del análisis de Fourier

 

Analizaremos tres conceptos clave relacionados con la complejidad del sonido, para analizar el uso que realmente se hace del análisis de Fourier:

 

El vibrato: Es una técnica bien conocida en música  que consiste en someter a una nota a cambios de tonalidad rápidos y sutiles. Estas variaciones tienen una rapidez y una amplitud que se sitúan en los límites de la capacidad de detección del oído, siendo el resultado obtenido una sensación de intensidad superior. La explicación del fenómeno parece relacionada con la renovación de las informaciones elementales correspondientes a la nota emitida, que mantiene concentrada la atención sobre la misma sin activar la sensación de una nueva información. A ver si hay alguien que es capaz de explicar este fenómeno mediante las teorías de Fourier, para las que la modulación mencionada se traduce en un escalonamiento del espectro con disminución de la amplitud de la frecuencia fundamental.

 

El timbre: Para los fourieristas el timbre es un tema superado, claro y limpio que hemos explorado con nuestras condenadas sinusoides. Escuchando sonidos construidos con señales sinusoidales lo hemos comprendido todo: el tono es la frecuencia fundamental y el timbre son los armónicos. Ya hemos mencionado los problemas ligados al tono; por desgracia, para el timbre la generalización de estos resultados obtenidos con sonidos elementales aún funciona peor. En música, por ejemplo, los sonidos producidos presentan fases transitorias (ver figura).

En el gráfico superior izquierdo se muestra el inicio de una nota de piano, mientras que en el superior derecho se ilustra el fenómeno del enmascaramiento y en el inferior se representa el análisis espectral (según Winckel) de una nota de violín (a) y una nota de trompeta (b)

 

 

 

         El análisis de estos sonidos musicales muestra que el contenido armónico varía durante el transitorio (ver figura) mientras que es relativamente estable durante el régimen permanente. Si se amputa la fase transitoria inicial a las notas producidas por instrumentos musicales muy diferentes, el oído los confunde. El transitorio es esencial para reconocer el timbre de un instrumento. Y sin embargo, el análisis de este transitorio realizado con Fourier (ver figura) ni es estable ni puede reproducirse de una nota a otra mientras que nosotros reconocemos sin ninguna duda las notas de los instrumentos musicales. Los transitorios corresponden a una energía más débil pero contienen más informaciones. El reconocimiento del timbre de los instrumentos pasa sin duda por el aprovechamiento de las informaciones medidas por nuestros oídos (no todas de tipo frecuencia/amplitud en el sentido de Fourier) corregidas en función de las condiciones de escucha  y comparadas a nuestra base de datos de instrumentos musicales. Se está, por tanto, lejos de la visión simple, simplificada, simplificadora y finalmente simplista de los reyes de la sinusoide.

 

El efecto enmascaramiento: El efecto de enmascaramiento es un puro producto de la medida. Analizando la escucha simultánea de dos sinusoides se puede descubrir que en ciertas condiciones de frecuencia e intensidad relativas una de las sinusoides deja de ser percibida. Sin embargo, es mejor mantener la prudencia. Las curvas diseñadas por Wegel y Lane (enmascaramiento de un sonido puro por otro sonido puro) y las diseñadas por Egan y Hake (enmascaramiento de un sonido puro por un sonido de banda obtenido mediante la mezcla de frecuencias comprendidads entre dos valores dados) no pueden ser generalizadas de manera simple, y sin embargo, la regla generalmente aceptada es añadir el fenómeno del enmascaramiento al modelo fourierista de la audición.

 

El uso de Fourier: Hay que reconocer que Fourier fue un gran teórico que no es en absoluto responsable de los abusos que se han cometido con su teoría.  Un ejemplo de la utilización abusiva de las teorías de Fourier es el procedimiento MUSICAM (Masking-pattern Universal Sub-band Integrated Coding and Multiplexing) desarrollado por Philips. Este procedimiento de compresión de informaciones digitales está destinado a los nuevos casetes digitales (DCC) de Philips. Éste es el procedimiento utilizado: el público se ha acostrumbrado al sonido digital (CD) pero la velocidad de transferencia de datos (1.411.200 bits por segundo) asociada al mismo es demasiado elevada para los casetes DCC y contribuye a incrementar el coste de la velocidad de transmisión. La solución consiste en reducir la cantidad de información a transmitir eliminando aquella que es inútil o redundante. Es la combinación de la curva correspondiente al umbral de sensibilidad de la audición (Fletcher y compañía) y las cuervas del efecto de enmascaramiento lo que permite separar los sonidos percibidos de los inútiles. Para llevar a cabo esta operación, la señal es dividida en bloques de 8 milisegundos de duración que son agrupados de tres en tres y analizados por la transformada de Fourier (FFT de 1.024 puntos); acontinuación se determina la energía presente en cada uno de los 32 canales de 700Hz en los que es dividida la banda de audio. El espectro instantáneo así obtenido permite determinar “una función de enmascaramiento basada en reglas y modelos psicoacústicos fundamentales” (según sus autores) y de este modo definir los canales en los que la señal es útil y por tanto debe ser codificada, así como la precisión necesaria en la codificación para que el ruido asociado a la misma esté situado justo por debajo del umbral de enmascaramiento. Se han hecho pruebas para validar el procedimiento y los resultados favorables de estas pruebas han sido confirmados por otras pruebas, algunas de ellas realizadas con la colaboración de oyentes profesionales de la división de productos de gran consumo de Philips.

 

         Hay ciertamente varias posibilidades para reducir la cantidad de datos digitales de audio sin que se produzcan pérdidas de información (cuando hay un exceso de información) o eliminando la información no perceptible por nuestros oídos pero su definición como su realización pasan por un estudio más meticuloso.

 

Conclusión

 

         De ninguna manera pensamos quemar a Fourier, pero si para caracterizar y medir los filtros  utilizaremos por supuesto a Fourier, para analizar los problemas y definir las especificaciones de los filtros la sinusoide está proscrita. Contamos con utilizar pruebas subjetivas con una metodología que intentaremos que sea lo más rigurosa posible.

 

         Las teorías de Fourier son absolutamente geniales pero la vida no se puede reducir ingenuamente a números y fórmulas. Por desgracia es más fácil destruir (comprimiendo datos, por ejemplo) que crear (poner a punto sistemas que fomenten la calidad a escala global) pero al igual que, por ejemplo, la energía atómica o la ingeniería genética, Fourier sólo es peligroso si cae en malas manos.

 

 

 

Bibliografía

 

-         Revista mensual Alta Fidelidad: números 118-127 y 130-133

-         INTERNET:

1.    Instituto de acústica: http://www.ia.csic.es/

2.    Sociedad española de acústica (S.E.A): http://www.ia.csic.es/sea/index.html

3.    http://club.telepolis.com/adrodriguez/acustica.html

4.    http://www.amigoshifi.com/articulos/salashifi.html