escribe Juan Ignacio Curone
https://www.curonedesign.com/

A la mayoría de audiófilos, y a no pocos profesionales del audio, se les ponen los pelos de punta cuando escuchan hablar sobre ecualización correctiva. El propósito de este artículo es disipar resquemores sobre ella, exponer sus beneficios, y explicar porque los habituales temores que la rodean son infundados.

El término ecualización, que etimológicamente significa igualar, hace referencia al proceso de la modificación voluntaria de la curva de respuesta en frecuencia, sea de un sistema de audio completo, o bien de cierto proceso localizado en determinada parte de la cadena de audio.

La finalidad de este artículo es hablar sobre la ecualización aplicada a dos fines muy concretos, correcciones de aberraciones en la respuesta en baja frecuencia causadas por la interacción sala-parlantes, y ajuste de la respuesta en frecuencia del sistema de audio en todo el rango.

Antes de entrar de lleno en estas dos cuestiones y el porqué de la necesidad casi obligatoria del uso de la ecualización en un sistema de altas prestaciones, me gustaría nombrar algunas “ecualizaciones” que se utilizan en la industria del audio desde hace años. Esto último con la finalidad de mostrarle al lector que la ecualización esta hace años entre nosotros y que no hay nada a que temer si se implementa correctamente.

Ecualización, pero con otros nombres

Los amantes del audio analógico sin dudas habrán escuchado hablar de siglas como RIAA, IEC, NAB. Estas son siglas que, ajustándonos al tema que nos compete, señalan ni más ni menos que diferentes curvas de ecualización.

Tanto la curva RIAA, aplicada al corte y posteriormente a la reproducción de los discos de vinilo, como las NAB/IEC, aplicadas a los magnetófonos de cinta, son curvas que optimizan la grabación en dichos medios.

La nota de color para los que se declaran “minimalistas” es que, por ejemplo, en el caso de la curva RIAA, ¡el rango de variación que implica es de casi 40dB! a lo largo de todo el rango de audiofrecuencias. Cabe a clarar que se aplica dos veces, en la grabación y en la reproducción.

Sin embargo, no es tan grave: La ecualización y posterior de-ecualización, bien implementada, apenas deja trazas de degradación a su paso. Lo mismo, por supuesto, aplica al juicioso uso de la ecualización con finalidades de corrección y ajuste en un sistema de audio.

La fase, un “problema” que no es tal

Este un tópico complejo e incomprendido en el audio, y no es la razón de este artículo ahondar mucho al respecto, sino más bien lo mínimo e indispensable para que se comprenda que no hay nada a que temer en esto.

A grandes rasgos, puede decirse que existen varios tipos de respuesta de fase posibles, siendo la más común y la que nos interesa aquí, la de “fase mínima”. Un sistema de fase mínima tiene la característica de tener una relación matemática conocida entre la respuesta en frecuencia y la de fase, y una de sus particularidades es que la inversa del sistema es estable. Esto quiere decir que si a un sistema de fase mínima se le aplica una corrección (su inverso) tanto la respuesta en frecuencia como la de fase volverán a tener la integridad original.

Los ecualizadores que normalmente se utilizan en audio efectivamente modifican la fase, porque son sistemas de fase mínima, y los sistemas de fase mínima al modificar la respuesta en frecuencia también modifican la de fase mediante la relación que establece la transformada de Hilbert.

Esto que, a priori y descontextualizado, pudiera parecer un inconveniente, es en realidad la propiedad que hace posible el tipo de ecualización de la cual estamos hablando, ya que normalmente cuando hay un error a corregir en la respuesta en frecuencia también lo hay en la de fase; y suele ser así es porque en general gran parte de los sistemas a corregir tienen una buena fracción de su comportamiento en fase mínima. Por ejemplo, parte del comportamiento modal de una sala es fase mínima.

Por otra parte, y si bien es un tópico que involucra cierta controversia, la audibilidad de las variaciones de fase es, afortunadamente, entre muy baja y nula. La versión simplificada dice que en tests correctamente realizados (bajo condiciones de control y a doble ciego) solo son audibles variaciones de fase muy bruscas y más que nada con ciertas señales muy específicas (clicks).

En cualquier caso, cuando se aplique ecualización para corregir la respuesta en baja frecuencia de una sala esta deberá ser aplicada solo sobre las regiones de la repuesta que son de fase mínima. Esto último garantiza que la respuesta en fase del sistema siempre será mejor en la versión con corrección.

La necesidad de correcciones en baja frecuencia

En salas con poco o nulo tratamiento acústico lo habitual es que la respuesta en baja frecuencia sea bastante caótica producto de la “huella acústica” que imprime el recinto de escucha. Aceptar y convivir con ello no es una buena opción si realmente se busca alta calidad de sonido. El mejor de los equipos se ve arruinado por una mala acústica. Se trata de la física de propagación del sonido en espacios cerrados, y no entiende de precios ni de status personales, lamentablemente.

Grosso modo se podría decir que hay dos tipos de problemas en bajas frecuencias (no necesariamente tiene que haber una división tajante, pero es conveniente marcarla a fines explicativos.)

Por un lado, está el problema de la respuesta en frecuencia, que en casos extremos puede asemejarse a una montaña rusa; perceptualmente no hay mucho para decir. En algunas canciones habrá demasiado grave, en otras muy poco y, en general, toda la parte del espectro que componen las bajas frecuencias sonará desequilibrada.

Por otro lado, están los problemas a los que se los suele denominar “temporales” como la falta de claridad, enmascaramiento entre instrumentos, “bola de graves”, etc. Es para este último tipo de problemas que se piensa que las correcciones con ecualización no sirven ya que, según se dice, “el ecualizador no corrige problemas temporales”.

En realidad, las cosas son algo distintas. Por un lado, el ecualizador si corrige algunos problemas temporales, los que atienen a la componente fase mínima del sistema. Por otro lado, perceptualmente hablando, una gran parte de esos problemas temporales no molestan por ser temporales en sí, sino a través del enmascaramiento (de niveles) que producen. Esto se explicará con mejor detalle más adelante.

Desde luego el acondicionamiento acústico es un camino necesario a seguir si se quieren obtener los mejores resultados posibles. Sin embargo, es frecuente que aún en el más favorable de los resultados de acondicionamiento acústico, no sólo haya lugar para la ecualización, sino que en algunos de estos casos la ecualización siga siendo necesaria.

Por un lado, lamentablemente, casi nadie está dispuesto a hacer lo que habría que hacer para tener una respuesta acústica de excelencia. Por otro lado, incluso en salas con acústica de excepción, suelen ser útiles, y necesarias, algunas correcciones mediante ecualización. En salas sin tratamiento la ecualización será de gran ayuda y corregirá problemas “gruesos” mientras que en salas de alta gama la ecualización será la frutilla del postre y corregirá sutilezas. Sutilezas estas que, aun siéndolo, serán al menos un orden de magnitud más audibles que otras variables del sistema de sonido.

Algunos detractores del uso de la ecualización como medida correctiva suelen decir que “los problemas acústicos necesitan soluciones acústicas”. Afortunadamente, como intentare explicar a continuación, esto no es del todo cierto e incluso muestra una falta de comprensión profunda de la naturaleza del fenómeno.

Una explicación perceptual acerca de la reverberación y los “factores temporales” como ayuda para entender los fundamentos de la ecualización de resonancias en bajas frecuencias

Hablar de “tiempo de reverberación” no ayuda demasiado a comprender que en la percepción de la reverberación la variable más importante no suele ser el tiempo en sí, sino el nivel, es decir, la amplitud de la presión sonora.

Existen dos casos extremos en los que la reverberación se percibe de modo muy distinto.

El primero es el de la llamada “stop reverberation”, caso que se evidencia cuando el estímulo sonoro cesa de golpe dejando sin enmascarar la cola de reverberación de la sala. En este caso, sobre todo cuando el tiempo de reverberación de la sala es largo, el sistema auditivo puede percibir el “efecto temporal” claramente (con cierto entrenamiento hasta se puede contar el tiempo del decaimiento).

El otro extremo se da cuando la señal de excitación es lo suficientemente continua, haciendo que no se perciban prácticamente en ninguna medida los efectos “transitorios” y “temporales”. Esto es lo que se conoce como “running reverberation” (RR) o reverberancia.

En este caso los “efectos temporales” no son directamente evidentes porque el fenómeno se da en una escala de tiempo en donde la percepción auditiva es difusa y limitada.

Intentaré esbozar una explicación haciendo un paralelo con el sentido de la visión. Un objeto en movimiento a alta velocidad, pero que se encuentre a gran distancia, será perfectamente perceptible en toda su integridad, en cambio, si el mismo objeto se encontrara muy cercano la integridad perceptual del mismo dejará de ser clara y se lo verá más bien como una estela en movimiento. Esto ocurre porque la percepción visual tiene rangos en donde funciona muy bien y otros a partir de los cuales, no tanto. Esto se verifica en casos de velocidades angulares razonables para las cuales estamos bien adaptados, pero hay un punto a partir del cual la percepción “se va de escala” y la integridad perceptual se pierde. Con el sentido de la audición pasa lo mismo. En cierta escala adecuada los eventos sonoros separados se perciben como tales, mientras que si pasan muy rápido se perciben, al igual que como pasa con la visión, como una “estela” continua. Quien quiera saber más al respecto de cómo el sistema auditivo agrupa y segrega los sonidos respecto del tiempo y otras variables, puede leer el libro: Auditory Scene Analisys, de Albert Bregman.

En condición de running reverberation (RR) los eventos sonoros que se suceden unos tras otros (notas, fonemas, etc.) son lo suficientemente cercanos en el tiempo como para que el decaimiento energético que hay entre uno y otro se perciba de modo “temporalmente distinguible”, de modo que se perciben como parte de una especie de estela que los une y los cohesiona. Si al instante de un evento n2, que sucede a un evento n1, el decaimiento energético de n1 es alto, el nivel energético de n2 enmascarará gran parte de la curva de decaimiento energético de n1. Este es un caso favorable, y que dependiendo del ratio exacto en dicho instante, la reverberación se va a percibir a un nivel que va desde muy bajo (mucha claridad y relativamente poca cohesión) hasta un nivel “ideal” donde habrá algo menos de claridad, pero mucha mejor cohesión entre los sonidos. Por el contrario, si al instante de comienzo de n2 el decaimiento del nivel de n1 es muy bajo, la energía de n1 va a enmascarar a n2. Este caso es desfavorable, y es lo que ocurre cuando le reverberación muestra sus efectos perniciosos. Lo que tiene que quedar claro es que los efectos negativos de la reverberación, que todos conocemos, se dan cuando el decaimiento energético del evento sonoro n1 enmascara al evento n2, luego el decaimiento de n2 enmascara a n3, y así sucesivamente.

En salas pequeñas y en baja frecuencia (zona de régimen modal) la energía no decae tal como en un campo reverberante propiamente dicho, sino que se acumula/decae en zonas “discretas” del espacio. (los modos resonantes de la sala.) La respuesta en frecuencia de un sistema de audio, además de lo que atiene al sistema en sí , depende, para una posición de fuente/punto de escucha, de la superposición de todo el régimen modal. A las frecuencias a las que haya algún modo resonante habrá acumulación/decaimiento de energía de un modo muy similar a como ocurre con la reverberación. A modo de ejemplo, suponiendo que haya un modo resonante en 50Hz con un pico de 10dB en la respuesta y un decaimiento de 1s: Cuando un sonido (digamos n1) a la frecuencia de 50Hz (o muy cercana) excite y “cargue” de energía el modo de resonancia, luego de cesado el mismo, comenzará la fase de decaimiento (descarga de la energía de la resonancia), y si al instante en que suene n2 la energía aún es lo suficientemente alta, el decaimiento de n1 enmascarará a n2. Si n2, sucesivo de n1 tiene la misma frecuencia habrá enmascaramiento, y si la frecuencia es cercana (específicamente si cae dentro de la misma banda crítica del sistema auditivo) también lo habrá y el sonido resultará con una pérdida de claridad. En este punto vale la pena aclarar que con contenido musical es raro que dos sonidos contiguos en el tiempo, n1y n2, sean de la misma frecuencia. Lo más común es que los sonidos de idéntica frecuencia con mínima separación temporal se correspondan a la base percusiva, y salvo a tempos muy rápidos y/o D/r ratios muy bajos no suele haber enmascaramiento considerable de n1 por sobre n2, es decir, no es el caso en donde hay problemas.

Los problemas, en general, se dan cuando n1 y n2 son muy cercanos en tiempo y, por ende, normalmente son de frecuencias cercanas, aunque no iguales. Por ejemplo, una nota de bombo enmascarando a una del bajo, o una nota de bajo enmascarando a otra del mismo instrumento. En el ejemplo de n1 a 50Hz, que podría ser la fundamental de un bombo, donde la resonancia de la sala produce un pico de 10dB, n1 va a enmascarar a un posible n2 en, por ejemplo, 52hz. (lab0). Debe considerarse que cualquier sonido n1 a una frecuencia distinta de la resonancia de 50Hz la presión sonora tomará un nivel de referencia de, digamos, 0dB, y que así las cosas el D/r ratio sobre el instante donde comenzará a sonar n2 dependerá del tiempo de reverberación del recinto, de la directividad de la fuente, y de la distancia entre la misma y el oyente. Podría ponerse el ejemplo de una situación benévola en donde el decaimiento de n1 no enmascare a n2. En contraste, cuando n1 tenga una frecuencia que excite la resonancia, naturalmente el valor de presión que tomará n1 estará 10dB (valor arbitrario puesto como ej.) por encima del 0dB de referencia y, céteris paríbus, el nivel de n1 (50Hz) por sobre n2 (52Hz) estará 10dB por encima del que habría en ausencia de resonancia. En este caso, el enmascaramiento está casi garantizado, y n2 no se escuchará bien.

Si se le aplica ecualización a la resonancia en 50Hz las características temporales del modo de resonancia de la sala, de manera aislada, seguirán siendo las mismas, el setting/decay time de la resonancia no variará. Sin embargo cuando se considere el conjunto completo, es decir, señal eléctrica “alterada” por un ecualizador de fase mínima excitando el modo de resonancia de la sala, el panorama será bastante distinto y la ecualización no solo corregirá la respuesta en frecuencia, sino también la componente de la fase y el retardo de grupo que sean fase mínima.

Por otra parte, y mucho más importante: En condición RR los efectos temporales que producen las “acumulaciones de energía” (reverberación/modos de resonancia) no se perciben directamente como temporales sino como enmarcamiento dinámico entre niveles para sonidos sucesivos. Esto significa decir que los efectos perniciosos de la reverberación/modos de resonancia dependen de una simple relación de niveles. En este caso, n2/n1.

Desde luego el tiempo de reverberación es una de las variables que define la pendiente de decaimiento que terminará definiendo la relación de niveles, pero no es la única. Igualmente importante es la distancia entre la fuente y el oyente, o la tasa de variación temporal de la señal de excitación.

Con el modo de resonancia ecualizado/corregido en conjunto, n1 ya no tendrá 10dB por encima de n2, y por tanto el margen para que haya enmascaramiento pernicioso aumentará en 10dB. El conjunto ecualizado no solo tendrá mejor respuesta en frecuencia, sino mejor respuesta temporal, y mucha mayor claridad percibida.

Bien podría decirse que, efectivamente, los problemas acústicos son acústicos. Pero que no hay que perder de vista que cuando se habla de sistemas de reproducción de sonido hay dos dominios de acción. Uno efectivamente acústico, y el otro eléctrico. La conjunción de ambos es la electroacústica, donde algunas características acústicas son perfectamente compensables, es decir matemáticamente inversibles, desde el dominio eléctrico; mientras que otras, si bien no son perfectamente compensables desde el punto de vista matemático formal, perceptualmente hablando permiten lograr un resultado muy aceptable cuando son manipuladas adecuadamente.

La necesidad de ecualización en todo el rango audible

Suele pensarse que con aplicar ecualización a las bajas frecuencias es suficiente. Se llega al extremo de pensar que es el mejor modo de aplicar ecualización, ya que se obtendrían las ventajas de este procedimiento supuestamente sin padecer degradaciones. Esto basa en la suposición de que en la vía baja la eventual degradación es menos crítica.

Sucede que el consenso general es que la ecualización padece de problemas intrínsecos que, inevitablemente, implican degradación. Esto no tiene por qué ser así. En realidad, en el momento en que se asume que la ecualización, correctamente implementada, es un proceso completamente transparente, se da el verdadero paso hacia su utilización plena en todo el espectro y potencial.

Es importante señalar que, además de la corrección de resonancias mencionada más arriba, la ecualización en el espectro completo es muy importante, ya que permite obtener dos beneficios clave. Por un lado, la adaptación a la condición de campo de la sala. Por el otro, el ajuste de la respuesta a una determinada curva target.

Con base a mi experiencia, ajustando sistemas de sonido a entornos extremadamente diferentes, encuentro a estos dos puntos tan importantes que normalmente representan el 80 o 90% del resultado de escucha en un sistema de alta calidad.

Dicho de otro modo, gran parte de las diferencias tímbricas entre sistemas se podrían reducir o eliminar con ecualización. Esto significa decir que, dadas bases sólidas, ese sonido idílico que un audiófilo tiene como referencia, sea real o imaginaria, puede esculpirse a base de la modificación voluntaria de la respuesta en frecuencia del sistema.

Adaptación a la condición de campo

En acústica, cuando se habla de condición de campo, se hace referencia a cuáles son las características acústicas del entorno. Hay extremos opuestos como “campo libre” donde, idealmente, no habrá ni reflexiones ni reverberación. El sonido llega desde un solo lugar, la fuente. O bien “campo difuso” donde el campo reverberante es ideal y el sonido, estadísticamente hablando, tiene igual probabilidad de llegar desde cualquier sitio. Ambas condiciones son ideales y solo suelen lograrse en laboratorio. En salas de escucha crítica se da una condición de campo que es mixta y que, dependiendo del criterio de diseño de la sala, puede tener un margen de variación bastante amplio. Estrictamente hablando, habrá tantas condiciones de campo como salas haya.

Generalizando un poco, habrá un grupo de salas con “condiciones de campo” similares que exhiban un control total y estricto de las reflexiones primarias y bajo tiempo de reverberación. Pero también habrá otro grupo bastante distinto de salas con buena presencia de reflexiones laterales y algo más reverberantes.

Dado que nuestro sistema de audición no percibe del mismo modo que un micrófono omnidireccional de medición, dos sistemas ajustados para medir idéntico con micrófono de medición, pero en salas con condición de campo muy diferente, van a sonar diferente.

De esto último se desprende que en dos salas diferentes, aún con el mismo equipamiento y ajuste, el balance tonal podrá ser relativamente distinto, y que si se quieren minimizar las diferencias entre ellas en pos de lograr un “determinado balance tonal considerado correcto” (curva target), será necesaria ecualización para adaptarse a la condición de campo.

Curva target

Mucho se puede discutir en el ámbito académico sobre si es correcto reducir todo a una sola curva target, o sobre cuál debería ser ésta, o porque, etc. Sin embargo, fuere por razones estadísticas o de mero gusto personal, siempre habrá una curva “perfecta” a la cual aspirar, y que será casi imposible de lograr con un sistema en donde no haya posibilidades de ajuste.

Personalmente, denomino como “sistemas a piñón fijo”, a los sistemas de sonido que no cuentan con ninguna instancia de ajuste de su respuesta.

También personalmente opino que los sistemas a “piñon fijo” son la causa de la mayoría de las constantes insatisfacciones audiófilas.

Conclusiones

Desde que existe la grabación y reproducción del sonido por medios eléctricos se modifica voluntariamente, de una u otra forma y con fines diversos, la respuesta en frecuencia de dichos sistemas. La ecualización correctiva de la que se habló en este artículo es una más de las tantas que a lo largo de la historia de la grabación y reproducción se han aplicado y se siguen aplicando. Hoy más que nunca los medios digitales permiten una implementación transparente de la ecualización (es decir, sin degradación audible)

En casos de salas con acústica desfavorable, lamentablemente la mayoría, la ecualización correctiva en bajas frecuencias permite mejorar mucho la situación, y la calidad de la escucha mejora notablemente luego de ser aplicada. En salas de alta calidad acústica la ecualización suele continuar siendo necesaria para lograr ajustes finos que, en suma, ponen al sistema en otro nivel.

Tanto la fase como otros factores temporales mejoran con una conveniente aplicación de ecualización. Contrariamente a lo que se piensa algunos problemas acústicos sí pueden ser convenientemente compensados con ecualización.

La aplicación de ecualización en todo el espectro de frecuencias es necesaria para adaptar la interacción entre las características de la fuente y las de la sala y así poder lograr la respuesta buscada y adecuada, tanto objetiva como subjetivamente.

En siguientes entregas escribiré y ahondaré sobre aspectos puntuales de la ecualización; desde técnicas de implementación, hasta aspectos brevemente analizados en este artículo, como la adaptación a la condición de campo o la curva target.

J.I.C. www.audioperformance.com.ar