Sonido profesional: niveles, conectores y cables. Explicación sencilla

Guía práctica para entender las diferentes entradas y salidas, tipos de conectores y tipos de cables que se utilizan en los equipos de sonido

 

Equipos de sonido: niveles, conectores, cables

 

 

Este artículo forma parte de la serie sobre cómo mejorar la grabación de audio para vídeo / youtube

 

El camino que sigue el sonido

Para poner todo en contexto vamos a ver un ejemplo sencillo.

 

Cadena que sigue el sonido desde grabación hasta reproducción

Tenemos a una persona que quiere grabar una canción en su estudio para subirla a su canal de youtube o para enviarla a una productora musical.

Esa persona canta y el sonido de su voz es recogido por un micrófono, que transforma las vibraciones del aire en señal eléctrica analógica.

La señal eléctrica a la salida del micrófono es muy pequeña, muy débil.

Se pasa por un amplificador (preamplificador) para conseguir un determinado nivel.

Esa señal amplificada se digitaliza: se muestrea y se convierte en valores numéricos. Cada número nos dice qué valor tenía la señal en cada instante de tiempo.

La señal digital de sonido se almacena en un fichero. Por ejemplo el fichero puede contener una de las versiones de la canción o la versión final una vez editada.

El fichero con la canción lo descarga otra persona, el productor musical por ejemplo.

Su reproductor decodifica la señal y la convierte de nuevo en señal analógica.

La señal analógica se amplifica y se envía a unos altavoces o a unos auriculares, que la transforman en sonido…

 

En este artículo vamos a comentar simplemente algunos conceptos y terminología relacionada con el mundo del audio. Como ocurre con otros campos, los nombres y las formas de hacer las cosas vienen muchas veces heredados de una evolución histórica y tecnológica.

A veces, entender de dónde vienen las cosas nos ayuda a entender mejor cómo funcionan.

 

Los decibelios (dB)

El oído humano es capaz de detectar sonido en una escala muy amplia de intensidades (rango dinámico muy amplio).

La intensidad mínima estaría sobre los 20uPa (micro pascales, unidad de presión, presión sonora en este caso) y la intensidad máxima estaría alrededor de los 20Pa en el límite de romper nuestros tímpanos.

La sensación auditiva, en la que interviene tanto el oído como el cerebro, no es lineal. La sensación auditiva sigue una escala aproximadamente logarítmica.

Parece lógico pensar que para medir cosas relacionadas con el sonido se utilice también una escala logarítmica.

Inicialmente se utilizó el bel (B), en honor a Graham Bell como unidad, pero es demasiado grande para su uso práctico, así que se utiliza el decibelio (dB)

El decibelio siempre representa una relación entre dos valores, no es una medida absoluta.

Se utiliza para representar las relaciones entre dos potencias, dos amplitudes, dos valores de presión sonora…

Cuando se usa para relacionar potencias, se calcula como 10 log (p1/p2) 

Cuando se usa para relacionar amplitudes eléctricas (voltaje, intensidad) o presión sonora, se calcula como 20 log (valor1/valor2)

 

Sumar y restar

Una de las ventajas de utilizar decibelios (escala logarítmica) es que nos permite trabajar con números más sencillos y además todos los procesos que tengan que ver con multiplicar (amplificar) o dividir (atenuar) se calculan sumando y restando.

Por ejemplo, un amplificador de 6dB es aquel que multiplica la amplitud de la señal de entrada por 2. Es decir, la señal de salida es el doble de la de entrada. Se dice que la ganancia es 2 (sin unidad) o que la ganancia es de 6dB.

Un amplificador de 20dB se corresponde con una ganancia de 10x (una señal de salida con amplitud 10 veces mayor que la de entrada).

Si se trata de un atenuador o un dispositivo con pérdidas, la ganancia será negativa. Por ejemplo -6dB correspondería con una amplitud de salida que es la mitad que la de entrada.

A lo largo de la cadena que recorre la señal eléctrica nos podemos encontrar con varios amplificadores, atenuadores, pérdidas…

Trabajando con decibelios simplemente tenemos que ir sumando y restando con números sencillos.

 

Los decibelios como medida absoluta

Los decibelios siempre, siempre, siempre miden una relación entre dos cantidades A y B.

Si tomamos un cierto valor como referencia, entonces podemos trabajar con decibelios en una escala de valores absolutos. En ese caso hay que indicar qué valor estamos tomando como referencia.

Para no tener que indicar siempre el valor de referencia se crearon decenas (cientos quizás) de apellidos para los decibelios. Cada dB con ‘apellido’ lleva asociado un valor de referencia implícito.

Ejemplos muy usados en el mundo del sonido.

 

dBSPL o dB(SPL)

Se utilizan para medir la presión sonora (SPL = Sound Pressure Level)

Se toma como referencia la presión sonora mínima que detecta el oído humano: 20uPa (20 micro pascales)

Por lo tanto, un sonido con una presión sonora de 20uPa se corresponde con 0 dBSPL

En esa escala absoluta, el rango de audición humana iría de 0 dBSPL a unos 120-140 dBSPL donde estaría el umbral de dolor y riesgo de dañar los tímpanos.

 

 

dBA 

También hace referencia a la presión sonora, pero ponderada para cada frecuencia del espectro (ya que el oído humano tiene diferente sensibilidad a diferentes frecuencias).

A esta escala se la llama también dB (SPL A-weitghted). Por lo demás hace referencia a la misma escala de presión.

 

dBV

Se toma como referencia 1 voltio (1 V)

Por lo tanto, una señal de 0 dBV se corresponde con una señal de 1 V

Una señal de 6 dBV correspondería con una señal de 2 V

Una señal de -6 dBV correspondería con una señal de 0.5 V

Y -10 dBV se corresponde con una señal de unos 0.316 V

 

dBu

Por razones históricas se toma como referencia una señal de 0.775 voltios (0.775 V)

Así que por ejemplo 4dBu se corresponde con una señal de unos 1.23V

 

dBFS

Es una escala para la señal de sonido digital (FS = Full Scale)

En la señal digital cada muestra (cada instante) tiene un valor entero que va desde 0 hasta el valor máximo correspondiente al número de bits que estemos utilizando.

Por ejemplo, si se utiliza una codificación de 16 bits el valor máximo posible es 65535.

En ese entorno digital no hay ningún valor de señal que pueda ser menor que cero ni mayor que el valor máximo.

La escala dBFS toma como referencia ese valor máximo (65535 en el caso de 16 bits)

Por lo tanto el valor 0 dbFS se corresponde con el máximo posible. Todos los demás posibles valores estarán por debajo. Es una escala de valores negativos.

Si hacemos cualquier operación con la señal digital que implique superar esos 0dBFS la señal quedará truncada, quedará cortada (clipping). Y el resultado será una señal de sonido distorsionada (distorsión no lineal).

 

 

Los niveles de entrada: MIC, LINE, INST…

Cada elemento dentro de la cadena por la que pasa la señal de audio está preparado para trabajar con unos determinados niveles de señal (amplitud o valores medios)

Es importante entender qué niveles estamos usando en cada momento a la hora de conectar equipos de sonido y accesorios.

 

MIC – Micrófonos

Los micrófonos generan una señal eléctrica muy muy muy pequeña.

La sensibilidad de los micrófonos se suele medir en dBV para un determinado nivel de sonido de referencia. Se suele tomar como referencia 1 Pa (1 pascal de presión sonora), que se corresponde con 94 dB(SPL)

Por ejemplo, un micrófono típico de condensador puede estar en -40 dBV / Pa ( -40 dBV / 94 dB SPL).  Es decir, con ese nivel de sonido (que equivale al de emite un taladro eléctrico) estaría generando una señal de unos 0.01 V (10 mV – milivoltios)

Un micrófono dinámico (p.e. el Shure SM7B) tiene una sensibilidad de -60 dBV /Pa, que se corresponde con una señal de aproximadamente 0.0001 V (1 milivoltio)

 

La entrada MIC de una etapa de sonido (p.e. una interfaz de audio) siempre va conectada a un preamplificador, que se encarga de subir el nivel de la señal hasta los valores adecuados para que las siguientes etapas puedan trabajar correctamente.

También puedes intuir que con señales tan pequeñas cualquier ruido electrónico o interferencia que se cuele en los cables del micrófono va a tener un nivel no despreciable con respecto a la señal.

Por eso es tan importante cuidar esta parte de la cadena: se usan cables balanceados y los preamplificadores tienen que ser muy limpios para no introducir ruido electrónico adicional.

 

LINE – Línea

El nivel de línea es el estándar con el que se comunican los equipos de sonido entre sí.

Por ejemplo para conectar la salida de una mesa de mezclas con la entrada de una interfaz de audio, para conectar un sintetizador con la mesa de mezclas, etc.

Hay dos niveles de línea estandarizados, uno para equipos profesionales y otro para electrónica de consumo.

El nivel de línea para equipos profesionales es de +4dBu  (aproximadamente 1.23 V)

El nivel de línea para equipos de electrónica de consumo es de -10dBV (aproximadamente 0.326 V)

 

INST / Hi Z –  Instrumentos

Esta sería la señal que llega de guitarras eléctricas y bajos fundamentalmente.

Los niveles son un poco más altos que los de los micrófonos pero no llegan al nivel de línea.

Dependiendo del equipo, la entrada INST (también puede estar marcada como de alta impedancia Hi Z) puede ir a un preamplificador independiente del de la entrada MIC.

Este nivel realmente no es un estándar. Cada instrumento puede dar unos niveles de señal muy diferentes.

 

 

Cables balanceados

Más que cables balanceados, sería señal balanceada o sistemas balanceados, porque el cable en sí no hace nada.

Los cables, cualquier hilo conductor, actúan como antenas que recogen ondas electromagnéticas de determinadas longitudes de onda y las convierten en señales eléctricas (ruido en este caso, ya que interfiere con la señal útil)

Cuanto más largo es el cable más probabilidades hay de que recoja interferencias del exterior.

Para eliminar este ruido por interferencias se utiliza una técnica muy sencilla pero muy eficiente: la línea balanceada.

En una línea balanceada se utilizan 3 cables para transmitir una única señal (un único canal)

Uno de los cables, que suele tener forma de malla alrededor de los otros dos, es el neutro (masa).

Otro de los cables es el positivo (se le llama terminal caliente) y por él se transmite la señal tal cual.

El otro cable es el negativo (terminal frío) y por él se transmite la misma señal, pero invertida (desfasada 180º).

Los cables positivo y negativo suelen ir trenzados para que estén expuestos exactamente a las mismas interferencias electromagnéticas a lo largo de su recorrido.

En el receptor se coge la señal del negativo, se invierte de nuevo y se suma con la señal del positivo.

El resultado es que tenemos una señal con el doble de amplitud.

Mientras que el ruido que ha generado cada cable por separado, al sumarse en contrafase se anula completamente (siempre quedará un ruido residual pero muy pequeño)

Señal balanceada desde un micrófono hasta un equipo de sonido

 

Para que la línea sea balanceada el equipo emisor tiene que tener un circuito que balancee la señal.

El equipo receptor tiene que tener un circuito que recupere la señal balanceada (invertir y sumar).

Y los dos tienen que estar conectados por un cable balanceado (3 hilos).

 

 

Conectores, entradas y salidas

En equipos de sonido profesionales se utilizan básicamente dos tipos de conectores: XLR + jack 1/4

  • Conector XLR (también se conoce como Cannon)
  • Conector jack de 1/4 de pulgada (6.35mm) TRS balanceado (también se le conoce como estéreo)
  • Conector jack de 1/4 de pulgada TS no balanceado (mono)

 

En equipos de electrónica de consumo:

  • Conector jack 3.5mm TRS (estéreo)
  • Conector jack 3.5mm TRRS (estéreo + micrófono, se usa sobre todo en móviles)
  • Conector jack 2.5mm TRS
  • Conectores RCA

 

Conector XLR

El conector XLR se utiliza normalmente con líneas balanceadas.

 

Conectores XLR con salida balanceada

Es el conector que usan habitualmente los micrófonos de estudio.

En los equipos de sonido que trabajan con micrófonos, por ejemplo una mesa de mezclas o una interfaz de audio, las entradas XLR tienen la opción de activar la alimentación (phantom power, habitualmente 48V) para los micrófonos de condensador.

 

Conector jack 1/4

El conector jack de 1/4 se suele utilizar con entradas balanceadas de línea (LINE) y de alta impedancia (INST / Hi Z).

Tipos de conectores jack para sonido

También puede haber entradas o salidas no balanceadas (conector TS)

Las entradas jack de 1/4 no llevan alimentación phantom.

 

Conector múltiple / híbrido

Algunos equipos, por ejemplo las interfaces de sonido, suelen incluir conectores multipropósito.

Entradas híbridas: XLR + jack 1/4 | MIC + LINE + INST

 

Estos conectores funcionan de la siguiente forma:

  • Si se enchufa un conector XLR corresponde normalmente con la entrada MIC y la señal pasaría directamente al preamplificador de micrófono. Se puede activar o desactivar la alimentación phantom power.
  • Si se enchufa en el centro un conector jack de 1/4, normalmente se corresponderá con una señal de línea (LINE) o una señal de instrumento (MIC / Hi Z). Para elegir entre un tipo u otro de señal se utiliza un selector manual (o una opción de menú dependiendo del equipo). Este conector central no lleva alimentación phantom power.

 

 

Phantom power

Los micrófonos de condensador necesitan una fuente de alimentación.

Esa alimentación se utiliza para polarizar el condensador y para dar energía a la electrónica integrada del propio micrófono.

Los micrófonos de condensador de tipo electret tienen un condensador polarizado permanentemente (polarizado de fábrica) pero la mayoría de ellos siguen necesitando alimentación para su electrónica interna

En los equipos de sonido la alimentación phantom se incluye sólo en los conectores de entrada XLR. Dependiendo del modelo se podrá activar para todos los conectores XLR, por grupos de conectores o de forma independiente para canal de entrada XLR.

Por razones históricas se utiliza una alimentación de 48V (la mayoría de circuitos electrónicos modernos trabajan con tensiones mucho más bajas)

 

¿Qué pasa si conecto un micrófono dinámico en una entrada XLR con phantom power activado?

No pasa nada.

El micrófono dinámico no necesita alimentación pero tampoco resultará dañado si está activada

De todas formas es recomendable desactivar la alimentación cuando no la estemos utilizando.

 

 

Ganancia vs volumen

El volumen nos habla de la amplitud de las ondas de presión sonoras. Es una característica del sonido.

La ganancia nos habla de la relación de amplitudes entre una señal de entrada y una señal de salida. Es una característica que tiene que ver con la señal eléctrica o digital de audio.

En todo el proceso de grabación y edición de sonido está presente la ganancia, muchas ganancias de hecho: la ganancia del preamplificador, la ganancia de cada canal a la hora de hacer una mezcla, la ganancia del master…

La ganancia tiene que ver con señales.

Cuando esa señal la sacamos a un altavoz o unos auriculares se transforma en sonido.

Y a ese sonido le podemos subir o bajar el volumen (para que suene más o menos fuerte).

El volumen tiene que ver con el sonido.

 

Para entenderlo con un ejemplo:

Imagina que estás grabando desde un micrófono a una grabadora digital. A la grabadora le conectas unos auriculares para monitorizar el sonido.

Cuando subes la ganancia ves que las barras de nivel del vúmetro digital suben (aumenta la amplitud de la señal) y también notas que el sonido se escucha más fuerte (más volumen) en tus auriculares.

Ahora, manteniendo la ganancia baja el volumen de monitorización. La ganancia de la señal y su amplitud sigue siendo la misma. Sin embargo el volumen del sonido que llega a tus oídos ha disminuido.

 

 

dbVU, dBFS y techo dinámico de la señal (headroom)

Cuando se amplifica una señal eléctrica, por ejemplo la señal que genera un micrófono, hay que tener en cuenta dos factores que nos van a limitar:

  • Si la amplificamos muy poco es posible que no destaque lo suficiente con respecto al ruido electrónico del equipo (noise floor). Su relación señal a ruido (SNR – Signal to Noise Ratio) será pequeña y ese ruido llegará a las etapas finales y será apreciable.
  • Si la amplificamos mucho llegará un momento en que el amplificador comenzará a trabajar en una zona no lineal. El resultado será una señal con distorsión (soft clipping).
  • Si seguimos amplificando más o llega al micrófono un sonido más fuerte, el amplificador se saturará para esos niveles tan altos. Simplemente no puede dar a su salida la amplitud que correspondería a multiplicar la entrada por su ganancia. Esos picos de señal aparecerán cortados (hard clipping)

 

Soft clipping vs Hard clipping - Ganancia

 

Lo que hay que buscar es lo que se conoce como punto dulce (sweet spot).

Una ganancia tal que la señal tiene una amplitud media bastante por encima del ruido pero que queda en una zona de trabajo lineal del amplificador, con margen suficiente por si entran sonidos más altos en algún instante (señales de mayor amplitud a la entrada)

El nivel de trabajo en equipos profesionales se corresponde con el nivel de +4dBu que hemos comentado anteriormente, el nivel de línea (LINE).

Si hemos conectado un micrófono a un preamplificador, lo que buscamos es subir el nivel medio de la señal de sonido hasta esos 4dBu (aprox. 1.23 V RMS)

Ese nivel medio (4dBu) sería la referencia de 0 dBVU de un vúmetro (VU Meter en inglés, donde VU= Volume Unit)

Un vúmetro es un aparato de medida analógico diseñado específicamente para medir la amplitud media de la señal de audio.

El techo dinámico (headroom) es el margen que queda por encima de ese nivel medio antes de que el amplificador comience a distorsionar.

Si estamos grabando un sonido con poco rango dinámico (poca variación entre los sonidos más fuertes y los más débiles) podemos subir el nivel medio hasta esos 0 dBVU a costa de reducir el techo dinámico.

Si es un sonido con variaciones muy grandes de la amplitud de la señal tendremos que bajar el nivel medio (la ganancia del preamplificador) para tener un techo dinámico más amplio que pueda absorber esos picos sin llegar a la zona de distorsión.

 

Señal digital

Cuando pasamos a la señal digital se aplican los mismos criterios.

La señal digital se puede amplificar linealmente (es una operación matemática con números) hasta una amplitud máxima que corresponde con el máximo número entero posible para esa codificación.

Por ejemplo, si trabajamos con 16 bits ningún valor puede ser mayor de 65535. Si amplificamos una señal digital de tal forma que la amplitud de salida supera (teóricamente) ese máximo, lo que haremos será truncar los picos de esa señal de salida (hard clipping), distorsionando el sonido que representa la señal.

En la parte digital se utiliza la escala dBFS (Full Scale) en la que 0 dBFS es la máxima amplitud que puede tener una señal según la codificación que estemos usando.

Por encima de 0 dBFS no hay nada, todas las amplitudes o niveles medios de la señal digital son siempre negativos.

Si una señal ‘supera’ los 0 dBFS queda cortada (clipping) y se convertiría en una señal distorsionada.

Como ocurría con la señal eléctrica, tenemos que encontrar el nivel ideal que nos dé la máxima relación señal ruido pero que nos dé margen (sobre todo en grabación) para que puedan entrar sonidos con mayor amplitud.

 

¿Qué correspondencia hay entre el nivel de 0 dBVU (cero del vúmetro) y la escala dBFS?

La correspondencia depende de la salida que nos dé el conversor analógico digital (ADC) de la interfaz de sonido que estemos usando.

Normalmente 0 dBVU se corresponde con unos -18 dBFS o -20dBFS

 

En esta figura se representa la relación entre la parte analógica (tratamiento de señales eléctricas) y la parte digital.

Relación entre escalas de niveles de sonido

 

El nivel de referencia en analógico sería +4dBu (aprox. 1.23V en valores medios RMS)

Si se utiliza un vúmetro (un vúmetro analógico para medir señal eléctrica) estará calibrado para que el cero del vúmetro (0 dBVU) coincida con la señal de referencia -4dBu.

Cuando la señal se convierte a digital trabajamos con la escala dBFS.

El nivel de referencia (LINE) en dBFS depende de la calibración del conversor analógico digital. Suele ser -18 dBFS o -20dBFS

Por ejemplo, si grabamos una señal con ese nivel medio de -18 dBFS tendremos en digital un techo dinámico de 18 dB.

Es decir, tendríamos un margen (headroom) de 18dB para el caso de que el micrófono recoja picos de sonidos más fuertes.

 

 

Niveles de señal recomendados para grabar sonido

Tenemos un micrófono y vamos a grabar un sonido, por ejemplo una persona que habla.

¿Cómo ajustamos el nivel de nuestro equipo de grabación para que la calidad de sonido sea óptima?

 

Niveles de grabación de audio

 

El nivel óptimo para la señal digital estaría en la zona que va de  -20dBFS a -12dBFS  para tener una buena relación señal ruido y parar tener un techo dinámico suficiente que nos cubra en caso de picos de sonido.

Ten en cuenta que eso serían niveles medios (RMS – root mean square)

Cuando estamos configurando nuestro equipo de grabación tenemos que ver tanto los niveles medios de la señal (p.e. cuando la persona al micrófono está hablando de forma normal) como los posibles picos de señal (p.e. si la persona habla más fuerte, hay aplausos..)

No podemos prever cuáles serán los picos máximos, así que tenemos que dejar ese margen que se suele conocer como headroom (techo dinámico en castellano, aunque creo que todo el mundo usa el término en inglés)

Ten en cuenta que llegar a 0 dBFS (clipping o clipeo) en digital equivale a introducir una distorsión muy molesta que no se puede corregir en edición.

Para grabar voz se suele seguir la regla de mantener los picos de señal entre -12 dBFS y -10dBFS  (fíjate que ahora hablamos de picos, de amplitudes máximas, no de nivel medio)

Si estás grabando en una situación en la que no prevés ningún pico grande de sonido , pues se podría apurar un poco más. La marca de los -6 dBFS creo que sería el máximo recomendado, porque ya da poco margen (headroom muy pequeño)

 

Ten en cuenta también que las pruebas de sonido que hagas para configurar los niveles medios y los picos hay que hacerlas con el micrófono situado en la misma posición en la que luego va a grabar.

La distancia entre el micrófono y la fuente de sonido influye muchísimo en el nivel de señal (la intensidad sonora disminuye con el cuadrado de la distancia). Si calibramos nuestro equipo y luego por lo que sea decidimos acercar más el micrófono, toda esa configuración inicial no valdrá para nada.