Cómo funciona el enfoque automático en las cámaras

El sistema de enfoque automático de una cámara es actualmente una de las funciones más importantes y más valoradas.

En esta entrada veremos de una forma sencilla cómo funcionan los diferentes sistemas, la tecnología que utilizan y sus puntos fuertes y débiles.

Cómo funciona el enfoque automático en las cámaras
Foto: Nathan O’Nions (CC BY 2.0)

En la entrada sobre la profundidad de campo vimos que en fotografía se considera que un elemento de la escena está enfocado cuando los puntos de la imagen que corresponden a ese elemento son muy pequeños (forman un círculo de confusión tan pequeño que el ojo humano lo ve como un punto)

En la práctica, cuando vemos una imagen, los elementos enfocados aparecen con mucho contraste, se aprecian muy bien sus bordes, sus líneas, las separaciones entre sus partes, son nítidas y diferenciadas. Los elementos que no están enfocados aparecen más borrosos, hasta el punto que pueden llegar a ser irreconocibles.

El proceso de enfoque implica el movimiento de la lente con respecto al plano del sensor:

Cómo funciona el enfoque en cámaras

 

En el caso de una lente simple, cuando alejamos la lente del sensor enfocamos objetos más cercanos. Si acercamos la lente al sensor enfocamos objetos más lejanos. Llegará un momento en que el foco de la lente coincide con el plano del sensor, en ese caso estaremos enfocando a infinito: todos los objetos lejanos (a partir de una cierta distancia) estarán enfocados.

Cómo enfocan las cámaras. Enfoque a infinito

 

En el otro extremo, para enfocar objetos muy cercanos a la cámara, la lente se tiene que separar del plano del sensor. En fotografía macro (fotografía de objetos muy pequeños) se utilizan objetivos específicos que permiten enfocar desde muy cerca o se usan tubos de extensión con objetivos normales para ‘alejar’ el centro óptico y permitir que podamos enfocar muy próximos al objeto.

Los objetivos de las cámaras están formados por un sistema de lentes, pero el principio de enfoque es el mismo. Lo que suele ocurrir es que dentro del objetivo no se mueven todas las lentes sino un grupo de lentes especializado cuyo ajuste equivale a desplazar el centro óptico del sistema.

En las cámaras de objetivos intercambiables (cámaras réflex y cámaras sin espejo), muchos objetivos incluyen un anillo de enfoque manual.

 

El enfoque automático

Las primeras cámaras con enfoque automático surgieron alrededor de 1980. En la actualidad todas las cámaras incluyen sistemas de enfoque automático, muchas de ellas sin posibilidad de enfoque manual.

El sistema de enfoque automático funciona de la siguiente forma:

Enfoque automático en cámaras digitales

La cámara incorpora un detector que analiza normalmente una parte pequeña de la imagen (la zona de la escena que se desea enfocar)

El sistema electrónico decide si ese trozo de imagen tiene contraste o si está borroso. Habitualmente el contraste se detecta a partir de transiciones bruscas entre elementos de la escena: bordes, líneas, texturas..

Si el sistema determina que la imagen está borrosa envía la orden de mover ligeramente la lente de enfoque. Y vuelve a evaluar.

Llega un momento en que el sistema determina que ha conseguido el máximo contraste, el máximo enfoque, para la zona que deseamos enfocar.

¿Cómo es el sistema de enfoque ideal?

  • Consigue el enfoque muy rápido, cuanto más rápido mejor, idealmente instantáneo
  • Consigue un enfoque preciso en el punto de la escena que deseamos enfocar
  • Consigue enfocar en cualquier circunstancia

Ese sistema ideal no existe, aunque los sistemas de enfoque son cada vez más rápidos, más precisos y más polivalentes.

También hay que saber que la velocidad de enfoque depende de todo el sistema en su conjunto: precisión del detector, algoritmo de ajuste de la posición de las lentes (cómo y cuánto se tiene que mover la lente), velocidad y precisión del motor de enfoque.. Y también depende de las condiciones externas: cantidad de luz en la escena, textura del objeto que enfocamos..

Vamos a ver cuáles son las técnicas que se utilizan actualmente en los sistemas de enfoque, con sus pros y contras.

 

Enfoque por detección de fase (réflex)

Es el sistema que utilizan la mayoría de cámaras réflex.

El espejo de las cámaras réflex está formado en realidad por dos espejos. El espejo principal envía la imagen al visor óptico, pero es un espejo que deja pasar cierta cantidad de luz a un segundo espejo, llamado espejo secundario o sub-espejo, que refleja la imagen hacia el detector de fase.

 

Sistema de enfoque por detección de fase

El detector de fase es un sensor de luz, que funciona de forma parecida al sensor de imagen. Este sensor sin embargo sólo recibe una parte muy pequeña de la escena, por ejemplo una zona del centro de la imagen (o la zona indicada por el punto de enfoque seleccionado en la cámara).

El sensor de enfoque está especializado en detectar transiciones de luz de la escena, por ejemplo un borde de un objeto, una línea, una textura.. algo que genere un contraste entre dos puntos de luz. Esta transición se convierte en una señal eléctrica, que podríamos imaginar como un pico.

Por cada punto de enfoque hay dos sensores separados que hacen una triangulación. Cada uno de ellos recibe la misma imagen de la zona que queremos enfocar. Cuando la imagen está enfocada los picos de las dos señales eléctricas coinciden. Cuando la imagen está desenfocada, los picos no coinciden y el sistema electrónico puede calcular exactamente hacia dónde tiene que mover la lente y lo lejos que estamos del punto de enfoque.

Algunos puntos de enfoque sólo detectan transiciones verticales (líneas o bordes verticales de la escena), otros sólo transiciones horizontales y algunos puntos de enfoque detectan ambas, son los llamados puntos de enfoque en cruz (cross type AF point).

El sistema de enfoque por detección de fase es muy rápido y bastante preciso. Como se conoce en todo momento hacia dónde se tiene que mover la lente es un sistema que funciona muy bien tanto para enfoque rápido como para seguimiento de objetos en movimiento, ya que la parte electrónica puede introducir incluso cierto margen de predicción.

Para que la detección de fase funcione correctamente se necesita cierta cantidad de luz en la escena. También es necesario que la escena contenga esas líneas horizontales o verticales, bordes.. en definitiva que la escena (al menos en el punto de enfoque) tenga cierta textura.

Una de las desventajas del sistema es su complejidad de construcción. El problema viene porque los sensores de detección de fase están situados en un plano diferente del sensor de imagen. No detectan exactamente lo que llega al sensor principal, son elementos independientes, y por lo tanto todo el sistema tiene que estar perfectamente construido (parte mecánica) y sincronizado (parte mecánica y electrónica). Cada cámara, una por una, tiene que ser calibrada con una gran precisión, de lo contrario presentará problemas de back focus o front focus, es decir, todas las imágenes aparecerán desenfocadas.

Otro problema del enfoque por detección de fase tradicional en las réflex es que cuando el espejo está levantado este sistema deja de estar operativo. Por ese motivo, cuando usamos la pantalla (live view) para fotografía en lugar del visor óptico el enfoque suele ser más lento, y a veces mucho más lento dependiendo de la cámara. Y lo mismo ocurre cuando se usa la cámara réflex para vídeo, ya que el espejo permanece levantado todo el tiempo.

 

Enfoque por detección de contraste

Es el sistema que utilizan la mayoría de las cámaras compactas y muchas réflex cuando trabajan en modo live view (a través de la pantalla). Desde el punto de vista técnico es un sistema muy sencillo, no necesita elementos externos, ni sensores adicionales, ni electrónica compleja, ni calibración..

Una vez seleccionamos la zona que queremos enfocar en la escena, el procesador la analiza directamente a partir de la imagen generada por el sensor.

El sistema hace un barrido, moviendo la lente de enfoque, y en cada posición calcula el nivel de contraste de la imagen. El barrido se detiene cuando se determina dónde está situado el máximo nivel de contraste y el procesador mueve la lente hasta esa posición.

En principio es un proceso de prueba y error, porque el sistema no sabe hacia dónde debe mover la lente, ni cuánto tiene que moverla, y por lo tanto es un proceso relativamente lento comparado con la detección de fase. El movimiento de enfoque por detección de contraste tradicional es típico: recorrido hacia adelante de la lente, recorrido hacia atrás, un poco hacia adelante..  una especie de vaivén hasta que consigue el enfoque.

Sin embargo la detección por contraste también tiene ventajas:

  • El plano de enfoque es el plano del sensor, no hay problemas de back focus / front focus. Es un proceso que se realimenta a sí mismo, por lo tanto cuando se consigue el enfoque suele ser muy preciso (máximo contraste)
  • No hay necesidad de puntos de enfoque específicos, se puede enfocar usando cualquier zona de la imagen
  • Se puede conseguir enfoque con menos luz en la escena
  • Puede encontrar el enfoque en escenas donde no hay bordes verticales / horizontales muy definidos
  • Se pueden aplicar algoritmos predictivos y de reconocimiento muy complejos, por ejemplo reconocimiento de caras para enfoque más rápido y para seguimiento

 

Enfoque híbrido integrado en el sensor

Éste es probablemente el sistema del futuro, que ya se utiliza en prácticamente todas las cámaras actuales con diferentes variantes.

La idea es muy sencilla: en lugar de usar un sensor independiente para hacer detección de fase, ¿por qué no utilizar el propio sensor de imagen?

Los sensores de imagen que utilizan tecnología híbrida incluyen zonas (píxeles) dedicadas exclusivamente a la detección de fase. Estos píxeles especiales se distribuyen a lo largo del área del sensor.

Puede haber muchas zonas de detección de fase en el sensor. Por ejemplo la cámara EVIL (mirrorless) Sony a6000 incluye 179 puntos de detección de fase a lo largo de toda el área de su sensor APS-C.

En general, estos detectores de fase integrados en el sensor de imagen no son tan efectivos como los detectores de fase independientes de las réflex. Hay que pensar que los detectores independientes son sensores especializados, con una electrónica muy específica y muy rápida, una óptica interna también optimizada para la detección de fase y una separación entre pares que permite una triangulación más precisa.

Pero la ventaja del sistema híbrido es que los detectores de fase se encuentran exactamente en el plano del sensor (forman parte del mismo). No hay problemas de errores de calibración.

Otra gran ventaja es que las dos técnicas de enfoque se pueden combinar. La detección de fase indica al procesador hacia dónde tiene que mover la lente y la detección de contraste se encarga de afinar el enfoque y conseguir el mayor contraste posible.

Además se pueden implementar algoritmos de predicción muy potentes, que utilizan por ejemplo muchos puntos de detección de fase a la vez y muchas zonas de detección de contraste.

Todos los fabricantes están desarrollando nuevas tecnologías y algoritmos basados en detección híbrida de fase / contraste. La velocidad y precisión de enfoque es cada vez mayor.

 

Enfoque Dual Pixel CMOS

Esta tecnología de Canon es básicamente un sistema de enfoque por detección de fase integrado en el sensor de imagen, en el que todos los píxeles del sensor se utilizan para enfoque por detección de fase.

Cada píxel del sensor está en realidad formado por dos píxeles (dos fotodiodos) independientes, cada uno de ellos con su propia micro-lente.

En el momento de enfocar, cada par de píxeles (de la zona que estamos enfocando) funciona como un detector de fase y permite triangular la distancia al objeto y enfocar.

Cuando se pulsa el botón de disparo, cada par de píxeles se combina para generar la información de la imagen, como si se tratara de un único foto-diodo.

Este tipo de enfoque funciona muy bien por ejemplo para vídeo, para seguimiento de objetos. Una vez está ‘enganchado’ el objeto que queremos enfocar permite hacer un seguimiento  bastante preciso y rápido a lo largo de toda la escena ya que los ‘puntos de enfoque’ están distribuidos por todo el sensor.

El sistema Dual Pixel no es tan rápido como el enfoque por detección de fase tradicional. Por las mismas razones que comentamos en el enfoque híbrido: el detector de fase independiente está optimizado para esta tarea y la separación física de cada par de sensores hace más sencilla la triangulación.

Otro inconveniente es el precio. Construir un sensor Dual Pixel es más caro que construir un sensor tradicional o un sensor híbrido (Hybrid CMOS).

Un ejemplo de cámara con sensor Dual Pixel es la Canon EOS 70D, una de las mejores cámaras réflex para grabación de vídeo.