El registro de imágenes es el proceso de transformar diferentes conjuntos de datos en un sistema de coordenadas. Los datos pueden ser múltiples fotografías, datos de diferentes sensores, tiempos, profundidades o puntos de vista. [1] Se utiliza en visión artificial , imágenes médicas , [2] reconocimiento automático de objetivos militares y recopilación y análisis de imágenes y datos de satélites. El registro es necesario para poder comparar o integrar los datos obtenidos a partir de estas diferentes mediciones.
Los algoritmos de registro o alineación de imágenes se pueden clasificar en basados en intensidad y basados en características. [3] Una de las imágenes se denomina en movimiento o fuente y las otras se denominan imágenes objetivo , fijas o detectadas . El registro de imágenes implica la transformación espacial de la(s) imagen(es) de origen/en movimiento para alinearlas con la imagen objetivo. El marco de referencia en la imagen objetivo es estacionario, mientras que los otros conjuntos de datos se transforman para que coincidan con el objetivo. [3] Los métodos basados en la intensidad comparan patrones de intensidad en imágenes a través de métricas de correlación, mientras que los métodos basados en características encuentran correspondencia entre características de la imagen, como puntos, líneas y contornos. [3] Los métodos basados en la intensidad registran imágenes completas o subimágenes. Si se registran subimágenes, los centros de las subimágenes correspondientes se tratan como puntos de características correspondientes. Los métodos basados en características establecen una correspondencia entre una serie de puntos especialmente distintos en las imágenes. Conociendo la correspondencia entre una serie de puntos en las imágenes, se determina una transformación geométrica para mapear la imagen objetivo a las imágenes de referencia, estableciendo así una correspondencia punto por punto entre las imágenes de referencia y objetivo. [3] También se han desarrollado métodos que combinan información basada en la intensidad y en las características. [4]
Los algoritmos de registro de imágenes también se pueden clasificar según los modelos de transformación que utilizan para relacionar el espacio de la imagen de destino con el espacio de la imagen de referencia. La primera categoría amplia de modelos de transformación incluye las transformaciones lineales , que incluyen rotación, escalado, traslación y otras transformaciones afines. [5] Las transformaciones lineales son de naturaleza global, por lo tanto, no pueden modelar diferencias geométricas locales entre imágenes. [3]
La segunda categoría de transformaciones permite transformaciones "elásticas" o "no rígidas". Estas transformaciones son capaces de deformar localmente la imagen de destino para alinearla con la imagen de referencia. Las transformaciones no rígidas incluyen funciones de base radial ( splines de superficie o de placa delgada , multiquadricas y transformaciones con soporte compacto [3] ), modelos físicos continuos (fluidos viscosos) y modelos de deformación grande ( difeomorfismos ).
Las transformaciones se describen comúnmente mediante una parametrización, donde el modelo dicta el número de parámetros. Por ejemplo, la traducción de una imagen completa se puede describir mediante un único parámetro, un vector de traducción. Estos modelos se denominan modelos paramétricos. Los modelos no paramétricos, por otro lado, no siguen ninguna parametrización, lo que permite que cada elemento de la imagen se desplace arbitrariamente. [6]
Existen varios programas que implementan tanto la estimación como la aplicación de un campo de deformación. Es parte de los programas SPM y AIR .
Alternativamente, muchos métodos avanzados para la normalización espacial se basan en transformaciones que preservan la estructura, homeomorfismos y difeomorfismos, ya que llevan subvariedades suaves sin problemas durante la transformación. Los difeomorfismos se generan en el campo moderno de la Anatomía Computacional con base en flujos, ya que los difeomorfismos no son aditivos aunque forman un grupo, sino un grupo bajo la ley de composición de funciones. Por esta razón, los flujos que generalizan las ideas de los grupos aditivos permiten generar grandes deformaciones que preservan la topología, proporcionando transformaciones 1-1 y sobre. Los métodos computacionales para generar dicha transformación a menudo se denominan LDDMM [7] [8] [9] [10] que proporcionan flujos de difeomorfismos como la principal herramienta computacional para conectar sistemas de coordenadas correspondientes a los flujos geodésicos de la Anatomía Computacional .
Hay varios programas que generan transformaciones difeomórficas de coordenadas a través del mapeo difeomórfico, incluidos MRI Studio [11] y MRI Cloud.org [12].
Los métodos espaciales operan en el dominio de las imágenes, haciendo coincidir patrones de intensidad o características en las imágenes. Algunos de los algoritmos de coincidencia de características son el resultado de técnicas tradicionales para realizar el registro manual de imágenes, en el que un operador elige los puntos de control (CP) correspondientes en las imágenes. Cuando el número de puntos de control excede el mínimo requerido para definir el modelo de transformación apropiado, se pueden utilizar algoritmos iterativos como RANSAC para estimar de manera robusta los parámetros de un tipo de transformación particular (por ejemplo, afín) para el registro de las imágenes.
Los métodos de dominio de frecuencia encuentran los parámetros de transformación para el registro de las imágenes mientras trabajan en el dominio de transformación. Dichos métodos funcionan para transformaciones simples, como la traslación, la rotación y el escalado. La aplicación del método de correlación de fase a un par de imágenes produce una tercera imagen que contiene un solo pico. La ubicación de este pico corresponde a la traslación relativa entre las imágenes. A diferencia de muchos algoritmos de dominio espacial, el método de correlación de fase es resistente al ruido, las oclusiones y otros defectos típicos de las imágenes médicas o satelitales. Además, la correlación de fase utiliza la transformada rápida de Fourier para calcular la correlación cruzada entre las dos imágenes, lo que generalmente da como resultado grandes ganancias de rendimiento. El método se puede ampliar para determinar las diferencias de rotación y escalado entre dos imágenes convirtiendo primero las imágenes a coordenadas log-polares . [13] [14] Debido a las propiedades de la transformada de Fourier , los parámetros de rotación y escalado se pueden determinar de una manera invariante a la traslación.
Se puede hacer otra clasificación entre métodos monomodales y multimodales. Los métodos monomodales tienden a registrar imágenes en la misma modalidad adquiridas por el mismo tipo de escáner/sensor, mientras que los métodos de registro multimodal tienden a registrar imágenes adquiridas por diferentes tipos de escáner/sensor.
Los métodos de registro multimodal se utilizan a menudo en el diagnóstico por imágenes médicas, ya que las imágenes de un sujeto se obtienen con frecuencia de diferentes escáneres. Algunos ejemplos incluyen el registro de imágenes de TC / RM cerebral o imágenes de PET / TC de cuerpo entero para la localización de tumores, el registro de imágenes de TC con contraste frente a imágenes de TC sin contraste [15] para la segmentación de partes específicas de la anatomía, y el registro de imágenes de ultrasonido y TC para la localización de la próstata en radioterapia .
Los métodos de registro se pueden clasificar según el nivel de automatización que proporcionan. Se han desarrollado métodos manuales, interactivos, semiautomáticos y automáticos. Los métodos manuales proporcionan herramientas para alinear las imágenes manualmente. Los métodos interactivos reducen el sesgo del usuario al realizar ciertas operaciones clave automáticamente, aunque siguen dependiendo de que el usuario guíe el registro. Los métodos semiautomáticos realizan más pasos de registro automáticamente, pero dependen del usuario para verificar la exactitud de un registro. Los métodos automáticos no permiten ninguna interacción del usuario y realizan todos los pasos de registro automáticamente.
Las similitudes de imágenes se utilizan ampliamente en imágenes médicas . Una medida de similitud de imágenes cuantifica el grado de similitud entre patrones de intensidad en dos imágenes. [3] La elección de una medida de similitud de imágenes depende de la modalidad de las imágenes que se van a registrar. Los ejemplos comunes de medidas de similitud de imágenes incluyen correlación cruzada , información mutua , suma de diferencias de intensidad al cuadrado y uniformidad de imagen de relación. La información mutua y la información mutua normalizada son las medidas de similitud de imágenes más populares para el registro de imágenes multimodales. La correlación cruzada, la suma de las diferencias de intensidad al cuadrado y la uniformidad de imagen de relación se utilizan comúnmente para el registro de imágenes en la misma modalidad.
Se han derivado muchas características nuevas para funciones de costo basadas en métodos de correspondencia a través de grandes deformaciones que han surgido en el campo de la anatomía computacional, incluida la correspondencia de medidas , que son conjuntos de puntos o puntos de referencia sin correspondencia, la correspondencia de curvas y la correspondencia de superficies a través de corrientes matemáticas y varifolds.
Existe un nivel de incertidumbre asociado con el registro de imágenes que tienen diferencias espacio-temporales. Un registro confiable con un cierto grado de incertidumbre es fundamental para muchas aplicaciones de detección de cambios , como los diagnósticos médicos.
En aplicaciones de teledetección donde un píxel de imagen digital puede representar varios kilómetros de distancia espacial (como las imágenes LANDSAT de la NASA ), un registro de imagen incierto puede significar que una solución podría estar a varios kilómetros de la realidad del terreno. Varios artículos notables han intentado cuantificar la incertidumbre en el registro de imágenes para comparar resultados. [16] [17] Sin embargo, muchos enfoques para cuantificar la incertidumbre o estimar deformaciones requieren un uso intensivo de recursos computacionales o solo son aplicables a conjuntos limitados de transformaciones espaciales.
El registro de imágenes tiene aplicaciones en teledetección (actualización de cartografía) y visión artificial. Debido a la amplia gama de aplicaciones a las que se puede aplicar el registro de imágenes, es imposible desarrollar un método general que esté optimizado para todos los usos.
El registro de imágenes médicas (para datos del mismo paciente tomados en diferentes puntos en el tiempo, como la detección de cambios o el monitoreo de tumores) a menudo implica además un registro elástico (también conocido como no rígido ) para hacer frente a la deformación del sujeto (debido a la respiración, cambios anatómicos, etc.). [18] [19] [20] El registro no rígido de imágenes médicas también se puede utilizar para registrar los datos de un paciente en un atlas anatómico, como el atlas de Talairach para neuroimágenes.
En astrofotografía, la alineación y el apilamiento de imágenes se utilizan a menudo para aumentar la relación señal/ruido de los objetos débiles. Sin apilamiento, se puede utilizar para producir una secuencia de eventos como la rotación de un planeta o un tránsito frente al Sol. Mediante el uso de puntos de control (ingresados de forma automática o manual), la computadora realiza transformaciones en una imagen para hacer que las características principales se alineen con una segunda imagen o con varias imágenes. Esta técnica también se puede utilizar para imágenes de diferentes tamaños, para permitir que se combinen imágenes tomadas a través de diferentes telescopios o lentes.
En la crio-TEM, la inestabilidad provoca la deriva de la muestra y se requieren muchas adquisiciones rápidas con un registro de imagen preciso para preservar la alta resolución y obtener imágenes con una alta relación señal/ruido. Para datos de baja relación señal/ruido, el mejor registro de imagen se logra mediante la correlación cruzada de todas las permutaciones de imágenes en una pila de imágenes. [21]
El registro de imágenes es una parte esencial de la creación de imágenes panorámicas. Existen muchas técnicas diferentes que se pueden implementar en tiempo real y ejecutar en dispositivos integrados, como cámaras y teléfonos con cámara.