Imágenes de un solo píxel

Técnica de imágenes computacionales
Técnica de imágenes computacionales
Esquema de una cámara de un solo píxel que utiliza un DMD. La luz transmitida (blanca) de la muestra (azul) es modulada por el DMD y recogida por un detector de un solo píxel. [1]

La obtención de imágenes de un solo píxel es una técnica de obtención de imágenes computacional para producir imágenes con resolución espacial utilizando un solo detector en lugar de una matriz de detectores (como en los sensores de cámara convencionales ). [2] Un dispositivo que implementa un esquema de obtención de imágenes de este tipo se denomina cámara de un solo píxel . Combinada con la detección comprimida , la cámara de un solo píxel puede recuperar imágenes a partir de menos mediciones que la cantidad de píxeles reconstruidos . [3]

La obtención de imágenes de un solo píxel se diferencia del escaneo raster en que se obtienen imágenes de múltiples partes de la escena al mismo tiempo, en un modo de campo amplio, utilizando una secuencia de patrones de máscara, ya sea en la etapa de iluminación o en la de detección. [4] A menudo se utiliza un modulador de luz espacial (como un dispositivo de microespejos digitales ) para este propósito.

Las cámaras de un solo píxel se desarrollaron para ser alternativas más simples, más pequeñas y más económicas a las cámaras digitales convencionales basadas en silicio , con la capacidad de obtener imágenes de un rango espectral más amplio . [3] Desde entonces, se ha adaptado y se ha demostrado que es adecuada para numerosas aplicaciones en microscopía , tomografía , holografía , imágenes ultrarrápidas , FLIM y teledetección . [4]

Historia

Los orígenes de la obtención de imágenes de un solo píxel se remontan al desarrollo de la fotografía dual [5] y la detección comprimida a mediados de la década de 2000. [6] El artículo seminal escrito por Duarte et al. [3] en 2008 en la Universidad Rice concretó las bases de la técnica de obtención de imágenes de un solo píxel. También presentó una comparación detallada de las diferentes modalidades de escaneo y obtención de imágenes que existían en ese momento. Estos desarrollos también fueron una de las primeras aplicaciones del dispositivo de microespejos digitales (DMD), desarrollado por Texas Instruments para su tecnología de proyección DLP , para la detección de luz estructurada.

Pronto, la técnica se extendió a la obtención de imágenes fantasma computacionales , imágenes de terahercios e imágenes 3D . Los sistemas basados ​​en detección estructurada a menudo se denominaban cámaras de un solo píxel, mientras que los basados ​​en iluminación estructurada a menudo se denominaban imágenes fantasma computacionales. Al utilizar láseres pulsados ​​como fuente de luz, se aplicaron imágenes de un solo píxel para mediciones de tiempo de vuelo utilizadas en aplicaciones de mapeo de profundidad LiDAR . Además del DMD, también se experimentaron diferentes esquemas de modulación de luz con cristales líquidos y matrices de LED . [4]

A principios de la década de 2010, la obtención de imágenes de un solo píxel se aprovechó en la microscopía de fluorescencia para obtener imágenes de muestras biológicas. [7] Junto con la técnica de recuento de fotones individuales correlacionados en el tiempo (TCSPC), también se ha explorado el uso de imágenes de un solo píxel para la microscopía de imágenes de tiempo de vida de fluorescencia compresiva (FLIM). [8] Desde finales de la década de 2010, las técnicas de aprendizaje automático , especialmente el aprendizaje profundo , se han utilizado cada vez más para optimizar las estrategias de iluminación, detección o reconstrucción de imágenes de un solo píxel. [4]

Principios

Teoría

Detección comprimida representada como un muestreo de una señal ( ) en una base . Aquí está el vector de coeficientes de que es escaso (se muestra con solo unos pocos puntos de colores) en . El producto interno de una matriz aleatoria deficiente en rango (mostrada por los puntos de colores aleatorios) con da el vector de medición . Bajo ciertas condiciones, la señal se puede reconstruir (casi) con precisión. el {\estilo de visualización z} O {\estilo de visualización \Psi} incógnita {\estilo de visualización x} el {\estilo de visualización z} O {\estilo de visualización \Psi} PAG {\estilo de visualización P} el {\estilo de visualización z} y {\estilo de visualización y} el {\estilo de visualización z}

En el muestreo , la adquisición de datos digitales implica el muestreo uniforme de puntos discretos de una señal analógica a una tasa de Nyquist o superior . Por ejemplo, en una cámara digital, el muestreo se realiza con una matriz 2D de detectores pixelados en un sensor CCD o CMOS ( normalmente hay millones en las cámaras digitales de consumo). Este tipo de muestreo se puede representar mediante el vector con elementos . Un vector se puede expresar como los coeficientes de una expansión de base ortonormal : norte {\estilo de visualización N} norte {\estilo de visualización N} incógnita {\estilo de visualización x} incógnita i , i = 1 , 2 , . . . , norte {\displaystyle x_{i},i=1,2,...,N} { a i } Estilo de visualización: ai

incógnita = i = 1 norte a i ψ i {\displaystyle x=\sum _{i=1}^{N}{a_{i}\psi _{i}}}

donde son los vectores base . O, más compactamente: ψ i {\displaystyle \psi _{i}} norte × 1 {\displaystyle N\times 1}

incógnita = O a {\displaystyle x=\Psi a}

donde es la matriz base formada por apilamiento . A menudo es posible encontrar una base en la que el vector de coeficientes sea escaso (con coeficientes distintos de cero) o r-compresible (los coeficientes ordenados decaen como una ley de potencia). Este es el principio detrás de los estándares de compresión como JPEG y JPEG-2000 , que explotan el hecho de que las imágenes naturales tienden a ser comprimibles en las bases DCT y wavelet . [3] La detección comprimida tiene como objetivo eludir el marco convencional de "muestrear y luego comprimir" al adquirir directamente una representación condensada con mediciones lineales. De manera similar al paso anterior, esto se puede representar matemáticamente como: O {\estilo de visualización \Psi} norte × norte {\displaystyle N\times N} ψ i {\displaystyle \psi _{i}} a {\displaystyle a} K << N {\displaystyle K<<N} M < N {\displaystyle M<N}

y = Φ x = Φ Ψ a {\displaystyle y=\Phi x=\Phi \Psi a}

donde es un vector y es la matriz de medición de rango - . Esta llamada medición subdeterminada hace que el problema inverso sea un problema mal planteado , que en general es irresoluble. Sin embargo, la detección comprimida explota el hecho de que con el diseño adecuado de , la señal comprimible puede recuperarse de manera exacta o aproximada utilizando métodos computacionales. [3] Se ha demostrado [6] que la incoherencia entre las bases y (junto con la existencia de escasez en ) es suficiente para que dicho esquema funcione. Las opciones populares de son matrices aleatorias o subconjuntos aleatorios de vectores de base de bases de Fourier , Walsh-Hadamard o Noiselet . [3] También se ha demostrado que la optimización dada por: y {\displaystyle y} M × 1 {\displaystyle M\times 1} Φ {\displaystyle \Phi } M {\displaystyle M} Φ {\displaystyle \Phi } x {\displaystyle x} Φ {\displaystyle \Phi } Ψ {\displaystyle \Psi } Ψ {\displaystyle \Psi } Ψ {\displaystyle \Psi } L 1 {\displaystyle {\mathcal {L}}_{1}}

a ^ = arg min | | α | | 1 S . T . | | y Φ Ψ α | | 2 < ϵ {\displaystyle {\hat {a}}={\text{arg min}}||\alpha '||_{1}\quad S.T.||y-\Phi \Psi \alpha '||_{2}<\epsilon }

funciona mejor para recuperar la señal de las mediciones aleatorias que otros métodos comunes como la minimización de mínimos cuadrados . [3] Una mejora en el algoritmo de optimización, basada en la minimización de la variación total , es especialmente útil para reconstruir imágenes directamente en la base de píxeles. [9] x {\displaystyle x} y {\displaystyle y} L 1 {\displaystyle {\mathcal {L}}_{1}}

Cámara de un solo píxel

La cámara de un solo píxel es una computadora óptica [3] que implementa la arquitectura de medición de detección comprimida descrita anteriormente. Funciona midiendo secuencialmente los productos internos entre la imagen y el conjunto de funciones de prueba 2-D , para calcular el vector de medición . En una configuración típica, consta de dos componentes principales: un modulador de luz espacial (SLM) y un detector de un solo píxel. La luz de una fuente de campo amplio se colima y se proyecta sobre la escena, y la luz reflejada/transmitida se enfoca en el detector con lentes. El SLM se utiliza para realizar las funciones de prueba , a menudo como máscaras de patrones binarios, y para introducirlas en la iluminación o en la ruta de detección. El detector integra y convierte la señal de luz en un voltaje de salida, que luego es digitalizado por un convertidor A/D y analizado por una computadora. [3] y m = x , ϕ m {\displaystyle y_{m}=\langle x,\phi _{m}\rangle } x {\displaystyle x} { ϕ m } {\displaystyle \{\phi _{m}\}} y {\displaystyle y} { ϕ m } {\displaystyle \{\phi _{m}\}}

Las filas de una matriz de Walsh-Hadamard permutada aleatoriamente (para lograr incoherencia), reformadas en patrones cuadrados, se utilizan comúnmente como funciones de prueba binarias en imágenes de un solo píxel. Para obtener valores positivos y negativos (±1 en este caso), la intensidad de luz media se puede restar de cada medición, [3] ya que el SLM solo puede producir patrones binarios con condiciones 0 (apagado) y 1 (encendido). Una alternativa es dividir los elementos positivos y negativos en dos conjuntos, medir ambos con el conjunto negativo invertido (es decir, -1 reemplazado por +1) y restar las mediciones al final. Los valores entre 0 y 1 se pueden obtener mediante el dithering de los microespejos DMD durante el tiempo de integración del detector.

Entre los detectores de uso común se incluyen los tubos fotomultiplicadores , los fotodiodos de avalancha o los fotomultiplicadores híbridos (un sándwich de capas de etapas de amplificación de fotones). También se puede utilizar un espectrómetro para la obtención de imágenes multiespectrales, junto con una matriz de detectores, uno para cada canal espectral. Otra adición común es una placa de conteo de fotones individuales correlacionados en el tiempo (TCSPC) para procesar la salida del detector, que, acoplada a un láser pulsado, permite la medición de la vida útil y es útil en la obtención de imágenes biomédicas . [10]

Ventajas y desventajas

La ventaja más importante del diseño de un solo píxel es su reducido tamaño, complejidad y coste del detector de fotones (una sola unidad). Esto permite el uso de detectores exóticos [3] capaces de realizar sistemas de detección rápida multiespectrales, de tiempo de vuelo, de conteo de fotones y otros. Esto hizo que la obtención de imágenes de un solo píxel fuera adecuada para diversos campos, desde la microscopía hasta la astronomía. [4]

La eficiencia cuántica de un fotodiodo también es mayor que la de los sensores de píxeles en una matriz CCD o CMOS típica. Junto con el hecho de que cada medición de un solo píxel recibe aproximadamente  10 veces más fotones que un sensor de píxeles promedio, esto ayuda a reducir significativamente la distorsión de la imagen causada por el ruido oscuro y el ruido de lectura. Otra ventaja importante es el factor de relleno de los SLM como un DMD, que puede alcanzar alrededor del 90% (en comparación con el de una matriz CCD/CMOS, que es solo del 50%). Además, la obtención de imágenes de un solo píxel hereda las ventajas teóricas que sustentan el marco de detección comprimido, como su universalidad (la misma matriz de medición funciona para muchas bases dispersantes ) y robustez (las mediciones tienen la misma prioridad y, por lo tanto, la pérdida de una medición no corrompe toda la reconstrucción). [3] N / 2 {\displaystyle N/2} Φ {\displaystyle \Phi } Ψ {\displaystyle \Psi }

El principal inconveniente de la técnica de obtención de imágenes de un solo píxel es el equilibrio entre la velocidad de adquisición y la resolución espacial. La adquisición rápida requiere proyectar menos patrones (ya que cada uno de ellos se mide secuencialmente), lo que conduce a una menor resolución de la imagen reconstruida. [11] Se ha propuesto un método innovador de "fusión" de la imagen de un solo píxel de baja resolución con una imagen CCD/CMOS de alta resolución espacial (denominada " fusión de datos ") para mitigar este problema. [12] También se están desarrollando métodos de aprendizaje profundo para aprender el conjunto óptimo de patrones adecuados para obtener imágenes de una categoría particular de muestras para mejorar la velocidad y la fiabilidad de la técnica. [1]

Aplicaciones

A continuación se enumeran algunos de los campos de investigación que emplean y desarrollan cada vez más imágenes de un solo píxel: [2]

Véase también

Referencias

  1. ^ ab Higham, Catherine F.; Murray-Smith, Roderick; Padgett, Miles J.; Edgar, Matthew P. (5 de febrero de 2018). "Aprendizaje profundo para video de un solo píxel en tiempo real". Scientific Reports . 8 (1): 2369. Bibcode :2018NatSR...8.2369H. doi :10.1038/s41598-018-20521-y. ISSN  2045-2322. PMC  5799195 . PMID  29403059.
  2. ^ ab Edgar, Matthew P.; Gibson, Graham M.; Padgett, Miles J. (1 de enero de 2019). "Principios y perspectivas para la obtención de imágenes de un solo píxel". Nature Photonics . 13 (1): 13–20. Bibcode :2019NaPho..13...13E. doi :10.1038/s41566-018-0300-7. ISSN  1749-4893.
  3. ^ abcdefghijkl Duarte, Marco F.; Davenport, Mark A.; Takhar, Dharmpal; Laska, Jason N.; Sun, Ting; Kelly, Kevin F.; Baraniuk, Richard G. (21 de marzo de 2008). "Imágenes de un solo píxel mediante muestreo compresivo". Revista IEEE Signal Processing . 25 (2): 83–91. Bibcode :2008ISPM...25...83D. doi :10.1109/MSP.2007.914730. ISSN  1053-5888.
  4. ^ abcde Gibson, Graham M.; Johnson, Steven D.; Padgett, Miles J. (2020). "Imágenes de un solo píxel 12 años después: una revisión". Optics Express . 28 (19). Optica Publishing Group: 28190–28208. Bibcode :2020OExpr..2828190G. doi : 10.1364/oe.403195 . PMID  32988095 . Consultado el 2024-07-09 .
  5. ^ Sen, Pradeep; Chen, Billy; Garg, Gaurav; Marschner, Stephen R.; Horowitz, Mark; Levoy, Marc; Lensch, Hendrik PA (1 de julio de 2005). "Fotografía dual". ACM Trans. Graph . 24 (3): 745–755. doi :10.1145/1073204.1073257. ISSN  0730-0301.
  6. ^ ab Candes, Emmanuel J.; Tao, Terence (30 de noviembre de 2006). "Recuperación de señales casi óptimas a partir de proyecciones aleatorias: ¿estrategias de codificación universal?". IEEE Transactions on Information Theory . 52 (12): 5406–5425. arXiv : math/0410542 . doi :10.1109/TIT.2006.885507. ISSN  0018-9448.
  7. ^ Studer, Vincent; Bobin, Jérome; Chahid, Makhlad; Mousavi, Hamed Shams; Candes, Emmanuel; Dahan, Maxime (26 de junio de 2012). "Microscopía de fluorescencia compresiva para imágenes biológicas e hiperespectrales". Actas de la Academia Nacional de Ciencias . 109 (26): E1679-87. doi : 10.1073/pnas.1119511109 . ISSN  0027-8424. PMC 3387031 . PMID  22689950. 
  8. ^ Rousset, Florian; Ducros, Nicolas; Peyrin, Françoise; Valentini, Gianluca; d'Andrea, Cosimo; Farina, Andrea (2018). "Imágenes multiespectrales resueltas en el tiempo basadas en una cámara adaptativa de un solo píxel". Optics Express . 26 (8): 10550–10558. Bibcode :2018OExpr..2610550R. doi :10.1364/oe.26.010550. hdl : 11311/1087166 . PMID  29715990 . Consultado el 11 de julio de 2024 .
  9. ^ Candes, EJ; Romberg, J.; Tao, T. (23 de enero de 2006). "Principios de incertidumbre robusta: reconstrucción exacta de la señal a partir de información de frecuencia altamente incompleta". IEEE Transactions on Information Theory . 52 (2): 489–509. arXiv : math/0409186 . doi :10.1109/TIT.2005.862083. ISSN  0018-9448.
  10. ^ Calisesi, Gianmaria; Ghezzi, Alberto; Ancora, Daniele; D'Andrea, Cosme; Valentini, Gianluca; Fariña, Andrea; Bassi, Andrea (19 de junio de 2021). "Detección comprimida en microscopía de fluorescencia". Avances en Biofísica y Biología Molecular . 168 : 66–80. doi :10.1016/j.pbiomolbio.2021.06.004. hdl : 11311/1199828 . ISSN  0079-6107. PMID  34153330.
  11. ^ Stojek, Rafael; Pastuszczak, Anna; Wróbel, Piotr; Kotyński, Rafał (2022). "Imágenes de un solo píxel a altas resoluciones de píxeles". Óptica Express . 30 (13): 22730–22745. arXiv : 2206.02510 . Código Bib : 2022OExpr..3022730S. doi :10.1364/oe.460025. PMID  36224964 . Consultado el 12 de julio de 2024 .
  12. ^ Zhang, Jixian (17 de febrero de 2010). "Fusión de datos de teledetección de múltiples fuentes: estado y tendencias". Revista internacional de fusión de imágenes y datos . 1 (1): 5–24. Bibcode :2010IJIDF...1....5Z. doi :10.1080/19479830903561035. ISSN  1947-9832.

Lectura adicional

  • Eldar, Yonina C.; Kutyniok, Gitta, eds. (2012). Detección comprimida: teoría y aplicaciones . Cambridge: Cambridge University Press. ISBN 978-1-107-00558-7.
  • Stern, Adrian (2017). Imágenes ópticas compresivas . Boca Raton: CRC Press, Taylor & Francis. ISBN 978-1-4987-0806-7.
  • Ghezzi, Alberto (24 de mayo de 2023). "Microscopía de fluorescencia multiespectral resuelta en el tiempo basada en imágenes computacionales". POLITesi . hdl :10589/203773.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Single-pixel_imaging&oldid=1256734313"