El aprendizaje por transferencia ( TL ) es una técnica de aprendizaje automático (ML) en la que el conocimiento aprendido de una tarea se reutiliza para mejorar el rendimiento en una tarea relacionada. [1] Por ejemplo, para la clasificación de imágenes , el conocimiento adquirido al aprender a reconocer automóviles podría aplicarse al intentar reconocer camiones. Este tema está relacionado con la literatura psicológica sobre la transferencia de aprendizaje , aunque los vínculos prácticos entre los dos campos son limitados. La reutilización/transferencia de información de tareas previamente aprendidas a nuevas tareas tiene el potencial de mejorar significativamente la eficiencia del aprendizaje. [2]
En 1976, Bozinovski y Fulgosi publicaron un artículo que abordaba el aprendizaje por transferencia en el entrenamiento de redes neuronales . [4] [5] El artículo ofrece un modelo matemático y geométrico del tema. En 1981, un informe consideró la aplicación del aprendizaje por transferencia a un conjunto de datos de imágenes que representan letras de terminales de computadora, demostrando experimentalmente el aprendizaje por transferencia positivo y negativo. [6]
En 1992, Lorien Pratt formuló el algoritmo de transferencia basada en discriminabilidad (DBT). [7]
En 1998, el campo había avanzado para incluir el aprendizaje multitarea , [8] junto con fundamentos teóricos más formales. [9] Las publicaciones influyentes sobre el aprendizaje por transferencia incluyen el libro Aprendiendo a aprender en 1998, [10] una encuesta de 2009 [11] y una encuesta de 2019. [12]
En el artículo de 2020, "Replanteando el preentrenamiento y el autoentrenamiento", [15] Zoph et al. informaron que el preentrenamiento puede perjudicar la precisión y, en cambio, recomiendan el autoentrenamiento.
Definición
La definición de aprendizaje por transferencia se da en términos de dominios y tareas. Un dominio consta de: un espacio de características y una distribución de probabilidad marginal , donde . Dado un dominio específico, , una tarea consta de dos componentes: un espacio de etiquetas y una función predictiva objetiva . La función se utiliza para predecir la etiqueta correspondiente de una nueva instancia . Esta tarea, denotada por , se aprende a partir de los datos de entrenamiento que consisten en pares , donde y . [16]
Dado un dominio de origen y una tarea de aprendizaje , un dominio de destino y una tarea de aprendizaje , donde , o , el aprendizaje por transferencia tiene como objetivo ayudar a mejorar el aprendizaje de la función predictiva de destino al utilizar el conocimiento en y . [16]
En 2020, se descubrió que, debido a sus naturalezas físicas similares, es posible el aprendizaje por transferencia entre las señales electromiográficas (EMG) de los músculos y la clasificación de los comportamientos de las ondas cerebrales electroencefalográficas (EEG), desde el dominio de reconocimiento de gestos hasta el dominio de reconocimiento de estados mentales. Se observó que esta relación funcionaba en ambas direcciones, lo que demuestra que la electroencefalografía también se puede utilizar para clasificar la EMG. [27] Los experimentos observaron que la precisión de las redes neuronales y las redes neuronales convolucionales mejoró [28] a través del aprendizaje por transferencia tanto antes de cualquier aprendizaje (en comparación con la distribución de peso aleatoria estándar) como al final del proceso de aprendizaje (asíntota). Es decir, los resultados mejoran con la exposición a otro dominio. Además, el usuario final de un modelo entrenado previamente puede cambiar la estructura de capas completamente conectadas para mejorar el rendimiento. [29]
Software
Se han implementado varias compilaciones de algoritmos de aprendizaje por transferencia y adaptación de dominio:
ADAPTAR [30] (Python)
TLlib [31] (Python)
Caja de herramientas de adaptación de dominios [32] (Matlab)
^ West, Jeremy; Ventura, Dan; Warnick, Sean (2007). "Presentación de investigación de primavera: una base teórica para la transferencia inductiva". Universidad Brigham Young, Facultad de Ciencias Físicas y Matemáticas. Archivado desde el original el 2007-08-01 . Consultado el 2007-08-05 .
^ George Karimpanal, Thommen; Bouffanais, Roland (2019). "Mapas autoorganizados para el almacenamiento y transferencia de conocimiento en el aprendizaje por refuerzo". Adaptive Behavior . 27 (2): 111–126. arXiv : 1811.08318 . doi :10.1177/1059712318818568. ISSN 1059-7123. S2CID 53774629.
^ Aprendizaje automático sensible a los costos. (2011). EE. UU.: CRC Press, página 63, https://books.google.com/books?id=8TrNBQAAQBAJ&pg=PA63
^ Stevo. Bozinovski y Ante Fulgosi (1976). "La influencia de la similitud de patrones y el aprendizaje por transferencia en el entrenamiento de un perceptrón base B2". (original en croata) Actas del Simposio Informatica 3-121-5, Bled.
^ Stevo Bozinovski (2020) "Recordatorio del primer artículo sobre aprendizaje por transferencia en redes neuronales, 1976". Informatica 44: 291–302.
^ S. Bozinovski (1981). "Espacio de enseñanza: un concepto de representación para la clasificación de patrones adaptativos". Informe técnico COINS, Universidad de Massachusetts en Amherst, n.º 81-28 [disponible en línea: UM-CS-1981-028.pdf]
^ Pratt, LY (1992). "Transferencia basada en la discriminabilidad entre redes neuronales" (PDF) . Conferencia NIPS: Avances en sistemas de procesamiento de información neuronal 5. Morgan Kaufmann Publishers. págs. 204–211.
^ Caruana, R., "Aprendizaje multitarea", págs. 95-134 en Thrun & Pratt 2012
^ Baxter, J., "Modelos teóricos de aprender a aprender", págs. 71-95 Thrun & Pratt 2012
^ Thrun y Pratt 2012.
^ Pan, Sinno Jialin; Yang, Qiang (2009). "Una encuesta sobre el aprendizaje por transferencia" (PDF) . IEEE .
^ Zhuang, Fuzhen; Qi, Zhiyuan; Duan, Keyu; Xi, Dongbo; Zhu, Yongchun; Zhu, Hengshu; Xiong, Hui; Él, Qing (2019). "Una encuesta completa sobre el aprendizaje por transferencia". IEEE . arXiv : 1911.02685 .
^ Tutorial NIPS 2016: "Conceptos básicos para crear aplicaciones de IA mediante aprendizaje profundo" por Andrew Ng, 6 de mayo de 2018, archivado desde el original el 19 de diciembre de 2021 , consultado el 28 de diciembre de 2019
^ "Conceptos básicos de la creación de aplicaciones de IA mediante aprendizaje profundo, diapositivas" (PDF) .
^ Zoph, Barret (2020). "Replanteamiento del preentrenamiento y el autoentrenamiento" (PDF) . Avances en sistemas de procesamiento de información neuronal . 33 : 3833–3845. arXiv : 2006.06882 . Consultado el 20 de diciembre de 2022 .
^ ab Lin, Yuan-Pin; Jung, Tzyy-Ping (27 de junio de 2017). "Mejora de la clasificación de emociones basada en EEG mediante aprendizaje por transferencia condicional". Frontiers in Human Neuroscience . 11 : 334. doi : 10.3389/fnhum.2017.00334 . PMC 5486154 . PMID 28701938.El material fue copiado de esta fuente, que está disponible bajo una Licencia Creative Commons Atribución 4.0 Internacional.
^ Mihalkova, Lilyana; Huynh, Tuyen; Mooney, Raymond J. (julio de 2007), "Mapeo y revisión de redes lógicas de Markov para transferencia" (PDF) , Actas de aprendizaje de la 22.ª Conferencia AAAI sobre Inteligencia Artificial (AAAI-2007) , Vancouver, BC, págs. 608–614 , consultado el 5 de agosto de 2007{{citation}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
^ Niculescu-Mizil, Alexandru; Caruana, Rich (21-24 de marzo de 2007), "Transferencia inductiva para el aprendizaje de la estructura de red bayesiana" (PDF) , Actas de la undécima conferencia internacional sobre inteligencia artificial y estadística (AISTATS 2007) , consultado el 5 de agosto de 2007
^ Hajiramezanali, E. y Dadaneh, SZ y Karbalayghareh, A. y Zhou, Z. y Qian, X. Aprendizaje multidominio bayesiano para el descubrimiento de subtipos de cáncer a partir de datos de recuento de secuenciación de próxima generación. 32.ª Conferencia sobre sistemas de procesamiento de información neuronal (NeurIPS 2018), Montreal, Canadá. arXiv :1810.09433
^ Arief-Ang, IB; Salim, FD; Hamilton, M. (8 de noviembre de 2017). DA-HOC: adaptación de dominio semisupervisada para la predicción de ocupación de habitaciones utilizando datos de sensores de CO2. 4.ª Conferencia internacional de la ACM sobre sistemas para entornos construidos energéticamente eficientes (BuildSys). Delft, Países Bajos. págs. 1–10. doi :10.1145/3137133.3137146. ISBN .978-1-4503-5544-5.
^ Arief-Ang, IB; Hamilton, M.; Salim, FD (1 de diciembre de 2018). "Una predicción escalable de la ocupación de una sala con descomposición de series temporales transferibles de datos de sensores de CO2". ACM Transactions on Sensor Networks . 14 (3–4): 21:1–21:28. doi :10.1145/3217214. S2CID 54066723.
^ Banerjee, Bikramjit y Peter Stone. "Aprendizaje general de juegos mediante transferencia de conocimientos". IJCAI. 2007.
^ Do, Chuong B.; Ng, Andrew Y. (2005). "Transferencia de aprendizaje para la clasificación de textos". Neural Information Processing Systems Foundation, NIPS*2005 (PDF) . Consultado el 5 de agosto de 2007 .
^ Rajat, Raina; Ng, Andrew Y.; Koller, Daphne (2006). "Construcción de priores informativos mediante aprendizaje por transferencia". Vigésima tercera conferencia internacional sobre aprendizaje automático (PDF) . Consultado el 5 de agosto de 2007 .
^ Maitra, DS; Bhattacharya, U.; Parui, SK (agosto de 2015). "Enfoque común basado en CNN para el reconocimiento de caracteres manuscritos de múltiples escrituras". 2015 13.ª Conferencia Internacional sobre Análisis y Reconocimiento de Documentos (ICDAR) . pp. 1021–1025. doi :10.1109/ICDAR.2015.7333916. ISBN978-1-4799-1805-8. Número de identificación del sujeto 25739012.
^ Bickel, Steffen (2006). "Resumen del Desafío de Descubrimiento ECML-PKDD 2006". Taller del Desafío de Descubrimiento ECML-PKDD (PDF) . Consultado el 5 de agosto de 2007 .
^ Bird, Jordan J.; Kobylarz, Jhonatan; Faria, Diego R.; Ekart, Aniko; Ribeiro, Eduardo P. (2020). "Aprendizaje por transferencia de CNN y MLP entre dominios para el procesamiento de señales biológicas: EEG y EMG". IEEE Access . 8 . Instituto de Ingenieros Eléctricos y Electrónicos (IEEE): 54789–54801. Bibcode :2020IEEEA...854789B. doi : 10.1109/access.2020.2979074 . ISSN 2169-3536.
^ Maitra, Durjoy Sen; Bhattacharya, Ujjwal; Parui, Swapan K. (agosto de 2015). "Enfoque común basado en CNN para el reconocimiento de caracteres manuscritos de múltiples escrituras". 2015 13.ª Conferencia Internacional sobre Análisis y Reconocimiento de Documentos (ICDAR) . págs. 1021–1025. doi :10.1109/ICDAR.2015.7333916. ISBN .978-1-4799-1805-8. Número de identificación del sujeto 25739012.
^ Kabir, HM Dipu; Abdar, Moloud; Jalali, Seyed Mohammad Jafar; Cosravi, Abbas; Atiya, Amir F.; Nahavandi, Saeid; Srinivasan, Dipti (7 de enero de 2022). "SpinalNet: red neuronal profunda con entrada gradual". Transacciones IEEE sobre Inteligencia Artificial . 4 (5): 1165-1177. arXiv : 2007.03347 . doi :10.1109/TAI.2022.3185179. S2CID 220381239.
^ de Mathelin, Antoine y Deheeger, François y Richard, Guillaume y Mougeot, Mathilde y Vayatis, Nicolas (2020) "ADAPT: Impresionante caja de herramientas de Python para la adaptación de dominios"
^ Mingsheng Long Junguang Jiang, Bo Fu. (2020) "Biblioteca de transferencia-aprendizaje"
^ Ke Yan. (2016) "Caja de herramientas de adaptación de dominio"
Fuentes
Thrun, Sebastian; Pratt, Lorien (6 de diciembre de 2012). Aprender a aprender. Springer Science & Business Media. ISBN978-1-4615-5529-2.