Aprendizaje automático

Estudio de algoritmos que mejoran automáticamente a través de la experiencia.

El aprendizaje automático ( ML ) es un campo de estudio en inteligencia artificial que se ocupa del desarrollo y estudio de algoritmos estadísticos que pueden aprender de los datos y generalizar a datos invisibles, y así realizar tareas sin instrucciones explícitas . [1] El rápido progreso en el campo del aprendizaje profundo , a partir de la década de 2010, permitió que las redes neuronales superaran muchos enfoques anteriores en rendimiento. [2]

El ML encuentra aplicaciones en muchos campos, incluido el procesamiento del lenguaje natural , la visión por computadora , el reconocimiento de voz , el filtrado de correo electrónico , la agricultura y la medicina . [3] [4] La aplicación del ML a problemas comerciales se conoce como análisis predictivo .

Los métodos estadísticos y de optimización matemática (programación matemática) constituyen los fundamentos del aprendizaje automático. La minería de datos es un campo de estudio relacionado, que se centra en el análisis exploratorio de datos (EDA) a través del aprendizaje no supervisado . [6] [7]

Desde un punto de vista teórico, el aprendizaje probablemente aproximadamente correcto (PAC) proporciona un marco para describir el aprendizaje automático.

Historia

El término aprendizaje automático fue acuñado en 1959 por Arthur Samuel , un empleado de IBM y pionero en el campo de los juegos de computadora y la inteligencia artificial . [8] [9] El sinónimo computadoras autodidactas también se utilizó en este período de tiempo. [10] [11]

Aunque el primer modelo de aprendizaje automático se introdujo en la década de 1950, cuando Arthur Samuel inventó un programa que calculaba las posibilidades de ganar en las damas para cada lado, la historia del aprendizaje automático se remonta a décadas de deseo y esfuerzo humanos por estudiar los procesos cognitivos humanos. [12] En 1949, el psicólogo canadiense Donald Hebb publicó el libro The Organization of Behavior , en el que introdujo una estructura neuronal teórica formada por ciertas interacciones entre las células nerviosas . [13] El modelo de Hebb de neuronas que interactúan entre sí sentó las bases de cómo funcionan las IA y los algoritmos de aprendizaje automático bajo nodos, o neuronas artificiales utilizadas por las computadoras para comunicar datos. [12] Otros investigadores que han estudiado los sistemas cognitivos humanos también contribuyeron a las tecnologías modernas de aprendizaje automático, incluidos el lógico Walter Pitts y Warren McCulloch , quienes propusieron los primeros modelos matemáticos de redes neuronales para crear algoritmos que reflejaran los procesos de pensamiento humano. [12]

A principios de los años 1960, la compañía Raytheon había desarrollado una "máquina de aprendizaje" experimental con memoria de cinta perforada , llamada Cybertron, para analizar señales de sonar , electrocardiogramas y patrones de habla utilizando un aprendizaje de refuerzo rudimentario . Un operador/profesor humano la "entrenaba" repetidamente para reconocer patrones y la equipaba con un botón de " error " para hacer que reevaluara las decisiones incorrectas. [14] Un libro representativo sobre la investigación en aprendizaje automático durante los años 1960 fue el libro de Nilsson sobre máquinas de aprendizaje, que trataba principalmente sobre aprendizaje automático para la clasificación de patrones. [15] El interés relacionado con el reconocimiento de patrones continuó hasta los años 1970, como lo describieron Duda y Hart en 1973. [16] En 1981 se presentó un informe sobre el uso de estrategias de enseñanza para que una red neuronal artificial aprendiera a reconocer 40 caracteres (26 letras, 10 dígitos y 4 símbolos especiales) desde una terminal de computadora. [17]

Tom M. Mitchell proporcionó una definición más formal y ampliamente citada de los algoritmos estudiados en el campo del aprendizaje automático: "Se dice que un programa informático aprende de la experiencia E con respecto a alguna clase de tareas T y medida de rendimiento P si su rendimiento en tareas en T , medido por P , mejora con la experiencia E ". [18] Esta definición de las tareas en las que se involucra el aprendizaje automático ofrece una definición fundamentalmente operativa en lugar de definir el campo en términos cognitivos. Esto sigue la propuesta de Alan Turing en su artículo " Computing Machinery and Intelligence ", en el que la pregunta "¿Pueden pensar las máquinas?" se reemplaza por la pregunta "¿Pueden las máquinas hacer lo que nosotros (como entidades pensantes) podemos hacer?". [19]

El aprendizaje automático moderno tiene dos objetivos: uno es clasificar los datos basándose en modelos que se han desarrollado; el otro es hacer predicciones de resultados futuros basándose en estos modelos. Un algoritmo hipotético específico para clasificar datos puede utilizar la visión artificial de lunares junto con el aprendizaje supervisado para entrenarlo a clasificar los lunares cancerosos. Un algoritmo de aprendizaje automático para la negociación de acciones puede informar al operador de posibles predicciones futuras. [20]

Relaciones con otros campos

Inteligencia artificial

El aprendizaje automático como subcampo de la IA [21]

Como esfuerzo científico, el aprendizaje automático surgió de la búsqueda de inteligencia artificial (IA). En los primeros días de la IA como disciplina académica , algunos investigadores estaban interesados ​​en que las máquinas aprendieran de los datos. Intentaron abordar el problema con varios métodos simbólicos, así como con lo que entonces se denominaban " redes neuronales "; estas eran principalmente perceptrones y otros modelos que luego se descubrió que eran reinvenciones de los modelos lineales generalizados de estadística. [22] También se empleó el razonamiento probabilístico , especialmente en el diagnóstico médico automatizado . [23] : 488 

Sin embargo, un énfasis creciente en el enfoque lógico basado en el conocimiento causó una ruptura entre la IA y el aprendizaje automático. Los sistemas probabilísticos estaban plagados de problemas teóricos y prácticos de adquisición y representación de datos. [23] : 488  Para 1980, los sistemas expertos habían llegado a dominar la IA, y las estadísticas estaban en desgracia. [24] El trabajo sobre el aprendizaje simbólico/basado en el conocimiento continuó dentro de la IA, lo que llevó a la programación lógica inductiva (ILP), pero la línea de investigación más estadística ahora estaba fuera del campo de la IA propiamente dicha, en el reconocimiento de patrones y la recuperación de información . [23] : 708–710, 755  La investigación de redes neuronales había sido abandonada por la IA y la informática casi al mismo tiempo. Esta línea también fue continuada fuera del campo de la IA/CS, como " conexionismo ", por investigadores de otras disciplinas, incluidos John Hopfield , David Rumelhart y Geoffrey Hinton . Su principal éxito llegó a mediados de la década de 1980 con la reinvención de la retropropagación . [23] : 25 

El aprendizaje automático (ML), reorganizado y reconocido como un campo propio, comenzó a florecer en la década de 1990. El campo cambió su objetivo de lograr inteligencia artificial a abordar problemas solucionables de naturaleza práctica. Cambió el enfoque de los enfoques simbólicos que había heredado de la IA y se centró en métodos y modelos tomados de la estadística, la lógica difusa y la teoría de la probabilidad . [24]

Compresión de datos

Existe una estrecha relación entre el aprendizaje automático y la compresión. Un sistema que predice las probabilidades posteriores de una secuencia dada toda su historia se puede utilizar para la compresión óptima de datos (mediante el uso de codificación aritmética en la distribución de salida). Por el contrario, se puede utilizar un compresor óptimo para la predicción (al encontrar el símbolo que comprime mejor, dada la historia previa). Esta equivalencia se ha utilizado como justificación para utilizar la compresión de datos como un parámetro de referencia para la "inteligencia general". [25] [26] [27]

Una visión alternativa puede mostrar que los algoritmos de compresión mapean implícitamente cadenas en vectores de espacios de características implícitos , y las medidas de similitud basadas en la compresión calculan la similitud dentro de estos espacios de características. Para cada compresor C(.) definimos un espacio vectorial asociado ℵ, de modo que C(.) mapea una cadena de entrada x, correspondiente a la norma vectorial ||~x||. Un examen exhaustivo de los espacios de características subyacentes a todos los algoritmos de compresión se ve impedido por el espacio; en su lugar, los vectores de características eligen examinar tres métodos de compresión sin pérdida representativos, LZW, LZ77 y PPM. [28]

Según la teoría AIXI , una conexión explicada de forma más directa en Hutter Prize , la mejor compresión posible de x es el software más pequeño posible que genera x. Por ejemplo, en ese modelo, el tamaño comprimido de un archivo zip incluye tanto el archivo zip como el software de descompresión, ya que no se puede descomprimir sin ambos, pero puede haber una forma combinada aún más pequeña.

Algunos ejemplos de software de compresión de audio y video impulsado por IA incluyen NVIDIA Maxine y AIVC. [29] Algunos ejemplos de software que pueden realizar compresión de imágenes impulsada por IA incluyen OpenCV , TensorFlow , Image Processing Toolbox (IPT) de MATLAB y High-Fidelity Generative Image Compression. [30]

En el aprendizaje automático no supervisado , la agrupación en clústeres de k-medias se puede utilizar para comprimir datos mediante la agrupación de puntos de datos similares en clústeres. Esta técnica simplifica el manejo de conjuntos de datos extensos que carecen de etiquetas predefinidas y se usa ampliamente en campos como la compresión de imágenes . [31]

La compresión de datos tiene como objetivo reducir el tamaño de los archivos de datos, mejorando la eficiencia de almacenamiento y acelerando la transmisión de datos. La agrupación en k-medias, un algoritmo de aprendizaje automático no supervisado, se emplea para particionar un conjunto de datos en un número específico de grupos, k, cada uno representado por el centroide de sus puntos. Este proceso condensa conjuntos de datos extensos en un conjunto más compacto de puntos representativos. Particularmente beneficioso en el procesamiento de imágenes y señales , la agrupación en k-medias ayuda en la reducción de datos al reemplazar grupos de puntos de datos con sus centroides, preservando así la información central de los datos originales mientras disminuye significativamente el espacio de almacenamiento requerido. [32]

Los modelos de lenguaje de gran tamaño (LLM) también son capaces de comprimir datos sin pérdida, como lo demuestra la investigación de DeepMind con el modelo Chinchilla 70B. Desarrollado por DeepMind, Chinchilla 70B comprimió datos de manera efectiva, superando los métodos convencionales como Portable Network Graphics (PNG) para imágenes y Free Lossless Audio Codec (FLAC) para audio. Logró una compresión de datos de imagen y audio al 43,4% y 16,4% de sus tamaños originales, respectivamente. [33]

Minería de datos

El aprendizaje automático y la minería de datos suelen emplear los mismos métodos y se superponen significativamente, pero mientras que el aprendizaje automático se centra en la predicción, basada en propiedades conocidas aprendidas de los datos de entrenamiento, la minería de datos se centra en el descubrimiento de propiedades (previamente) desconocidas en los datos (este es el paso de análisis del descubrimiento de conocimiento en bases de datos). La minería de datos utiliza muchos métodos de aprendizaje automático, pero con diferentes objetivos; por otro lado, el aprendizaje automático también emplea métodos de minería de datos como " aprendizaje no supervisado " o como un paso de preprocesamiento para mejorar la precisión del alumno. Gran parte de la confusión entre estas dos comunidades de investigación (que a menudo tienen conferencias y revistas independientes, siendo ECML PKDD una excepción importante) proviene de los supuestos básicos con los que trabajan: en el aprendizaje automático, el rendimiento generalmente se evalúa con respecto a la capacidad de reproducir el conocimiento conocido , mientras que en el descubrimiento de conocimiento y la minería de datos (KDD) la tarea clave es el descubrimiento de conocimiento previamente desconocido . Evaluado con respecto al conocimiento conocido, un método no informado (no supervisado) será fácilmente superado por otros métodos supervisados, mientras que en una tarea KDD típica, los métodos supervisados ​​no se pueden utilizar debido a la falta de disponibilidad de datos de entrenamiento.

El aprendizaje automático también tiene vínculos íntimos con la optimización : muchos problemas de aprendizaje se formulan como la minimización de alguna función de pérdida en un conjunto de ejemplos de entrenamiento. Las funciones de pérdida expresan la discrepancia entre las predicciones del modelo que se está entrenando y las instancias reales del problema (por ejemplo, en la clasificación, se desea asignar una etiqueta a las instancias y los modelos se entrenan para predecir correctamente las etiquetas preasignadas de un conjunto de ejemplos). [34]

Generalización

Caracterizar la generalización de varios algoritmos de aprendizaje es un tema activo de investigación actual, especialmente para los algoritmos de aprendizaje profundo .

Estadística

El aprendizaje automático y la estadística son campos estrechamente relacionados en términos de métodos, pero distintos en su objetivo principal: la estadística extrae inferencias poblacionales de una muestra , mientras que el aprendizaje automático encuentra patrones predictivos generalizables. [35] Según Michael I. Jordan , las ideas del aprendizaje automático, desde los principios metodológicos hasta las herramientas teóricas, tienen una larga prehistoria en la estadística. [36] También sugirió el término ciencia de datos como un marcador de posición para llamar al campo en general. [36]

Los análisis estadísticos convencionales requieren la selección a priori de un modelo más adecuado para el conjunto de datos de estudio. Además, solo se incluyen para el análisis variables significativas o teóricamente relevantes basadas en la experiencia previa. Por el contrario, el aprendizaje automático no se basa en un modelo preestructurado; más bien, los datos dan forma al modelo detectando patrones subyacentes. Cuantas más variables (entradas) se utilicen para entrenar el modelo, más preciso será el modelo final. [37]

Leo Breiman distinguió dos paradigmas de modelado estadístico: modelo de datos y modelo algorítmico, [38] donde "modelo algorítmico" significa más o menos los algoritmos de aprendizaje automático como Random Forest .

Algunos estadísticos han adoptado métodos del aprendizaje automático, dando lugar a un campo combinado al que denominan aprendizaje estadístico . [39]

Física estadística

Las técnicas analíticas y computacionales derivadas de la física profunda de sistemas desordenados se pueden extender a problemas de gran escala, incluido el aprendizaje automático, por ejemplo, para analizar el espacio de peso de redes neuronales profundas . [40] Por lo tanto, la física estadística está encontrando aplicaciones en el área de diagnóstico médico . [41]

Teoría

Un objetivo central de un aprendiz es generalizar a partir de su experiencia. [5] [42] La generalización en este contexto es la capacidad de una máquina de aprendizaje de realizar tareas o ejemplos nuevos e inéditos con precisión después de haber experimentado un conjunto de datos de aprendizaje. Los ejemplos de entrenamiento provienen de una distribución de probabilidad generalmente desconocida (considerada representativa del espacio de ocurrencias) y el aprendiz tiene que construir un modelo general sobre este espacio que le permita producir predicciones suficientemente precisas en nuevos casos.

El análisis computacional de los algoritmos de aprendizaje automático y su desempeño es una rama de la informática teórica conocida como teoría del aprendizaje computacional a través del modelo de aprendizaje probablemente aproximadamente correcto (PAC). Debido a que los conjuntos de entrenamiento son finitos y el futuro es incierto, la teoría del aprendizaje generalmente no ofrece garantías del desempeño de los algoritmos. En cambio, los límites probabilísticos del desempeño son bastante comunes. La descomposición de sesgo-varianza es una forma de cuantificar el error de generalización .

Para obtener el mejor rendimiento en el contexto de la generalización, la complejidad de la hipótesis debe coincidir con la complejidad de la función subyacente a los datos. Si la hipótesis es menos compleja que la función, entonces el modelo ha ajustado por debajo de los datos. Si la complejidad del modelo aumenta en respuesta, entonces el error de entrenamiento disminuye. Pero si la hipótesis es demasiado compleja, entonces el modelo está sujeto a un sobreajuste y la generalización será peor. [43]

Además de los límites de rendimiento, los teóricos del aprendizaje estudian la complejidad temporal y la viabilidad del aprendizaje. En la teoría del aprendizaje computacional, un cálculo se considera factible si se puede realizar en tiempo polinomial . Hay dos tipos de resultados de complejidad temporal : los resultados positivos muestran que una determinada clase de funciones se puede aprender en tiempo polinomial. Los resultados negativos muestran que determinadas clases no se pueden aprender en tiempo polinomial.

Aproches

Los enfoques de aprendizaje automático se dividen tradicionalmente en tres grandes categorías, que corresponden a paradigmas de aprendizaje, dependiendo de la naturaleza de la "señal" o "retroalimentación" disponible para el sistema de aprendizaje:

  • Aprendizaje supervisado : se le presentan al ordenador ejemplos de entradas y sus salidas deseadas, dadas por un "profesor", y el objetivo es aprender una regla general que asigna entradas a salidas.
  • Aprendizaje no supervisado : no se le asignan etiquetas al algoritmo de aprendizaje, por lo que se lo deja solo para que encuentre la estructura en su entrada. El aprendizaje no supervisado puede ser un objetivo en sí mismo (descubrir patrones ocultos en los datos) o un medio para alcanzar un fin ( aprendizaje de características ).
  • Aprendizaje por refuerzo : un programa informático interactúa con un entorno dinámico en el que debe alcanzar un objetivo determinado (como conducir un vehículo o jugar un juego contra un oponente). A medida que avanza por el espacio de problemas, el programa recibe una retroalimentación análoga a las recompensas, que intenta maximizar. [5]

Aunque cada algoritmo tiene ventajas y limitaciones, ningún algoritmo funciona para todos los problemas. [44] [45] [46]

Aprendizaje supervisado

Una máquina de vectores de soporte es un modelo de aprendizaje supervisado que divide los datos en regiones separadas por un límite lineal . Aquí, el límite lineal divide los círculos negros de los blancos.

Los algoritmos de aprendizaje supervisado construyen un modelo matemático de un conjunto de datos que contiene tanto las entradas como las salidas deseadas. [47] Los datos, conocidos como datos de entrenamiento , consisten en un conjunto de ejemplos de entrenamiento. Cada ejemplo de entrenamiento tiene una o más entradas y la salida deseada, también conocida como señal de supervisión. En el modelo matemático, cada ejemplo de entrenamiento está representado por una matriz o vector, a veces llamado vector de características , y los datos de entrenamiento están representados por una matriz . A través de la optimización iterativa de una función objetivo , los algoritmos de aprendizaje supervisado aprenden una función que se puede utilizar para predecir la salida asociada con nuevas entradas. [48] Una función óptima permite que el algoritmo determine correctamente la salida para entradas que no formaban parte de los datos de entrenamiento. Se dice que un algoritmo que mejora la precisión de sus salidas o predicciones con el tiempo ha aprendido a realizar esa tarea. [18]

Los tipos de algoritmos de aprendizaje supervisado incluyen el aprendizaje activo , la clasificación y la regresión . [49] Los algoritmos de clasificación se utilizan cuando los resultados están restringidos a un conjunto limitado de valores, y los algoritmos de regresión se utilizan cuando los resultados pueden tener cualquier valor numérico dentro de un rango. Como ejemplo, para un algoritmo de clasificación que filtra correos electrónicos, la entrada sería un correo electrónico entrante y la salida sería el nombre de la carpeta en la que se archiva el correo electrónico. Ejemplos de regresión serían predecir la altura de una persona o la temperatura futura. [50]

El aprendizaje por similitud es un área del aprendizaje automático supervisado estrechamente relacionada con la regresión y la clasificación, pero el objetivo es aprender de ejemplos utilizando una función de similitud que mide qué tan similares o relacionados son dos objetos. Tiene aplicaciones en la clasificación , los sistemas de recomendación , el seguimiento de la identidad visual, la verificación facial y la verificación del hablante.

Aprendizaje no supervisado

Los algoritmos de aprendizaje no supervisado encuentran estructuras en datos que no han sido etiquetados, clasificados o categorizados. En lugar de responder a la retroalimentación, los algoritmos de aprendizaje no supervisado identifican puntos en común en los datos y reaccionan en función de la presencia o ausencia de dichos puntos en común en cada nuevo dato. Las aplicaciones centrales del aprendizaje automático no supervisado incluyen la agrupación, la reducción de la dimensionalidad [7] y la estimación de la densidad [51] . Los algoritmos de aprendizaje no supervisado también agilizaron el proceso de identificación de grandes haplotipos basados ​​en indel de un gen de interés a partir de un genoma completo [52] .

La agrupación mediante pendientes permutadas de grandes indeles, CLIPS, [53] convierte la imagen de alineación en un problema de regresión de aprendizaje. Las estimaciones de pendiente variada ( b ) entre cada par de segmentos de ADN permiten identificar segmentos que comparten el mismo conjunto de indeles.

El análisis de conglomerados es la asignación de un conjunto de observaciones en subconjuntos (llamados conglomerados ) de modo que las observaciones dentro del mismo conglomerado sean similares de acuerdo con uno o más criterios predeterminados, mientras que las observaciones extraídas de diferentes conglomerados sean diferentes. Las diferentes técnicas de agrupamiento hacen diferentes suposiciones sobre la estructura de los datos, a menudo definidas por alguna métrica de similitud y evaluadas, por ejemplo, por la compacidad interna , o la similitud entre los miembros del mismo conglomerado, y la separación , la diferencia entre conglomerados. Otros métodos se basan en la densidad estimada y la conectividad de gráficos .

Un tipo especial de aprendizaje no supervisado, llamado aprendizaje autosupervisado , implica entrenar un modelo generando la señal de supervisión a partir de los propios datos. [54] [55]

Aprendizaje semisupervisado

El aprendizaje semisupervisado se encuentra entre el aprendizaje no supervisado (sin datos de entrenamiento etiquetados) y el aprendizaje supervisado (con datos de entrenamiento completamente etiquetados). A algunos de los ejemplos de entrenamiento les faltan etiquetas de entrenamiento, pero muchos investigadores de aprendizaje automático han descubierto que los datos no etiquetados, cuando se utilizan junto con una pequeña cantidad de datos etiquetados, pueden producir una mejora considerable en la precisión del aprendizaje.

En el aprendizaje débilmente supervisado , las etiquetas de entrenamiento son ruidosas, limitadas o imprecisas; sin embargo, estas etiquetas suelen ser más baratas de obtener, lo que da como resultado conjuntos de entrenamiento efectivos más grandes. [56]

Aprendizaje por refuerzo

El aprendizaje por refuerzo es un área del aprendizaje automático que se ocupa de cómo los agentes de software deben tomar acciones en un entorno para maximizar alguna noción de recompensa acumulativa. Debido a su generalidad, el campo se estudia en muchas otras disciplinas, como la teoría de juegos , la teoría de control , la investigación de operaciones , la teoría de la información , la optimización basada en simulación , los sistemas multiagente , la inteligencia de enjambre , las estadísticas y los algoritmos genéticos . En el aprendizaje por refuerzo, el entorno se representa típicamente como un proceso de decisión de Markov (MDP). Muchos algoritmos de aprendizaje por refuerzo utilizan técnicas de programación dinámica . [57] Los algoritmos de aprendizaje por refuerzo no suponen el conocimiento de un modelo matemático exacto del MDP y se utilizan cuando los modelos exactos son inviables. Los algoritmos de aprendizaje por refuerzo se utilizan en vehículos autónomos o para aprender a jugar un juego contra un oponente humano.

Reducción de dimensionalidad

La reducción de dimensionalidad es un proceso de reducción del número de variables aleatorias bajo consideración mediante la obtención de un conjunto de variables principales. [58] En otras palabras, es un proceso de reducción de la dimensión del conjunto de características , también llamado "número de características". La mayoría de las técnicas de reducción de dimensionalidad pueden considerarse como eliminación o extracción de características . Uno de los métodos populares de reducción de dimensionalidad es el análisis de componentes principales (PCA). El PCA implica cambiar datos de mayor dimensión (por ejemplo, 3D) a un espacio más pequeño (por ejemplo, 2D). La hipótesis de la variedad propone que los conjuntos de datos de alta dimensión se encuentran a lo largo de variedades de baja dimensión , y muchas técnicas de reducción de dimensionalidad hacen esta suposición, lo que conduce al área de aprendizaje de variedades y regularización de variedades .

Otros tipos

Se han desarrollado otros enfoques que no encajan perfectamente en esta triple categorización y, a veces, el mismo sistema de aprendizaje automático utiliza más de uno. Por ejemplo, el modelado de temas y el metaaprendizaje . [59]

Autoaprendizaje

El autoaprendizaje, como paradigma de aprendizaje automático, se introdujo en 1982 junto con una red neuronal capaz de autoaprender, denominada matriz adaptativa de barras cruzadas (CAA). [60] Se trata de un aprendizaje sin recompensas externas ni consejos externos del profesor. El algoritmo de autoaprendizaje CAA calcula, en forma de barras cruzadas, tanto las decisiones sobre acciones como las emociones (sentimientos) sobre situaciones de consecuencias. El sistema está impulsado por la interacción entre la cognición y la emoción. [61] El algoritmo de autoaprendizaje actualiza una matriz de memoria W =||w(a,s)|| de modo que en cada iteración ejecuta la siguiente rutina de aprendizaje automático:

  1. En la situación s realizar una acción
  2. recibir una situación de consecuencia
  3. Calcular la emoción de estar en la situación de consecuencia v(s')
  4. actualizar la memoria de la barra transversal w'(a,s) = w(a,s) + v(s')

Es un sistema con una sola entrada, situación, y una sola salida, acción (o conducta) a. No hay una entrada de refuerzo separada ni una entrada de consejo del entorno. El valor retropropagado (refuerzo secundario) es la emoción hacia la situación de consecuencia. El CAA existe en dos entornos, uno es el entorno conductual donde se comporta, y el otro es el entorno genético, de donde inicialmente y solo una vez recibe emociones iniciales sobre situaciones que se encontrarán en el entorno conductual. Después de recibir el vector del genoma (especie) del entorno genético, el CAA aprende una conducta de búsqueda de objetivos, en un entorno que contiene situaciones tanto deseables como indeseables. [62]

Aprendizaje de características

Varios algoritmos de aprendizaje tienen como objetivo descubrir mejores representaciones de las entradas proporcionadas durante el entrenamiento. [63] Los ejemplos clásicos incluyen el análisis de componentes principales y el análisis de conglomerados. Los algoritmos de aprendizaje de características, también llamados algoritmos de aprendizaje de representación, a menudo intentan preservar la información en su entrada, pero también transformarla de una manera que la haga útil, a menudo como un paso de preprocesamiento antes de realizar la clasificación o las predicciones. Esta técnica permite la reconstrucción de las entradas que provienen de la distribución generadora de datos desconocida, aunque no es necesariamente fiel a las configuraciones que son inverosímiles bajo esa distribución. Esto reemplaza la ingeniería de características manual y permite que una máquina aprenda las características y las use para realizar una tarea específica.

El aprendizaje de características puede ser supervisado o no supervisado. En el aprendizaje de características supervisado, las características se aprenden utilizando datos de entrada etiquetados. Los ejemplos incluyen redes neuronales artificiales , perceptrones multicapa y aprendizaje de diccionario supervisado . En el aprendizaje de características no supervisado, las características se aprenden con datos de entrada no etiquetados. Los ejemplos incluyen aprendizaje de diccionario, análisis de componentes independientes , autocodificadores , factorización matricial [64] y varias formas de agrupamiento . [65] [66] [67]

Los algoritmos de aprendizaje múltiple intentan hacerlo bajo la restricción de que la representación aprendida es de baja dimensión. Los algoritmos de codificación dispersa intentan hacerlo bajo la restricción de que la representación aprendida es dispersa, lo que significa que el modelo matemático tiene muchos ceros. Los algoritmos de aprendizaje de subespacios multilineales apuntan a aprender representaciones de baja dimensión directamente de representaciones tensoriales para datos multidimensionales, sin remodelarlos en vectores de dimensiones superiores. [68] Los algoritmos de aprendizaje profundo descubren múltiples niveles de representación, o una jerarquía de características, con características de nivel superior, más abstractas definidas en términos de (o generando) características de nivel inferior. Se ha argumentado que una máquina inteligente es aquella que aprende una representación que desenreda los factores subyacentes de variación que explican los datos observados. [69]

El aprendizaje de características está motivado por el hecho de que las tareas de aprendizaje automático, como la clasificación, a menudo requieren datos que sean matemática y computacionalmente convenientes para procesar. Sin embargo, los datos del mundo real, como imágenes, videos y datos sensoriales, no han dado lugar a intentos de definir algorítmicamente características específicas. Una alternativa es descubrir dichas características o representaciones mediante el examen, sin depender de algoritmos explícitos.

Aprendizaje de diccionarios dispersos

El aprendizaje de diccionario disperso es un método de aprendizaje de características en el que un ejemplo de entrenamiento se representa como una combinación lineal de funciones base y se supone que es una matriz dispersa . El método es fuertemente NP-hard y difícil de resolver de forma aproximada. [70] Un método heurístico popular para el aprendizaje de diccionario disperso es el algoritmo k -SVD . El aprendizaje de diccionario disperso se ha aplicado en varios contextos. En la clasificación, el problema es determinar la clase a la que pertenece un ejemplo de entrenamiento no visto previamente. Para un diccionario donde ya se ha construido cada clase, se asocia un nuevo ejemplo de entrenamiento con la clase que está mejor representada de forma dispersa por el diccionario correspondiente. El aprendizaje de diccionario disperso también se ha aplicado en la eliminación de ruido de imágenes . La idea clave es que un parche de imagen limpio puede ser representado de forma dispersa por un diccionario de imágenes, pero el ruido no. [71]

Detección de anomalías

En la minería de datos , la detección de anomalías, también conocida como detección de valores atípicos, es la identificación de elementos, eventos u observaciones raros que generan sospechas al diferir significativamente de la mayoría de los datos. [72] Por lo general, los elementos anómalos representan un problema como un fraude bancario , un defecto estructural, problemas médicos o errores en un texto. Las anomalías se conocen como valores atípicos , novedades, ruido, desviaciones y excepciones. [73]

En particular, en el contexto de la detección de abusos e intrusiones en la red, los objetos interesantes no suelen ser objetos raros, sino estallidos inesperados de inactividad. Este patrón no se ajusta a la definición estadística común de un valor atípico como un objeto raro. Muchos métodos de detección de valores atípicos (en particular, algoritmos no supervisados) fallarán con dichos datos a menos que se agreguen adecuadamente. En cambio, un algoritmo de análisis de conglomerados puede ser capaz de detectar los microconglomerados formados por estos patrones. [74]

Existen tres categorías amplias de técnicas de detección de anomalías. [75] Las técnicas de detección de anomalías no supervisadas detectan anomalías en un conjunto de datos de prueba sin etiquetar bajo el supuesto de que la mayoría de las instancias en el conjunto de datos son normales, buscando instancias que parezcan ajustarse menos al resto del conjunto de datos. Las técnicas de detección de anomalías supervisadas requieren un conjunto de datos que haya sido etiquetado como "normal" y "anormal" e implican el entrenamiento de un clasificador (la diferencia clave con muchos otros problemas de clasificación estadística es la naturaleza inherentemente desequilibrada de la detección de valores atípicos). Las técnicas de detección de anomalías semisupervisadas construyen un modelo que representa el comportamiento normal a partir de un conjunto de datos de entrenamiento normal dado y luego prueban la probabilidad de que el modelo genere una instancia de prueba.

Aprendizaje robótico

El aprendizaje robótico se inspira en una multitud de métodos de aprendizaje automático, empezando por el aprendizaje supervisado, el aprendizaje de refuerzo, [76] [77] y finalmente el metaaprendizaje (por ejemplo, MAML).

Reglamento de la asociación

El aprendizaje de reglas de asociación es un método de aprendizaje automático basado en reglas para descubrir relaciones entre variables en bases de datos grandes. Su objetivo es identificar reglas sólidas descubiertas en bases de datos utilizando alguna medida de "interés". [78]

El aprendizaje automático basado en reglas es un término general para cualquier método de aprendizaje automático que identifica, aprende o desarrolla "reglas" para almacenar, manipular o aplicar conocimiento. La característica definitoria de un algoritmo de aprendizaje automático basado en reglas es la identificación y utilización de un conjunto de reglas relacionales que representan colectivamente el conocimiento capturado por el sistema. Esto contrasta con otros algoritmos de aprendizaje automático que comúnmente identifican un modelo singular que se puede aplicar universalmente a cualquier instancia para hacer una predicción. [79] Los enfoques de aprendizaje automático basados ​​en reglas incluyen sistemas de clasificación de aprendizaje , aprendizaje de reglas de asociación y sistemas inmunológicos artificiales .

Basándose en el concepto de reglas fuertes, Rakesh Agrawal , Tomasz Imieliński y Arun Swami introdujeron reglas de asociación para descubrir regularidades entre productos en datos de transacciones a gran escala registrados por sistemas de puntos de venta (POS) en supermercados. [80] Por ejemplo, la regla encontrada en los datos de ventas de un supermercado indicaría que si un cliente compra cebollas y patatas juntas, es probable que también compre carne de hamburguesa. Dicha información se puede utilizar como base para decisiones sobre actividades de marketing, como precios promocionales o ubicaciones de productos . Además del análisis de la cesta de la compra , las reglas de asociación se emplean hoy en día en áreas de aplicación que incluyen la minería de uso web , la detección de intrusiones , la producción continua y la bioinformática . A diferencia de la minería de secuencias , el aprendizaje de reglas de asociación normalmente no considera el orden de los artículos ni dentro de una transacción ni entre transacciones. { o n i o n s , p o t a t o e s } { b u r g e r } {\displaystyle \{\mathrm {onions,potatoes} \}\Rightarrow \{\mathrm {burger} \}}

Los sistemas de clasificación de aprendizaje (LCS) son una familia de algoritmos de aprendizaje automático basados ​​en reglas que combinan un componente de descubrimiento, normalmente un algoritmo genético , con un componente de aprendizaje, realizando aprendizaje supervisado , aprendizaje de refuerzo o aprendizaje no supervisado . Buscan identificar un conjunto de reglas dependientes del contexto que almacenan y aplican colectivamente el conocimiento de manera fragmentada para hacer predicciones. [81]

La programación lógica inductiva (ILP) es un enfoque para el aprendizaje de reglas que utiliza la programación lógica como una representación uniforme para ejemplos de entrada, conocimiento previo e hipótesis. Dada una codificación del conocimiento previo conocido y un conjunto de ejemplos representados como una base de datos lógica de hechos, un sistema ILP derivará un programa lógico hipotético que implica todos los ejemplos positivos y ningún ejemplo negativo. La programación inductiva es un campo relacionado que considera cualquier tipo de lenguaje de programación para representar hipótesis (y no solo programación lógica), como programas funcionales .

La programación lógica inductiva es particularmente útil en bioinformática y procesamiento del lenguaje natural . Gordon Plotkin y Ehud Shapiro sentaron las bases teóricas iniciales para el aprendizaje automático inductivo en un entorno lógico. [82] [83] [84] Shapiro construyó su primera implementación (Model Inference System) en 1981: un programa Prolog que infería inductivamente programas lógicos a partir de ejemplos positivos y negativos. [85] El término inductivo aquí se refiere a la inducción filosófica , que sugiere una teoría para explicar hechos observados, en lugar de la inducción matemática , que demuestra una propiedad para todos los miembros de un conjunto bien ordenado.

Modelos

AUn modelo de aprendizaje automático es un tipo demodelo matemáticoque, después de ser "entrenado" en un conjunto de datos determinado, puede usarse para hacer predicciones o clasificaciones sobre nuevos datos. Durante el entrenamiento, un algoritmo de aprendizaje ajusta iterativamente los parámetros internos del modelo para minimizar los errores en sus predicciones.[86]Por extensión, el término "modelo" puede referirse a varios niveles de especificidad, desde una clase general de modelos y sus algoritmos de aprendizaje asociados hasta un modelo completamente entrenado con todos sus parámetros internos ajustados.[87]

Se han utilizado e investigado varios tipos de modelos para los sistemas de aprendizaje automático; elegir el mejor modelo para una tarea se denomina selección de modelo .

Redes neuronales artificiales

Una red neuronal artificial es un grupo de nodos interconectados, similar a la vasta red de neuronas de un cerebro . Aquí, cada nodo circular representa una neurona artificial y una flecha representa una conexión desde la salida de una neurona artificial hasta la entrada de otra.

Las redes neuronales artificiales (RNA), o sistemas conexionistas , son sistemas informáticos vagamente inspirados en las redes neuronales biológicas que constituyen los cerebros animales . Estos sistemas "aprenden" a realizar tareas considerando ejemplos, generalmente sin estar programados con reglas específicas para la tarea.

Una ANN es un modelo basado en una colección de unidades o nodos conectados llamados " neuronas artificiales ", que modelan libremente las neuronas en un cerebro biológico. Cada conexión, como las sinapsis en un cerebro biológico, puede transmitir información, una "señal", de una neurona artificial a otra. Una neurona artificial que recibe una señal puede procesarla y luego enviar una señal a neuronas artificiales adicionales conectadas a ella. En las implementaciones comunes de ANN, la señal en una conexión entre neuronas artificiales es un número real , y la salida de cada neurona artificial se calcula mediante alguna función no lineal de la suma de sus entradas. Las conexiones entre neuronas artificiales se denominan "bordes". Las neuronas artificiales y los bordes suelen tener un peso que se ajusta a medida que avanza el aprendizaje. El peso aumenta o disminuye la fuerza de la señal en una conexión. Las neuronas artificiales pueden tener un umbral de modo que la señal solo se envíe si la señal agregada cruza ese umbral. Normalmente, las neuronas artificiales se agregan en capas. Diferentes capas pueden realizar diferentes tipos de transformaciones en sus entradas. Las señales viajan desde la primera capa (la capa de entrada) a la última capa (la capa de salida), posiblemente después de atravesar las capas varias veces.

El objetivo original del enfoque ANN era resolver problemas de la misma manera que lo haría un cerebro humano . Sin embargo, con el tiempo, la atención se desplazó a la realización de tareas específicas, lo que llevó a desviaciones de la biología . Las redes neuronales artificiales se han utilizado en una variedad de tareas, incluida la visión artificial , el reconocimiento de voz , la traducción automática , el filtrado de redes sociales , los juegos de mesa y de video y el diagnóstico médico .

El aprendizaje profundo consta de múltiples capas ocultas en una red neuronal artificial. Este enfoque intenta modelar la forma en que el cerebro humano procesa la luz y el sonido para transformarlos en visión y audición. Algunas aplicaciones exitosas del aprendizaje profundo son la visión artificial y el reconocimiento de voz. [88]

Árboles de decisión

Un árbol de decisiones que muestra la probabilidad de supervivencia de los pasajeros del Titanic

El aprendizaje de árboles de decisión utiliza un árbol de decisión como modelo predictivo para pasar de las observaciones sobre un elemento (representado en las ramas) a las conclusiones sobre el valor objetivo del elemento (representado en las hojas). Es uno de los enfoques de modelado predictivo utilizados en estadística, minería de datos y aprendizaje automático. Los modelos de árbol donde la variable objetivo puede tomar un conjunto discreto de valores se denominan árboles de clasificación; en estas estructuras de árbol, las hojas representan etiquetas de clase y las ramas representan conjunciones de características que conducen a esas etiquetas de clase. Los árboles de decisión donde la variable objetivo puede tomar valores continuos (normalmente números reales ) se denominan árboles de regresión. En el análisis de decisiones, un árbol de decisión se puede utilizar para representar visual y explícitamente las decisiones y la toma de decisiones . En la minería de datos, un árbol de decisión describe los datos, pero el árbol de clasificación resultante puede ser una entrada para la toma de decisiones.

Máquinas de vectores de soporte

Las máquinas de vectores de soporte (SVM), también conocidas como redes de vectores de soporte, son un conjunto de métodos de aprendizaje supervisado relacionados que se utilizan para la clasificación y la regresión. Dado un conjunto de ejemplos de entrenamiento, cada uno marcado como perteneciente a una de dos categorías, un algoritmo de entrenamiento SVM construye un modelo que predice si un nuevo ejemplo cae en una categoría. [89] Un algoritmo de entrenamiento SVM es un clasificador lineal , binario y no probabilístico , aunque existen métodos como el escalamiento de Platt para usar SVM en un entorno de clasificación probabilística. Además de realizar una clasificación lineal, las SVM pueden realizar de manera eficiente una clasificación no lineal utilizando lo que se llama el truco del núcleo , mapeando implícitamente sus entradas en espacios de características de alta dimensión.

Análisis de regresión

Ilustración de regresión lineal en un conjunto de datos

El análisis de regresión abarca una gran variedad de métodos estadísticos para estimar la relación entre las variables de entrada y sus características asociadas. Su forma más común es la regresión lineal , donde se dibuja una sola línea para ajustar mejor los datos dados de acuerdo con un criterio matemático como los mínimos cuadrados ordinarios . Este último a menudo se extiende mediante métodos de regularización para mitigar el sobreajuste y el sesgo, como en la regresión de cresta . Cuando se trata de problemas no lineales, los modelos a los que se recurre incluyen la regresión polinómica (por ejemplo, utilizada para el ajuste de líneas de tendencia en Microsoft Excel [90] ), la regresión logística (a menudo utilizada en la clasificación estadística ) o incluso la regresión kernel , que introduce la no linealidad al aprovechar el truco del kernel para mapear implícitamente las variables de entrada a un espacio de mayor dimensión.

Redes bayesianas

Una red bayesiana simple. La lluvia influye en si se activa el aspersor y tanto la lluvia como el aspersor influyen en si el césped está mojado.

Una red bayesiana, red de creencias o modelo gráfico acíclico dirigido es un modelo gráfico probabilístico que representa un conjunto de variables aleatorias y su independencia condicional con un gráfico acíclico dirigido (DAG). Por ejemplo, una red bayesiana podría representar las relaciones probabilísticas entre enfermedades y síntomas. Dados los síntomas, la red se puede utilizar para calcular las probabilidades de presencia de varias enfermedades. Existen algoritmos eficientes que realizan inferencia y aprendizaje. Las redes bayesianas que modelan secuencias de variables, como señales de voz o secuencias de proteínas , se denominan redes bayesianas dinámicas . Las generalizaciones de redes bayesianas que pueden representar y resolver problemas de decisión en condiciones de incertidumbre se denominan diagramas de influencia .

Procesos gaussianos

Un ejemplo de regresión del proceso gaussiano (predicción) comparado con otros modelos de regresión [91]

Un proceso gaussiano es un proceso estocástico en el que cada colección finita de variables aleatorias en el proceso tiene una distribución normal multivariada y se basa en una función de covarianza predefinida , o kernel, que modela cómo los pares de puntos se relacionan entre sí dependiendo de sus ubicaciones.

Dado un conjunto de puntos observados, o ejemplos de entrada-salida, la distribución de la salida (no observada) de un nuevo punto en función de sus datos de entrada se puede calcular directamente observando los puntos observados y las covarianzas entre esos puntos y el nuevo punto no observado.

Los procesos gaussianos son modelos sustitutos populares en la optimización bayesiana que se utilizan para realizar optimización de hiperparámetros .

Algoritmos genéticos

Un algoritmo genético (AG) es un algoritmo de búsqueda y una técnica heurística que imita el proceso de selección natural , utilizando métodos como la mutación y el cruce para generar nuevos genotipos con la esperanza de encontrar buenas soluciones a un problema determinado. En el aprendizaje automático, los algoritmos genéticos se utilizaron en las décadas de 1980 y 1990. [92] [93] Por el contrario, las técnicas de aprendizaje automático se han utilizado para mejorar el rendimiento de los algoritmos genéticos y evolutivos . [94]

Funciones de la creencia

La teoría de las funciones de creencia, también conocida como teoría de la evidencia o teoría de Dempster-Shafer, es un marco general para razonar con incertidumbre, con conexiones entendidas con otros marcos como las teorías de probabilidad , posibilidad y probabilidad imprecisa . Estos marcos teóricos pueden considerarse como una especie de aprendiz y tienen algunas propiedades análogas de cómo se combina la evidencia (por ejemplo, la regla de combinación de Dempster), al igual que cómo en un enfoque bayesiano basado en pmf [ aclaración necesaria ] se combinarían probabilidades. Sin embargo, existen muchas salvedades para estas funciones de creencia en comparación con los enfoques bayesianos para incorporar la ignorancia y la cuantificación de la incertidumbre . Estos enfoques de función de creencia que se implementan dentro del dominio del aprendizaje automático generalmente aprovechan un enfoque de fusión de varios métodos de conjunto para manejar mejor el límite de decisión del alumno , las muestras bajas y los problemas de clase ambiguos que el enfoque de aprendizaje automático estándar tiende a tener dificultades para resolver. [4] [9] Sin embargo, la complejidad computacional de estos algoritmos depende del número de proposiciones (clases) y puede generar un tiempo de cálculo mucho mayor en comparación con otros enfoques de aprendizaje automático.

Modelos de entrenamiento

Por lo general, los modelos de aprendizaje automático requieren una gran cantidad de datos confiables para realizar predicciones precisas. Al entrenar un modelo de aprendizaje automático, los ingenieros de aprendizaje automático deben apuntar y recopilar una muestra grande y representativa de datos. Los datos del conjunto de entrenamiento pueden ser tan variados como un corpus de texto , una colección de imágenes, datos de sensores y datos recopilados de usuarios individuales de un servicio. El sobreajuste es algo a tener en cuenta al entrenar un modelo de aprendizaje automático. Los modelos entrenados derivados de datos sesgados o no evaluados pueden dar como resultado predicciones sesgadas o no deseadas. Los modelos sesgados pueden dar como resultado resultados perjudiciales, lo que aumenta los impactos negativos en la sociedad o los objetivos. El sesgo algorítmico es un resultado potencial de que los datos no estén completamente preparados para el entrenamiento. La ética del aprendizaje automático se está convirtiendo en un campo de estudio y, en particular, se está integrando en los equipos de ingeniería de aprendizaje automático.

Aprendizaje federado

El aprendizaje federado es una forma adaptada de inteligencia artificial distribuida para entrenar modelos de aprendizaje automático que descentraliza el proceso de entrenamiento, lo que permite mantener la privacidad de los usuarios al no tener que enviar sus datos a un servidor centralizado. Esto también aumenta la eficiencia al descentralizar el proceso de entrenamiento a muchos dispositivos. Por ejemplo, Gboard utiliza el aprendizaje automático federado para entrenar modelos de predicción de consultas de búsqueda en los teléfonos móviles de los usuarios sin tener que enviar búsquedas individuales a Google . [95]

Aplicaciones

Existen muchas aplicaciones para el aprendizaje automático, entre ellas:

En 2006, el proveedor de servicios multimedia Netflix celebró el primer concurso " Netflix Prize " para encontrar un programa que predijera mejor las preferencias de los usuarios y mejorara la precisión de su algoritmo de recomendación de películas Cinematch existente en al menos un 10%. Un equipo conjunto formado por investigadores de AT&T Labs -Research en colaboración con los equipos Big Chaos y Pragmatic Theory construyó un modelo de conjunto para ganar el Gran Premio en 2009 por $ 1 millón. [98] Poco después de que se otorgara el premio, Netflix se dio cuenta de que las calificaciones de los espectadores no eran los mejores indicadores de sus patrones de visualización ("todo es una recomendación") y cambiaron su motor de recomendación en consecuencia. [99] En 2010, The Wall Street Journal escribió sobre la firma Rebellion Research y su uso del aprendizaje automático para predecir la crisis financiera. [100] En 2012, el cofundador de Sun Microsystems , Vinod Khosla , predijo que el 80% de los trabajos de los médicos se perderían en las próximas dos décadas debido al software de diagnóstico médico de aprendizaje automático automatizado. [101] En 2014, se informó que se había aplicado un algoritmo de aprendizaje automático en el campo de la historia del arte para estudiar pinturas de bellas artes y que puede haber revelado influencias previamente no reconocidas entre los artistas. [102] En 2019, Springer Nature publicó el primer libro de investigación creado utilizando aprendizaje automático. [103] En 2020, se utilizó la tecnología de aprendizaje automático para ayudar a realizar diagnósticos y ayudar a los investigadores a desarrollar una cura para COVID-19. [104] El aprendizaje automático se aplicó recientemente para predecir el comportamiento proambiental de los viajeros. [105] Recientemente, la tecnología de aprendizaje automático también se aplicó para optimizar el rendimiento y el comportamiento térmico de los teléfonos inteligentes en función de la interacción del usuario con el teléfono. [106] [107] [108] Cuando se aplican correctamente, los algoritmos de aprendizaje automático (MLA) pueden utilizar una amplia gama de características de la empresa para predecir los retornos de las acciones sin sobreajuste . Al emplear una ingeniería de características eficaz y combinar pronósticos, los MLA pueden generar resultados que superan con creces los obtenidos con técnicas lineales básicas como OLS . [109]

Los recientes avances en el aprendizaje automático se han extendido al campo de la química cuántica, donde nuevos algoritmos ahora permiten predecir los efectos de los solventes en las reacciones químicas, ofreciendo así nuevas herramientas para que los químicos adapten las condiciones experimentales para obtener resultados óptimos. [110]

El aprendizaje automático se está convirtiendo en una herramienta útil para investigar y predecir la toma de decisiones de evacuación en desastres a gran y pequeña escala. Se han probado diferentes soluciones para predecir si los propietarios de viviendas deciden evacuar durante incendios forestales y huracanes y cuándo lo hacen. [111] [112] [113] Otras aplicaciones se han centrado en las decisiones previas a la evacuación en incendios de edificios. [114] [115]

Limitaciones

Aunque el aprendizaje automático ha sido transformador en algunos campos, los programas de aprendizaje automático a menudo no logran ofrecer los resultados esperados. [116] [117] [118] Las razones para esto son numerosas: falta de datos (adecuados), falta de acceso a los datos, sesgo de datos, problemas de privacidad, tareas y algoritmos mal elegidos, herramientas y personas equivocadas, falta de recursos y problemas de evaluación. [119]

La " teoría de la caja negra " plantea otro desafío, aunque significativo. La caja negra se refiere a una situación en la que el algoritmo o el proceso de producción de un resultado es completamente opaco, lo que significa que ni siquiera los codificadores del algoritmo pueden auditar el patrón que la máquina extrajo de los datos. [120] El Comité Selecto de la Cámara de los Lores, que afirmó que un "sistema de inteligencia" de ese tipo que podría tener un "impacto sustancial en la vida de un individuo" no se consideraría aceptable a menos que proporcionara "una explicación completa y satisfactoria de las decisiones" que toma. [120]

En 2018, un automóvil autónomo de Uber no detectó a un peatón, que murió después de una colisión. [121] Los intentos de utilizar el aprendizaje automático en el ámbito sanitario con el sistema IBM Watson no dieron resultado incluso después de años de tiempo y miles de millones de dólares invertidos. [122] [123] Se ha informado de que el chatbot Bing Chat de Microsoft produce una respuesta hostil y ofensiva contra sus usuarios. [124]

El aprendizaje automático se ha utilizado como estrategia para actualizar la evidencia relacionada con una revisión sistemática y el aumento de la carga de trabajo de los revisores en relación con el crecimiento de la literatura biomédica. Si bien ha mejorado con los conjuntos de entrenamiento, aún no se ha desarrollado lo suficiente como para reducir la carga de trabajo sin limitar la sensibilidad necesaria para la investigación de los hallazgos en sí. [125]

Inclinación

Los distintos enfoques de aprendizaje automático pueden sufrir distintos sesgos en los datos. Un sistema de aprendizaje automático entrenado específicamente con clientes actuales puede no ser capaz de predecir las necesidades de nuevos grupos de clientes que no están representados en los datos de entrenamiento. Cuando se entrena con datos generados por humanos, es probable que el aprendizaje automático detecte los sesgos constitucionales e inconscientes que ya están presentes en la sociedad. [126]

Se ha demostrado que los modelos de lenguaje aprendidos a partir de datos contienen sesgos similares a los humanos. [127] [128] En un experimento llevado a cabo por ProPublica , una organización de periodismo de investigación , la información de un algoritmo de aprendizaje automático sobre las tasas de reincidencia entre los prisioneros marcó falsamente "los acusados ​​​​negros de alto riesgo con el doble de frecuencia que los acusados ​​​​blancos". [129] En 2015, Google Photos solía etiquetar a las personas negras como gorilas, [129] y en 2018, esto todavía no se resolvió bien, pero Google, según se informa, todavía estaba usando la solución alternativa para eliminar a todos los gorilas de los datos de entrenamiento y, por lo tanto, no pudo reconocer gorilas reales en absoluto. [130] Se han encontrado problemas similares con el reconocimiento de personas no blancas en muchos otros sistemas. [131] En 2016, Microsoft probó Tay , un chatbot que aprendió de Twitter, y rápidamente captó lenguaje racista y sexista. [132]

Debido a estos desafíos, el uso efectivo del aprendizaje automático puede tardar más en ser adoptado en otros dominios. [133] La preocupación por la equidad en el aprendizaje automático, es decir, reducir el sesgo en el aprendizaje automático e impulsar su uso para el bien humano, es expresada cada vez más por los científicos de inteligencia artificial, incluido Fei-Fei Li , quien recuerda a los ingenieros que "[n]o hay nada artificial en la IA. Está inspirada por las personas, es creada por personas y, lo más importante, impacta en las personas. Es una herramienta poderosa que recién estamos comenzando a comprender, y eso es una profunda responsabilidad". [134]

Explicabilidad

La IA explicable (XAI), o IA interpretable, o aprendizaje automático explicable (XML), es inteligencia artificial (IA) en la que los humanos pueden comprender las decisiones o predicciones realizadas por la IA. [135] Contrasta con el concepto de "caja negra" en el aprendizaje automático, donde ni siquiera sus diseñadores pueden explicar por qué una IA llegó a una decisión específica. [136] Al refinar los modelos mentales de los usuarios de sistemas impulsados ​​por IA y desmantelar sus conceptos erróneos, la XAI promete ayudar a los usuarios a desempeñarse de manera más efectiva. La XAI puede ser una implementación del derecho social a la explicación.

Sobreajuste

La línea azul podría ser un ejemplo de sobreajuste de una función lineal debido al ruido aleatorio.

La adopción de una teoría deficiente y excesivamente compleja manipulada para que se ajuste a todos los datos de entrenamiento anteriores se conoce como sobreajuste. Muchos sistemas intentan reducir el sobreajuste recompensando una teoría de acuerdo con lo bien que se ajusta a los datos, pero penalizándola de acuerdo con lo compleja que es. [137]

Otras limitaciones y vulnerabilidades

Los estudiantes también pueden decepcionarse al "aprender la lección equivocada". Un ejemplo práctico es que un clasificador de imágenes entrenado sólo con imágenes de caballos marrones y gatos negros podría concluir que es probable que todas las manchas marrones sean caballos. [138] Un ejemplo del mundo real es que, a diferencia de los humanos, los clasificadores de imágenes actuales a menudo no realizan juicios principalmente a partir de la relación espacial entre los componentes de la imagen, y aprenden relaciones entre píxeles que los humanos no conocen, pero que aún se correlacionan con imágenes de ciertos tipos de objetos reales. Modificar estos patrones en una imagen legítima puede dar como resultado imágenes "antagónicas" que el sistema clasifica incorrectamente. [139] [140]

Las vulnerabilidades adversarias también pueden resultar en sistemas no lineales o perturbaciones que no siguen patrones. En algunos sistemas, es posible cambiar la salida modificando solo un píxel elegido por el adversario. [141] Los modelos de aprendizaje automático suelen ser vulnerables a la manipulación o evasión a través del aprendizaje automático adversario . [142]

Los investigadores han demostrado cómo se pueden colocar puertas traseras de forma indetectable en modelos de aprendizaje automático de clasificación (por ejemplo, para las categorías "spam" y "no spam" de publicaciones bien visibles) que a menudo son desarrollados y/o entrenados por terceros. Las partes pueden cambiar la clasificación de cualquier entrada, incluso en casos para los que se proporciona un tipo de transparencia de datos/software , posiblemente incluyendo el acceso de caja blanca . [143] [144] [145]

Evaluaciones de modelos

La clasificación de los modelos de aprendizaje automático se puede validar mediante técnicas de estimación de precisión como el método de retención , que divide los datos en un conjunto de entrenamiento y prueba (convencionalmente, designación de conjunto de entrenamiento 2/3 y conjunto de prueba 1/3) y evalúa el rendimiento del modelo de entrenamiento en el conjunto de prueba. En comparación, el método de validación cruzada K-fold divide aleatoriamente los datos en K subconjuntos y luego se realizan K experimentos, cada uno considerando respectivamente 1 subconjunto para la evaluación y los K-1 subconjuntos restantes para entrenar el modelo. Además de los métodos de retención y validación cruzada, se puede utilizar bootstrap , que muestrea n instancias con reemplazo del conjunto de datos, para evaluar la precisión del modelo. [146]

Además de la precisión general, los investigadores informan con frecuencia la sensibilidad y la especificidad , es decir, la tasa de verdaderos positivos (TPR) y la tasa de verdaderos negativos (TNR), respectivamente. De manera similar, los investigadores a veces informan la tasa de falsos positivos (FPR) así como la tasa de falsos negativos (FNR). Sin embargo, estas tasas son proporciones que no revelan sus numeradores y denominadores. La característica operativa total (TOC) es un método eficaz para expresar la capacidad diagnóstica de un modelo. La TOC muestra los numeradores y denominadores de las tasas mencionadas anteriormente, por lo que la TOC proporciona más información que la característica operativa del receptor (ROC) comúnmente utilizada y el área bajo la curva (AUC) asociada a la ROC. [147]

Ética

El aprendizaje automático plantea una serie de cuestiones éticas . Los sistemas que se entrenan con conjuntos de datos recopilados con sesgos pueden exhibir estos sesgos al usarlos ( sesgo algorítmico ), digitalizando así los prejuicios culturales. [148] Por ejemplo, en 1988, la Comisión para la Igualdad Racial del Reino Unido descubrió que la Escuela de Medicina de St. George había estado utilizando un programa informático entrenado a partir de datos del personal de admisiones anterior y que este programa había rechazado a casi 60 candidatos que se descubrió que eran mujeres o tenían nombres que no sonaban a europeos. [126] El uso de datos de contratación laboral de una empresa con políticas de contratación racistas puede llevar a un sistema de aprendizaje automático a duplicar el sesgo al calificar a los solicitantes de empleo por similitud con solicitantes exitosos anteriores. [149] [150] Otro ejemplo incluye el algoritmo predictivo de la empresa de vigilancia predictiva Geolitica que resultó en "niveles desproporcionadamente altos de vigilancia excesiva en comunidades de bajos ingresos y minoritarias" después de ser entrenado con datos históricos sobre delitos. [129]

Si bien la recopilación responsable de datos y la documentación de las reglas algorítmicas utilizadas por un sistema se considera una parte fundamental del aprendizaje automático, algunos investigadores culpan a la falta de participación y representación de la población minoritaria en el campo de la IA por la vulnerabilidad del aprendizaje automático a los sesgos. [151] De hecho, según una investigación realizada por la Asociación de Investigación Informática (CRA) en 2021, "las profesoras representan solo el 16,1%" de todos los profesores que se centran en la IA en varias universidades de todo el mundo. [152] Además, entre el grupo de "nuevos graduados de doctorado en IA residentes en EE. UU.", el 45% se identificó como blanco, el 22,4% como asiático, el 3,2% como hispano y el 2,4% como afroamericano, lo que demuestra aún más la falta de diversidad en el campo de la IA. [152]

La IA puede estar bien equipada para tomar decisiones en campos técnicos que dependen en gran medida de datos e información histórica. Estas decisiones dependen de la objetividad y el razonamiento lógico. [153] Debido a que los lenguajes humanos contienen sesgos, las máquinas entrenadas en corpus lingüísticos necesariamente también aprenderán estos sesgos. [154] [155]

En el ámbito de la atención sanitaria se observan otras formas de desafíos éticos, no relacionados con prejuicios personales. Entre los profesionales de la atención sanitaria existe la preocupación de que estos sistemas no estén diseñados en beneficio del público, sino como máquinas generadoras de ingresos. [156] Esto es especialmente cierto en los Estados Unidos, donde existe un dilema ético de larga data entre mejorar la atención sanitaria, pero también aumentar las ganancias. Por ejemplo, los algoritmos podrían estar diseñados para proporcionar a los pacientes pruebas o medicamentos innecesarios en los que los propietarios de los algoritmos tienen intereses. Existe el potencial de que el aprendizaje automático en el ámbito de la atención sanitaria proporcione a los profesionales una herramienta adicional para diagnosticar, medicar y planificar vías de recuperación para los pacientes, pero esto requiere que se mitiguen estos prejuicios. [157]

Hardware

Desde la década de 2010, los avances tanto en algoritmos de aprendizaje automático como en hardware informático han dado lugar a métodos más eficientes para entrenar redes neuronales profundas (un subdominio particular y estrecho del aprendizaje automático) que contienen muchas capas de unidades ocultas no lineales. [158] Para 2019, las unidades de procesamiento gráfico ( GPU ), a menudo con mejoras específicas de IA, habían desplazado a las CPU como el método dominante para entrenar IA en la nube comercial a gran escala. [159] OpenAI estimó la computación de hardware utilizada en los proyectos de aprendizaje profundo más grandes desde AlexNet (2012) hasta AlphaZero (2017), y encontró un aumento de 300.000 veces en la cantidad de computación requerida, con una línea de tendencia de tiempo de duplicación de 3,4 meses. [160] [161]

Redes neuronales físicas/neuromórficas

Una red neuronal física o computadora neuromórfica es un tipo de red neuronal artificial en la que se utiliza un material ajustable eléctricamente para emular la función de una sinapsis neuronal . El término red neuronal "física" se utiliza para enfatizar la dependencia del hardware físico utilizado para emular neuronas en oposición a los enfoques basados ​​en software. De manera más general, el término se aplica a otras redes neuronales artificiales en las que se utiliza un memristor u otro material de resistencia ajustable eléctricamente para emular una sinapsis neuronal. [162] [163]

Aprendizaje automático integrado

El aprendizaje automático integrado es un subcampo del aprendizaje automático, donde el modelo de aprendizaje automático se ejecuta en sistemas integrados con recursos informáticos limitados, como computadoras portátiles , dispositivos de borde y microcontroladores . [164] [165] [166] La ejecución del modelo de aprendizaje automático en dispositivos integrados elimina la necesidad de transferir y almacenar datos en servidores en la nube para su posterior procesamiento, lo que reduce las violaciones de datos y las fugas de privacidad que ocurren debido a la transferencia de datos, y también minimiza el robo de propiedad intelectual, datos personales y secretos comerciales. El aprendizaje automático integrado se puede aplicar a través de varias técnicas, incluida la aceleración de hardware , [167] [168] el uso de computación aproximada , [169] la optimización de modelos de aprendizaje automático y muchas más. [170] [171] La poda , la cuantificación, la destilación del conocimiento , la factorización de bajo rango, la búsqueda de arquitectura de red (NAS) y el uso compartido de parámetros son algunas de las técnicas utilizadas para la optimización de los modelos de aprendizaje automático.

Software

Los paquetes de software que contienen una variedad de algoritmos de aprendizaje automático incluyen los siguientes:

Software libre y de código abierto

Software propietario con ediciones gratuitas y de código abierto

Software propietario

Revistas

Conferencias

Véase también

Referencias

  1. ^ La definición "sin ser programado explícitamente" se atribuye a menudo a Arthur Samuel , quien acuñó el término "aprendizaje automático" en 1959, pero la frase no se encuentra textualmente en esta publicación y puede ser una paráfrasis que apareció más tarde. Véase "Parafraseando a Arthur Samuel (1959), la pregunta es: ¿cómo pueden las computadoras aprender a resolver problemas sin ser programadas explícitamente?" en Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). "Diseño automatizado de la topología y el dimensionamiento de circuitos eléctricos analógicos mediante programación genética". Inteligencia artificial en diseño '96 . Inteligencia artificial en diseño '96. Dordrecht, Países Bajos: Springer Países Bajos. págs. 151–170. doi :10.1007/978-94-009-0279-4_9. ISBN 978-94-010-6610-5.
  2. ^ "¿Qué es el aprendizaje automático?". IBM . 22 de septiembre de 2021. Archivado desde el original el 27 de diciembre de 2023 . Consultado el 27 de junio de 2023 .
  3. ^ Hu, Junyan; Niu, Hanlin; Carrasco, Joaquín; Lennox, Barry; Arvin, Farshad (2020). "Exploración autónoma multi-robot basada en Voronoi en entornos desconocidos mediante aprendizaje de refuerzo profundo". IEEE Transactions on Vehicular Technology . 69 (12): 14413–14423. doi : 10.1109/tvt.2020.3034800 . ISSN  0018-9545. S2CID  228989788.
  4. ^ ab Yoosefzadeh-Najafabadi, Mohsen; Hugh, Earl; Tulpan, Dan; Sulik, John; Eskandari, Milad (2021). "Aplicación de algoritmos de aprendizaje automático en el mejoramiento de plantas: ¿predicción del rendimiento a partir de la reflectancia hiperespectral en la soja?". Frente. Plant Sci . 11 : 624273. doi : 10.3389/fpls.2020.624273 . PMC 7835636 . PMID  33510761. 
  5. ^ abc Bishop, CM (2006), Reconocimiento de patrones y aprendizaje automático , Springer, ISBN 978-0-387-31073-2
  6. ^ El aprendizaje automático y el reconocimiento de patrones "pueden considerarse como dos facetas del mismo campo". [5] : vii 
  7. ^ ab Friedman, Jerome H. (1998). "Minería de datos y estadística: ¿cuál es la conexión?". Ciencias de la computación y estadística . 29 (1): 3–9.
  8. ^ Samuel, Arthur (1959). "Algunos estudios sobre aprendizaje automático utilizando el juego de damas". Revista IBM de investigación y desarrollo . 3 (3): 210–229. CiteSeerX 10.1.1.368.2254 . doi :10.1147/rd.33.0210. S2CID  2126705. 
  9. ^ ab R. Kohavi y F. Provost, "Glosario de términos", Machine Learning, vol. 30, núm. 2–3, págs. 271–274, 1998.
  10. ^ Gerovitch, Slava (9 de abril de 2015). «Cómo la computadora se vengó de la Unión Soviética». Nautilus . Archivado desde el original el 22 de septiembre de 2021 . Consultado el 19 de septiembre de 2021 .
  11. ^ Lindsay, Richard P. (1 de septiembre de 1964). "El impacto de la automatización en la administración pública". Western Political Quarterly . 17 (3): 78–81. doi :10.1177/106591296401700364. ISSN  0043-4078. S2CID  154021253. Archivado desde el original el 6 de octubre de 2021 . Consultado el 6 de octubre de 2021 .
  12. ^ abc "Historia y evolución del aprendizaje automático: una cronología". WhatIs . Archivado desde el original el 2023-12-08 . Consultado el 2023-12-08 .
  13. ^ Milner, Peter M. (1993). "La mente y Donald O. Hebb". Scientific American . 268 (1): 124–129. Código Bibliográfico :1993SciAm.268a.124M. doi :10.1038/scientificamerican0193-124. ISSN  0036-8733. JSTOR  24941344. PMID  8418480. Archivado desde el original el 2023-12-20 . Consultado el 2023-12-09 .
  14. ^ "La ciencia: el botón del tonto", Time (revista) , 18 de agosto de 1961.
  15. ^ Nilsson N. Máquinas de aprendizaje, McGraw Hill, 1965.
  16. ^ Duda, R., Hart P. Reconocimiento de patrones y análisis de escenas, Wiley Interscience, 1973
  17. ^ S. Bozinovski "Espacio de enseñanza: un concepto de representación para la clasificación de patrones adaptativos" Informe técnico COINS n.º 81-28, Departamento de Ciencias de la Información y la Computación, Universidad de Massachusetts en Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf Archivado el 25 de febrero de 2021 en Wayback Machine.
  18. ^ ab Mitchell, T. (1997). Aprendizaje automático . McGraw Hill. pág. 2. ISBN 978-0-07-042807-2.
  19. ^ Harnad, Stevan (2008), "El juego de la anotación: sobre Turing (1950) en computación, maquinaria e inteligencia", en Epstein, Robert; Peters, Grace (eds.), The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer , Kluwer, págs. 23–66, ISBN 9781402067082, archivado desde el original el 9 de marzo de 2012 , consultado el 11 de diciembre de 2012
  20. ^ "Introducción a la IA, parte 1". Edzion . 2020-12-08. Archivado desde el original el 2021-02-18 . Consultado el 2020-12-09 .
  21. ^ Sindhu V, Nivedha S, Prakash M (febrero de 2020). "Una investigación científica empírica sobre bioinformática en el aprendizaje automático". Revista de mecánica de continuos y ciencias matemáticas (7). doi : 10.26782/jmcms.spl.7/2020.02.00006 .
  22. ^ Sarle, Warren S. (1994). "Redes neuronales y modelos estadísticos". SUGI 19: actas de la Decimonovena Conferencia Anual Internacional del Grupo de Usuarios de SAS . SAS Institute. págs. 1538–50. ISBN 9781555446116.OCLC 35546178  .
  23. ^ abcd Russell, Stuart ; Norvig, Peter (2003) [1995]. Inteligencia artificial: un enfoque moderno (2.ª ed.). Prentice Hall. ISBN 978-0137903955.
  24. ^ ab Langley, Pat (2011). "La ciencia cambiante del aprendizaje automático". Aprendizaje automático . 82 (3): 275–9. doi : 10.1007/s10994-011-5242-y .
  25. ^ Mahoney, Matt. "Fundamentos para un parámetro de referencia de compresión de textos grandes". Instituto Tecnológico de Florida . Consultado el 5 de marzo de 2013 .
  26. ^ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). "Medición de la eficiencia del mercado de divisas intradiario con un algoritmo de compresión de datos universal" (PDF) . Computational Economics . 33 (2): 131–154. CiteSeerX 10.1.1.627.3751 . doi :10.1007/s10614-008-9153-3. S2CID  17234503. Archivado (PDF) desde el original el 2009-07-09. 
  27. ^ I. Ben-Gal (2008). "Sobre el uso de medidas de compresión de datos para analizar diseños robustos" (PDF) . IEEE Transactions on Reliability . 54 (3): 381–388. doi :10.1109/TR.2005.853280. S2CID  9376086.
  28. ^ D. Scully; Carla E. Brodley (2006). "Compresión y aprendizaje automático: una nueva perspectiva sobre los vectores del espacio de características". Conferencia sobre compresión de datos (DCC'06) . pág. 332. doi :10.1109/DCC.2006.13. ISBN 0-7695-2545-8.S2CID12311412  .
  29. ^ Gary Adcock (5 de enero de 2023). "¿Qué es la compresión de video con IA?". massive.io . Consultado el 6 de abril de 2023 .
  30. ^ Mentzer, Fabián; Toderici, George; Tschannen, Michael; Agustsson, Eirikur (2020). "Compresión de imágenes generativas de alta fidelidad". arXiv : 2006.09965 [eess.IV].
  31. ^ "¿Qué es el aprendizaje no supervisado? | IBM". www.ibm.com . 23 de septiembre de 2021 . Consultado el 5 de febrero de 2024 .
  32. ^ "Agrupamiento diferencialmente privado para conjuntos de datos a gran escala". blog.research.google . 2023-05-25 . Consultado el 2024-03-16 .
  33. ^ Edwards, Benj (28 de septiembre de 2023). "Los modelos de lenguaje de IA pueden superar a PNG y FLAC en compresión sin pérdida, según un estudio". Ars Technica . Consultado el 7 de marzo de 2024 .
  34. ^ Le Roux, Nicolas; Bengio, Yoshua; Fitzgibbon, Andrew (2012). "Mejora de métodos de primer y segundo orden mediante el modelado de la incertidumbre". En Sra, Suvrit; Nowozin, Sebastian; Wright, Stephen J. (eds.). Optimización para aprendizaje automático . MIT Press. pág. 404. ISBN 9780262016469Archivado desde el original el 17 de enero de 2023. Consultado el 12 de noviembre de 2020 .
  35. ^ Bzdok, Danilo; Altman, Naomi ; Krzywinski, Martin (2018). "Estadísticas versus aprendizaje automático". Nature Methods . 15 (4): 233–234. doi :10.1038/nmeth.4642. PMC 6082636 . PMID  30100822. 
  36. ^ de Michael I. Jordan (10 de septiembre de 2014). «Estadísticas y aprendizaje automático». Reddit. Archivado desde el original el 18 de octubre de 2017. Consultado el 1 de octubre de 2014 .
  37. ^ Hung et al. Algoritmos para medir el desempeño del cirujano y anticipar los resultados clínicos en cirugía robótica. JAMA Surg. 2018
  38. ^ Biblioteca de la Universidad de Cornell (agosto de 2001). «Breiman: Modelado estadístico: las dos culturas (con comentarios y una réplica del autor)». Ciencia estadística . 16 (3). doi : 10.1214/ss/1009213726 . S2CID  62729017. Archivado desde el original el 26 de junio de 2017 . Consultado el 8 de agosto de 2015 .
  39. ^ Gareth James; Daniela Witten; Trevor Hastie; Robert Tibshirani (2013). Introducción al aprendizaje estadístico. Springer. pág. vii. Archivado desde el original el 23 de junio de 2019. Consultado el 25 de octubre de 2014 .
  40. ^ Ramezanpour, A.; Beam, AL; Chen, JH; Mashaghi, A. (17 de noviembre de 2020). "Física estadística para diagnósticos médicos: algoritmos de aprendizaje, inferencia y optimización". Diagnóstico . 10 (11): 972. doi : 10.3390/diagnostics10110972 . PMC 7699346 . PMID  33228143. 
  41. ^ Mashaghi, A.; Ramezanpour, A. (16 de marzo de 2018). "Física estadística de diagnósticos médicos: estudio de un modelo probabilístico". Physical Review E . 97 (3–1): 032118. arXiv : 1803.10019 . Código Bibliográfico :2018PhRvE..97c2118M. doi :10.1103/PhysRevE.97.032118. PMID  29776109. S2CID  4955393.
  42. ^ Mohri, Mehryar ; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Fundamentos del aprendizaje automático . EE. UU., Massachusetts: MIT Press. ISBN 9780262018258.
  43. ^ Alpaydin, Ethem (2010). Introducción al aprendizaje automático . Londres: The MIT Press. ISBN 978-0-262-01243-0. Recuperado el 4 de febrero de 2017 .
  44. ^ Jordan, MI; Mitchell, TM (17 de julio de 2015). "Aprendizaje automático: tendencias, perspectivas y perspectivas". Science . 349 (6245): 255–260. Bibcode :2015Sci...349..255J. doi :10.1126/science.aaa8415. PMID  26185243. S2CID  677218.
  45. ^ El Naqa, Issam; Murphy, Martin J. (2015). "¿Qué es el aprendizaje automático?". Aprendizaje automático en oncología radioterápica . págs. 3-11. doi :10.1007/978-3-319-18305-3_1. ISBN 978-3-319-18304-6. Número de identificación del sujeto  178586107.
  46. ^ Okolie, Jude A.; Savage, Shauna; Ogbaga, Chukwuma C.; Gunes, Burcu (junio de 2022). "Evaluación del potencial de los métodos de aprendizaje automático para estudiar la eliminación de productos farmacéuticos de las aguas residuales utilizando biocarbón o carbón activado". Temas de investigación medioambiental total . 1–2 : 100001. Bibcode :2022TERT....100001O. doi : 10.1016/j.totert.2022.100001 . S2CID  249022386.
  47. ^ Russell, Stuart J.; Norvig, Peter (2010). Inteligencia artificial: un enfoque moderno (tercera edición). Prentice Hall. ISBN 9780136042594.
  48. ^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Fundamentos del aprendizaje automático . The MIT Press. ISBN 9780262018258.
  49. ^ Alpaydin, Ethem (2010). Introducción al aprendizaje automático. MIT Press. pág. 9. ISBN 978-0-262-01243-0Archivado desde el original el 17 de enero de 2023. Consultado el 25 de noviembre de 2018 .
  50. ^ "Apuntes de la lección 2: aprendizaje supervisado". www.cs.cornell.edu . Consultado el 1 de julio de 2024 .
  51. ^ Jordan, Michael I.; Bishop, Christopher M. (2004). "Redes neuronales". En Allen B. Tucker (ed.). Manual de Ciencias de la Computación, segunda edición (Sección VII: Sistemas inteligentes) . Boca Raton, Florida: Chapman & Hall/CRC Press LLC. ISBN 978-1-58488-360-9.
  52. ^ Zhang, Bosen; Huang, Haiyan; Tibbs-Cortes, Laura E.; Vanous, Adam; Zhang, Zhiwu; Sanguinet, Karen; Garland-Campbell, Kimberly A.; Yu, Jianming; Li, Xianran (2023). "Optimice el aprendizaje automático no supervisado para examinar y graficar haplotipos basados ​​en indel de pangenomas". Molecular Plant . 16 (6): 975–978. doi : 10.1016/j.molp.2023.05.005 . PMID  37202927.
  53. ^ Zhang, Bosen; Huang, Haiyan; Tibbs-Cortes, Laura E.; Vanous, Adam; Zhang, Zhiwu; Sanguinet, Karen; Garland-Campbell, Kimberly A.; Yu, Jianming; Li, Xianran (13 de febrero de 2023). Optimizar el aprendizaje automático no supervisado para examinar y graficar haplotipos basados ​​en indel de pangenomas (informe). doi :10.1101/2023.02.11.527743.
  54. ^ Misra, Ishan; Maaten, Laurens van der (2020). Aprendizaje autosupervisado de representaciones invariantes respecto del pretexto. Conferencia IEEE/CVF 2020 sobre visión artificial y reconocimiento de patrones (CVPR). Seattle, WA, EE. UU.: IEEE . págs. 6707–6717. arXiv : 1912.01991 . doi :10.1109/CVPR42600.2020.00674.
  55. ^ Jaiswal, Ashish; Babu, Ashwin Ramesh; Zadeh, Mohammad Zaki; Banerjee, Debapriya; Makedon, Fillia (marzo de 2021). "Una encuesta sobre aprendizaje autosupervisado contrastivo". Tecnologías . 9 (1): 2. arXiv : 2011.00362 . doi : 10.3390/technologies9010002 . ISSN  2227-7080.
  56. ^ Alex Ratner; Stephen Bach; Paroma Varma; Chris. "Supervisión débil: el nuevo paradigma de programación para el aprendizaje automático". hazyresearch.github.io . referencias al trabajo de muchos otros miembros de Hazy Research. Archivado desde el original el 2019-06-06 . Consultado el 2019-06-06 .
  57. ^ van Otterlo, M.; Wiering, M. (2012). "Aprendizaje por refuerzo y procesos de decisión de Markov". Aprendizaje por refuerzo . Adaptación, aprendizaje y optimización. Vol. 12. págs. 3–42. doi :10.1007/978-3-642-27645-3_1. ISBN 978-3-642-27644-6.
  58. ^ Roweis, Sam T.; Saul, Lawrence K. (22 de diciembre de 2000). "Reducción de dimensionalidad no lineal mediante incrustación lineal local". Science . 290 (5500): 2323–2326. Bibcode :2000Sci...290.2323R. doi :10.1126/science.290.5500.2323. PMID  11125150. S2CID  5987139. Archivado desde el original el 15 de agosto de 2021 . Consultado el 17 de julio de 2023 .
  59. ^ Pavel Brazdil; Christophe Giraud Carrier; Carlos Soares; Ricardo Vilalta (2009). Metaaprendizaje: aplicaciones a la minería de datos (cuarta edición). Springer Science+Business Media . pp. 10–14, passim . ISBN 978-3540732624.
  60. ^ Bozinovski, S. (1982). "Un sistema de autoaprendizaje mediante refuerzo secundario". En Trappl, Robert (ed.). Investigación en cibernética y sistemas: Actas de la sexta reunión europea sobre investigación en cibernética y sistemas. Holanda Septentrional. págs. 397–402. ISBN 978-0-444-86488-8 . 
  61. ^ Bozinovski, Stevo (2014) "Mecanismos de modelado de la interacción cognición-emoción en redes neuronales artificiales, desde 1981". Procedia Computer Science, pág. 255-263
  62. ^ Bozinovski, S. (2001) "Agentes de autoaprendizaje: una teoría conexionista de la emoción basada en el juicio de valor de barra transversal". Cibernética y sistemas 32(6) 637–667.
  63. ^ Y. Bengio; A. Courville; P. Vincent (2013). "Representation Learning: A Review and New Perspectives". IEEE Transactions on Pattern Analysis and Machine Intelligence . 35 (8): 1798–1828. arXiv : 1206.5538 . doi :10.1109/tpami.2013.50. PMID  23787338. S2CID  393948.
  64. ^ Nathan Srebro; Jason DM Rennie; Tommi S. Jaakkola (2004). Factorización matricial de margen máximo . NIPS .
  65. ^ Coates, Adam; Lee, Honglak; Ng, Andrew Y. (2011). Un análisis de redes de una sola capa en el aprendizaje de características no supervisado (PDF) . Conferencia Internacional sobre IA y Estadística (AISTATS). Archivado desde el original (PDF) el 2017-08-13 . Consultado el 2018-11-25 .
  66. ^ Csurka, Gabriella; Dance, Christopher C.; Fan, Lixin; Willamowski, Jutta; Bray, Cédric (2004). Categorización visual con bolsas de puntos clave (PDF) . Taller ECCV sobre aprendizaje estadístico en visión artificial. Archivado (PDF) desde el original el 13 de julio de 2019 . Consultado el 29 de agosto de 2019 .
  67. ^ Daniel Jurafsky; James H. Martin (2009). Procesamiento del habla y del lenguaje . Pearson Educación Internacional. págs. 145–146.
  68. ^ Lu, Haiping; Plataniotis, KN; Venetsanopoulos, AN (2011). "Un estudio sobre aprendizaje de subespacios multilineales para datos tensoriales" (PDF) . Reconocimiento de patrones . 44 (7): 1540–1551. Código bibliográfico :2011PatRe..44.1540L. doi :10.1016/j.patcog.2011.01.004. Archivado (PDF) desde el original el 2019-07-10 . Consultado el 2015-09-04 .
  69. ^ Yoshua Bengio (2009). Aprendizaje de arquitecturas profundas para IA. Now Publishers Inc., págs. 1-3. ISBN 978-1-60198-294-0Archivado desde el original el 17 de enero de 2023. Consultado el 15 de febrero de 2016 .
  70. ^ Tillmann, AM (2015). "Sobre la intratabilidad computacional del aprendizaje exacto y aproximado de diccionarios". IEEE Signal Processing Letters . 22 (1): 45–49. arXiv : 1405.6664 . Bibcode :2015ISPL...22...45T. doi :10.1109/LSP.2014.2345761. S2CID  13342762.
  71. ^ Aharon, M , M Elad y A Bruckstein. 2006. "K-SVD: Un algoritmo para diseñar diccionarios sobrecompletos para representación dispersa Archivado el 23 de noviembre de 2018 en Wayback Machine ." Procesamiento de señales, Transacciones IEEE en 54 (11): 4311–4322
  72. ^ Zimek, Arthur; Schubert, Erich (2017), "Detección de valores atípicos", Enciclopedia de sistemas de bases de datos , Springer Nueva York, págs. 1–5, doi :10.1007/978-1-4899-7993-3_80719-1, ISBN 9781489979933
  73. ^ Hodge, VJ; Austin, J. (2004). "A Survey of Outlier Detection Methodologies" (PDF) . Artificial Intelligence Review . 22 (2): 85–126. CiteSeerX 10.1.1.318.4023 . doi :10.1007/s10462-004-4304-y. S2CID  59941878. Archivado (PDF) desde el original el 22 de junio de 2015 . Consultado el 25 de noviembre de 2018 . 
  74. ^ Dokas, Paul; Ertoz, Levent; Kumar, Vipin; Lazarevic, Aleksandar; Srivastava, Jaideep; Tan, Pang-Ning (2002). "Minería de datos para la detección de intrusiones en la red" (PDF) . Actas del Taller de la NSF sobre Minería de Datos de Próxima Generación . Archivado (PDF) desde el original el 23 de septiembre de 2015. Consultado el 26 de marzo de 2023 .
  75. ^ Chandola, V.; Banerjee, A.; Kumar, V. (2009). "Detección de anomalías: una encuesta". Encuestas de computación ACM . 41 (3): 1–58. doi :10.1145/1541880.1541882. S2CID  207172599.
  76. ^ Fleer, S.; Moringen, A.; Klatzky, RL; Ritter, H. (2020). "Aprendizaje de exploración háptica eficiente de formas con una matriz de sensores táctiles rígidos, S. Fleer, A. Moringen, R. Klatzky, H. Ritter". PLOS ONE . ​​15 (1): e0226880. arXiv : 1902.07501 . doi : 10.1371/journal.pone.0226880 . PMC 6940144 . PMID  31896135. 
  77. ^ Moringen, Alejandra; Fleer, Sascha; Walck, Guillaume; Ritter, Helge (2020), Nisky, Ilana; Hartcher-O'Brien, Jess; Wiertlewski, Michael; Smeets, Jeroen (eds.), "Aprendizaje de interacción háptica con robots basado en la atención", Hápticos: ciencia, tecnología, aplicaciones , Apuntes de conferencias sobre informática, vol. 12272, Cham: Springer International Publishing, págs. 462–470, doi : 10.1007/978-3-030-58147-3_51 , ISBN 978-3-030-58146-6, Número de identificación del sujeto  220069113
  78. ^ Piatetsky-Shapiro, Gregory (1991), Descubrimiento, análisis y presentación de reglas fuertes , en Piatetsky-Shapiro, Gregory; y Frawley, William J.; eds., Descubrimiento de conocimiento en bases de datos , AAAI/MIT Press, Cambridge, MA.
  79. ^ Bassel, George W.; Glaab, Enrico; Marquez, Julietta; Holdsworth, Michael J.; Bacardit, Jaume (1 de septiembre de 2011). "Construcción de redes funcionales en Arabidopsis mediante aprendizaje automático basado en reglas en conjuntos de datos a gran escala". The Plant Cell . 23 (9): 3101–3116. doi :10.1105/tpc.111.088153. ISSN  1532-298X. PMC 3203449 . PMID  21896882. 
  80. ^ Agrawal, R.; Imieliński, T.; Swami, A. (1993). "Extracción de reglas de asociación entre conjuntos de elementos en bases de datos de gran tamaño". Actas de la conferencia internacional ACM SIGMOD de 1993 sobre gestión de datos - SIGMOD '93 . p. 207. CiteSeerX 10.1.1.40.6984 . doi :10.1145/170035.170072. ISBN  978-0897915922.S2CID 490415  .
  81. ^ Urbanowicz, Ryan J.; Moore, Jason H. (22 de septiembre de 2009). "Sistemas de clasificación de aprendizaje: una introducción completa, revisión y hoja de ruta". Revista de evolución artificial y aplicaciones . 2009 : 1–25. doi : 10.1155/2009/736398 . ISSN  1687-6229.
  82. ^ Plotkin GD Métodos automáticos de inferencia inductiva Archivado el 22 de diciembre de 2017 en Wayback Machine , tesis doctoral, Universidad de Edimburgo, 1970.
  83. ^ Shapiro, Ehud Y. Inferencia inductiva de teorías a partir de hechos Archivado el 21 de agosto de 2021 en Wayback Machine , Informe de investigación 192, Universidad de Yale, Departamento de Ciencias de la Computación, 1981. Reimpreso en J.-L. Lassez, G. Plotkin (Eds.), Computational Logic, The MIT Press, Cambridge, MA, 1991, págs. 199–254.
  84. ^ Shapiro, Ehud Y. (1983). Depuración de programas algorítmicos . Cambridge, Mass.: MIT Press. ISBN 0-262-19218-7 
  85. ^ Shapiro, Ehud Y. "El sistema de inferencia de modelos Archivado el 6 de abril de 2023 en Wayback Machine ." Actas de la 7.ª conferencia conjunta internacional sobre inteligencia artificial, volumen 2. Morgan Kaufmann Publishers Inc., 1981.
  86. ^ Burkov, Andriy (2019). El libro de cien páginas sobre aprendizaje automático . Polonia: Andriy Burkov. ISBN 978-1-9995795-0-0.
  87. ^ Russell, Stuart J.; Norvig, Peter (2021). Inteligencia artificial: un enfoque moderno . Serie Pearson sobre inteligencia artificial (cuarta edición). Hoboken: Pearson. ISBN 978-0-13-461099-3.
  88. ^ Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. "Redes convolucionales de creencias profundas para el aprendizaje escalable no supervisado de representaciones jerárquicas Archivado el 18 de octubre de 2017 en Wayback Machine ". Actas de la 26.ª Conferencia internacional anual sobre aprendizaje automático, 2009.
  89. ^ Cortes, Corinna ; Vapnik, Vladimir N. (1995). "Redes de vectores de soporte". Aprendizaje automático . 20 (3): 273–297. doi : 10.1007/BF00994018 .
  90. ^ Stevenson, Christopher. "Tutorial: Regresión polinómica en Excel". Facultystaff.richmond.edu . Archivado desde el original el 2 de junio de 2013. Consultado el 22 de enero de 2017 .
  91. ^ La documentación de scikit-learn también tiene ejemplos similares Archivado el 2 de noviembre de 2022 en Wayback Machine .
  92. ^ Goldberg, David E.; Holland, John H. (1988). "Algoritmos genéticos y aprendizaje automático" (PDF) . Machine Learning . 3 (2): 95–99. doi : 10.1007/bf00113892 . S2CID  35506513. Archivado (PDF) desde el original el 2011-05-16 . Consultado el 2019-09-03 .
  93. ^ Michie, D.; Spiegelhalter, DJ; Taylor, CC (1994). "Aprendizaje automático, clasificación neuronal y estadística". Serie Ellis Horwood en Inteligencia artificial . Bibcode :1994mlns.book.....M.
  94. ^ Zhang, junio; Zhan, Zhi-hui; Lin, Ying; Chen, Ni; Gong, Yue-jiao; Zhong, Jing-hui; Chung, Henry SH; Li, Yun; Shi, Yu-hui (2011). "La computación evolutiva se encuentra con el aprendizaje automático: una encuesta". Revista Inteligencia Computacional . 6 (4): 68–75. doi :10.1109/mci.2011.942584. S2CID  6760276.
  95. ^ "Aprendizaje federado: aprendizaje automático colaborativo sin datos de entrenamiento centralizados". Blog de Google AI . 6 de abril de 2017. Archivado desde el original el 7 de junio de 2019. Consultado el 8 de junio de 2019 .
  96. ^ El aprendizaje automático está incluido en el plan de estudios de CFA (la discusión es de arriba hacia abajo); consulte: Kathleen DeRose y Christophe Le Lanno (2020). "Aprendizaje automático" Archivado el 13 de enero de 2020 en Wayback Machine .
  97. ^ Ivanenko, Mijaíl; Smolik, Waldemar T.; Wanta, Damián; Midura, Mateusz; Wróblewski, Przemysław; Hou, Xiaohan; Yan, Xiaoheng (2023). "Reconstrucción de imágenes mediante aprendizaje supervisado en tomografía de impedancia eléctrica portátil del tórax". Sensores . 23 (18): 7774. Código bibliográfico : 2023Senso..23.7774I. doi : 10.3390/s23187774 . PMC 10538128 . PMID  37765831. 
  98. ^ "Página de inicio de BelKor" research.att.com
  99. ^ "El blog tecnológico de Netflix: Recomendaciones de Netflix: más allá de las 5 estrellas (parte 1)". 6 de abril de 2012. Archivado desde el original el 31 de mayo de 2016. Consultado el 8 de agosto de 2015 .
  100. ^ Scott Patterson (13 de julio de 2010). «Dejar que las máquinas decidan». The Wall Street Journal . Archivado desde el original el 24 de junio de 2018. Consultado el 24 de junio de 2018 .
  101. ^ Vinod Khosla (10 de enero de 2012). "¿Necesitamos médicos o algoritmos?". Tech Crunch. Archivado desde el original el 18 de junio de 2018. Consultado el 20 de octubre de 2016 .
  102. ^ Cuando un algoritmo de aprendizaje automático estudió pinturas de bellas artes, vio cosas que los historiadores del arte nunca habían notado Archivado el 4 de junio de 2016 en Wayback Machine , el blog de Física en ArXiv
  103. ^ Vincent, James (10 de abril de 2019). «El primer libro de texto generado por IA muestra en qué son realmente buenos los escritores robot». The Verge . Archivado desde el original el 5 de mayo de 2019. Consultado el 5 de mayo de 2019 .
  104. ^ Vaishya, Raju; Javaid, Mohd; Khan, Ibrahim Haleem; Haleem, Abid (1 de julio de 2020). "Aplicaciones de inteligencia artificial (IA) para la pandemia de COVID-19". Diabetes y síndrome metabólico: investigaciones clínicas y revisiones . 14 (4): 337–339. doi : 10.1016/j.dsx.2020.04.012 . PMC 7195043 . PMID  32305024. 
  105. ^ Rezapouraghdam, Hamed; Akhshik, Arash; Ramkissoon, Haywantee (10 de marzo de 2021). "Aplicación del aprendizaje automático para predecir el comportamiento ecológico de los visitantes en áreas marinas protegidas: evidencia de Chipre". Revista de turismo sostenible . 31 (11): 2479–2505. doi : 10.1080/09669582.2021.1887878 . hdl : 10037/24073 .
  106. ^ Dey, Somdip; Singh, Amit Kumar; Wang, Xiaohang; McDonald-Maier, Klaus (15 de junio de 2020). "Aprendizaje de refuerzo basado en la interacción del usuario para la eficiencia térmica y energética de MPSoC móviles con CPU-GPU". Conferencia y exposición de diseño, automatización y pruebas en Europa de 2020 (DATE) (PDF) . págs. 1728–1733. doi :10.23919/DATE48585.2020.9116294. ISBN 978-3-9819263-4-7. S2CID  219858480. Archivado desde el original el 13 de diciembre de 2021. Consultado el 20 de enero de 2022 .
  107. ^ Quested, Tony. "Los teléfonos inteligentes se vuelven más inteligentes con la innovación de Essex". Business Weekly . Archivado desde el original el 24 de junio de 2021 . Consultado el 17 de junio de 2021 .
  108. ^ Williams, Rhiannon (21 de julio de 2020). «Los teléfonos inteligentes del futuro prolongarán la vida útil de su batería al monitorear el comportamiento de sus propietarios». i . Archivado desde el original el 24 de junio de 2021 . Consultado el 17 de junio de 2021 .
  109. ^ Rasekhschaffe, Keywan Christian; Jones, Robert C. (1 de julio de 2019). "Aprendizaje automático para la selección de acciones". Revista de analistas financieros . 75 (3): 70–88. doi :10.1080/0015198X.2019.1596678. ISSN  0015-198X. S2CID  108312507. Archivado desde el original el 26 de noviembre de 2023 . Consultado el 26 de noviembre de 2023 .
  110. ^ Chung, Yunsie; Green, William H. (2024). "Aprendizaje automático a partir de la química cuántica para predecir los efectos experimentales de los disolventes en las velocidades de reacción". Chemical Science . 15 (7): 2410–2424. doi :10.1039/D3SC05353A. ISSN  2041-6520. PMC 10866337 . PMID  38362410. Archivado desde el original el 2024-05-19 . Consultado el 2024-04-21 . 
  111. ^ Sun, Yuran; Huang, Shih-Kai; Zhao, Xilei (1 de febrero de 2024). "Predicción de decisiones de evacuación en caso de huracán con métodos de aprendizaje automático interpretables". Revista internacional de ciencia del riesgo de desastres . 15 (1): 134–148. arXiv : 2303.06557 . Código Bibliográfico :2024IJDRS..15..134S. doi : 10.1007/s13753-024-00541-1 . ISSN  2192-6395.
  112. ^ Sun, Yuran; Zhao, Xilei; Lovreglio, Ruggiero; Kuligowski, Erica (1 de enero de 2024), Naser, MZ (ed.), "8 - IA para modelado de evacuación a gran escala: promesas y desafíos", Aprendizaje automático interpretable para el análisis, diseño, evaluación y toma de decisiones informada para infraestructura civil , Woodhead Publishing Series in Civil and Structural Engineering, Woodhead Publishing, págs. 185–204, ISBN 978-0-12-824073-1, archivado desde el original el 19 de mayo de 2024 , consultado el 19 de mayo de 2024
  113. ^ Xu, Ningzhe; Lovreglio, Ruggiero; Kuligowski, Erica D.; Cova, Thomas J.; Nilsson, Daniel; Zhao, Xilei (1 de marzo de 2023). "Predicción y evaluación de la toma de decisiones de evacuación por incendios forestales mediante aprendizaje automático: hallazgos del incendio Kincade de 2019". Tecnología contra incendios . 59 (2): 793–825. doi :10.1007/s10694-023-01363-1. ISSN  1572-8099. Archivado desde el original el 19 de mayo de 2024 . Consultado el 19 de mayo de 2024 .
  114. ^ Wang, Ke; Shi, Xiupeng; Goh, Algena Pei Xuan; Qian, Shunzhi (1 de junio de 2019). "Un estudio basado en aprendizaje automático sobre la dinámica del movimiento de peatones en caso de evacuación de emergencia". Fire Safety Journal . 106 : 163–176. Bibcode :2019FirSJ.106..163W. doi :10.1016/j.firesaf.2019.04.008. hdl : 10356/143390 . ISSN  0379-7112. Archivado desde el original el 19 de mayo de 2024 . Consultado el 19 de mayo de 2024 .
  115. ^ Zhao, Xilei; Lovreglio, Ruggiero; Nilsson, Daniel (1 de mayo de 2020). "Modelado e interpretación de la toma de decisiones previa a la evacuación mediante aprendizaje automático". Automatización en la construcción . 113 : 103140. doi :10.1016/j.autcon.2020.103140. ISSN  0926-5805. Archivado desde el original el 19 de mayo de 2024. Consultado el 19 de mayo de 2024 .
  116. ^ "Por qué los modelos de aprendizaje automático a menudo no aprenden: preguntas y respuestas rápidas". Bloomberg.com . 2016-11-10. Archivado desde el original el 2017-03-20 . Consultado el 2017-04-10 .
  117. ^ "La primera ola de inteligencia artificial corporativa está condenada al fracaso". Harvard Business Review . 18 de abril de 2017. Archivado desde el original el 21 de agosto de 2018. Consultado el 20 de agosto de 2018 .
  118. ^ "Por qué la euforia por la IA está condenada al fracaso". VentureBeat . 2016-09-18. Archivado desde el original el 2018-08-19 . Consultado el 2018-08-20 .
  119. ^ "9 razones por las que tu proyecto de aprendizaje automático fracasará". www.kdnuggets.com . Archivado desde el original el 2018-08-21 . Consultado el 2018-08-20 .
  120. ^ ab Babuta, Alexander; Oswald, Marion; Rinik, Christine (2018). Transparencia e inteligibilidad (informe). Royal United Services Institute (RUSI). págs. 17–22. Archivado desde el original el 2023-12-09 . Consultado el 2023-12-09 .
  121. ^ "Por qué el coche autónomo de Uber mató a un peatón". The Economist . Archivado desde el original el 2018-08-21 . Consultado el 2018-08-20 .
  122. ^ "Watson de IBM recomendó tratamientos contra el cáncer 'inseguros e incorrectos' - STAT". STAT . 2018-07-25. Archivado desde el original el 2018-08-21 . Consultado el 2018-08-21 .
  123. ^ Hernandez, Daniela; Greenwald, Ted (11 de agosto de 2018). "IBM tiene un dilema Watson". The Wall Street Journal . ISSN  0099-9660. Archivado desde el original el 21 de agosto de 2018. Consultado el 21 de agosto de 2018 .
  124. ^ Allyn, Bobby (27 de febrero de 2023). «Cómo fracasó el experimento de Microsoft en tecnología de inteligencia artificial». Radio Pública Nacional . Archivado desde el original el 8 de diciembre de 2023. Consultado el 8 de diciembre de 2023 .
  125. ^ Reddy, Shivani M.; Patel, Sheila; Weyrich, Meghan; Fenton, Joshua; Viswanathan, Meera (2020). "Comparación de un enfoque de revisión sistemática tradicional con revisión de revisiones y semiautomatización como estrategias para actualizar la evidencia". Revisiones sistemáticas . 9 (1): 243. doi : 10.1186/s13643-020-01450-2 . ISSN  2046-4053. PMC 7574591 . PMID  33076975. 
  126. ^ ab Garcia, Megan (2016). "Racista en la máquina". Revista de Política Mundial . 33 (4): 111–117. doi :10.1215/07402775-3813015. ISSN  0740-2775. S2CID  151595343.
  127. ^ Caliskan, Aylin; Bryson, Joanna J.; Narayanan, Arvind (14 de abril de 2017). "La semántica derivada automáticamente de los corpus lingüísticos contiene sesgos similares a los humanos". Science . 356 (6334): 183–186. arXiv : 1608.07187 . Bibcode :2017Sci...356..183C. doi :10.1126/science.aal4230. ISSN  0036-8075. PMID  28408601. S2CID  23163324.
  128. ^ Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, DD; Sugiyama, M.; Luxburg, UV; Guyon, I. (eds.), "Un algoritmo para la búsqueda del vecino más cercano L1 mediante incrustación monotónica" (PDF) , Advances in Neural Information Processing Systems 29 , Curran Associates, Inc., pp. 983–991, archivado (PDF) desde el original el 2017-04-07 , recuperado 2018-08-20
  129. ^ abc Silva, Selena; Kenney, Martin (2018). "Algoritmos, plataformas y sesgo étnico: un ensayo integrador" (PDF) . Phylon . 55 (1 y 2): 9–37. ISSN  0031-8906. JSTOR  26545017. Archivado (PDF) desde el original el 27 de enero de 2024.
  130. ^ Vincent, James (12 de enero de 2018). «Google 'arregló' su algoritmo racista eliminando a los gorilas de su tecnología de etiquetado de imágenes». The Verge . Archivado desde el original el 21 de agosto de 2018. Consultado el 20 de agosto de 2018 .
  131. ^ Crawford, Kate (25 de junio de 2016). «Opinión | El problema de los hombres blancos en la inteligencia artificial» . New York Times . Archivado desde el original el 14 de enero de 2021 . Consultado el 20 de agosto de 2018 .
  132. ^ Metz, Rachel (24 de marzo de 2016). «Why Microsoft Accidentally Unleashed a Neo-Nazi Sexbot» (Por qué Microsoft lanzó accidentalmente un robot sexual neonazi) . MIT Technology Review . Archivado desde el original el 9 de noviembre de 2018. Consultado el 20 de agosto de 2018 .
  133. ^ Simonite, Tom (30 de marzo de 2017). «Microsoft: la IA aún no es lo suficientemente adaptable como para ayudar a las empresas». MIT Technology Review . Archivado desde el original el 2018-11-09 . Consultado el 20 de agosto de 2018 .
  134. ^ Hempel, Jessi (13 de noviembre de 2018). "La misión de Fei-Fei Li para hacer que las máquinas sean mejores para la humanidad". Wired . ISSN  1059-1028. Archivado desde el original el 14 de diciembre de 2020. Consultado el 17 de febrero de 2019 .
  135. ^ Rudin, Cynthia (2019). "Dejemos de explicar los modelos de aprendizaje automático de caja negra para decisiones de alto riesgo y utilicemos en su lugar modelos interpretables". Nature Machine Intelligence . 1 (5): 206–215. doi :10.1038/s42256-019-0048-x. PMC 9122117 . PMID  35603010. 
  136. ^ Hu, Tongxi; Zhang, Xuesong; Bohrer, Gil; Liu, Yanlan; Zhou, Yuyu; Martin, Jay; LI, Yang; Zhao, Kaiguang (2023). "Predicción del rendimiento de los cultivos mediante inteligencia artificial explicable y aprendizaje automático interpretable: peligros de los modelos de caja negra para evaluar los impactos del cambio climático en el rendimiento de los cultivos". Meteorología agrícola y forestal . 336 : 109458. doi : 10.1016/j.agrformet.2023.109458 . S2CID  258552400.
  137. ^ Domingos 2015, Capítulo 6, Capítulo 7.
  138. ^ Domingos 2015, pág. 286.
  139. ^ "Un cambio de un solo píxel engaña a los programas de inteligencia artificial". BBC News . 3 de noviembre de 2017. Archivado desde el original el 22 de marzo de 2018 . Consultado el 12 de marzo de 2018 .
  140. ^ "La IA tiene un problema de alucinaciones que está resultando difícil de solucionar". WIRED . 2018. Archivado desde el original el 12 de marzo de 2018 . Consultado el 12 de marzo de 2018 .
  141. ^ Madry, A.; Makelov, A.; Schmidt, L.; Tsipras, D.; Vladu, A. (4 de septiembre de 2019). "Hacia modelos de aprendizaje profundo resistentes a ataques adversarios". arXiv : 1706.06083 [stat.ML].
  142. ^ "Aprendizaje automático adversario – CLTC UC Berkeley Center for Long-Term Cybersecurity". CLTC . Archivado desde el original el 2022-05-17 . Consultado el 2022-05-25 .
  143. ^ "Modelos de aprendizaje automático vulnerables a puertas traseras indetectables". The Register . Archivado desde el original el 13 de mayo de 2022. Consultado el 13 de mayo de 2022 .
  144. ^ "Puertas traseras indetectables implantables en cualquier algoritmo de aprendizaje automático". IEEE Spectrum . 10 de mayo de 2022. Archivado desde el original el 11 de mayo de 2022 . Consultado el 13 de mayo de 2022 .
  145. ^ Goldwasser, Shafi; Kim, Michael P.; Vaikuntanathan, Vinod; Zamir, Or (14 de abril de 2022). "Cómo implantar puertas traseras indetectables en modelos de aprendizaje automático". arXiv : 2204.06974 [cs.LG].
  146. ^ Kohavi, Ron (1995). "Un estudio de validación cruzada y bootstrap para la estimación de precisión y la selección de modelos" (PDF) . Conferencia conjunta internacional sobre inteligencia artificial . Archivado (PDF) desde el original el 2018-07-12 . Consultado el 2023-03-26 .
  147. ^ Pontius, Robert Gilmore; Si, Kangping (2014). "La característica operativa total para medir la capacidad de diagnóstico para múltiples umbrales". Revista Internacional de Ciencias de la Información Geográfica . 28 (3): 570–583. Bibcode :2014IJGIS..28..570P. doi :10.1080/13658816.2013.862623. S2CID  29204880.
  148. ^ Bostrom, Nick (2011). «La ética de la inteligencia artificial» (PDF) . Archivado desde el original (PDF) el 4 de marzo de 2016. Consultado el 11 de abril de 2016 .
  149. ^ Edionwe, Tolulope. «La lucha contra los algoritmos racistas». The Outline . Archivado desde el original el 17 de noviembre de 2017. Consultado el 17 de noviembre de 2017 .
  150. ^ Jeffries, Adrianne. «El aprendizaje automático es racista porque Internet es racista». The Outline . Archivado desde el original el 17 de noviembre de 2017. Consultado el 17 de noviembre de 2017 .
  151. ^ Wong, Carissa (30 de marzo de 2023). "La investigación sobre 'justicia' en IA se ve frenada por la falta de diversidad". Nature . doi :10.1038/d41586-023-00935-z. PMID  36997714. S2CID  257857012. Archivado desde el original el 12 de abril de 2023 . Consultado el 9 de diciembre de 2023 .
  152. ^ ab Zhang, Jack Clark. "Informe del índice de inteligencia artificial 2021" (PDF) . Instituto Stanford para la Inteligencia Artificial Centrada en el Ser Humano . Archivado (PDF) del original el 2024-05-19 . Consultado el 2023-12-09 .
  153. ^ Bostrom, Nick; Yudkowsky, Eliezer (2011). "LA ÉTICA DE LA INTELIGENCIA ARTIFICIAL" (PDF) . Nick Bostrom . Archivado (PDF) desde el original el 2015-12-20 . Consultado el 2020-11-18 .
  154. ^ MOR Prates; PHC Avelar; LC Lamb (11 de marzo de 2019). "Evaluación del sesgo de género en la traducción automática: un estudio de caso con Google Translate". arXiv : 1809.02208 [cs.CY].
  155. ^ Narayanan, Arvind (24 de agosto de 2016). «El lenguaje contiene necesariamente sesgos humanos, y también los tendrán las máquinas entrenadas en corpus lingüísticos». Libertad para modificar . Archivado desde el original el 25 de junio de 2018. Consultado el 19 de noviembre de 2016 .
  156. ^ Char, Danton S.; Shah, Nigam H.; Magnus, David (15 de marzo de 2018). "Implementación del aprendizaje automático en la atención médica: cómo abordar los desafíos éticos". New England Journal of Medicine . 378 (11): 981–983. doi :10.1056/NEJMp1714229. ISSN  0028-4793. PMC 5962261 . PMID  29539284. 
  157. ^ Char, DS; Shah, NH; Magnus, D. (2018). "Implementación del aprendizaje automático en la atención médica: cómo abordar los desafíos éticos". New England Journal of Medicine . 378 (11): 981–983. doi :10.1056/nejmp1714229. PMC 5962261 . PMID  29539284. 
  158. ^ Research, AI (23 de octubre de 2015). «Redes neuronales profundas para el modelado acústico en el reconocimiento de voz». airesearch.com . Archivado desde el original el 1 de febrero de 2016. Consultado el 23 de octubre de 2015 .
  159. ^ "Las GPU siguen dominando el mercado de aceleradores de IA por ahora". InformationWeek . Diciembre de 2019. Archivado desde el original el 10 de junio de 2020 . Consultado el 11 de junio de 2020 .
  160. ^ Ray, Tiernan (2019). «La IA está cambiando toda la naturaleza de la computación». ZDNet . Archivado desde el original el 25 de mayo de 2020. Consultado el 11 de junio de 2020 .
  161. ^ "AI and Compute". OpenAI . 16 de mayo de 2018. Archivado desde el original el 17 de junio de 2020 . Consultado el 11 de junio de 2020 .
  162. ^ "Redes neuronales físicas de Cornell y NTT: una "alternativa radical para implementar redes neuronales profundas" que permite el entrenamiento arbitrario de sistemas físicos | Synced". 27 de mayo de 2021. Archivado desde el original el 27 de octubre de 2021 . Consultado el 12 de octubre de 2021 .
  163. ^ "Nano-espaguetis para solucionar el consumo energético de las redes neuronales". Archivado desde el original el 2021-10-06 . Consultado el 2021-10-12 .
  164. ^ Fafoutis, Xenofon; Marchegiani, Letizia; Elsts, Atis; Pope, James; Piechocki, Robert; Craddock, Ian (7 de mayo de 2018). "Extensión de la vida útil de la batería de sensores portátiles con aprendizaje automático integrado". 2018 IEEE 4th World Forum on Internet of Things (WF-IoT). págs. 269–274. doi :10.1109/WF-IoT.2018.8355116. hdl :1983/b8fdb58b-7114-45c6-82e4-4ab239c1327f. ISBN . 978-1-4673-9944-9. S2CID  19192912. Archivado desde el original el 18 de enero de 2022. Consultado el 17 de enero de 2022 .
  165. ^ "Guía para principiantes sobre aprendizaje automático para sistemas integrados". Revista Analytics India . 2 de junio de 2021. Archivado desde el original el 18 de enero de 2022. Consultado el 17 de enero de 2022 .
  166. ^ Synced (12 de enero de 2022). "Google, Purdue y Harvard U's Open-Source Framework for TinyML Achieves up to 75x Speedups on FPGAs | Synced". syncedreview.com . Archivado desde el original el 18 de enero de 2022 . Consultado el 17 de enero de 2022 .
  167. ^ Giri, Davide; Chiu, Kuan-Lin; Di Guglielmo, Giuseppe; Mantovani, Paolo; Carloni, Luca P. (15 de junio de 2020). "ESP4ML: Diseño basado en plataforma de sistemas en chip para aprendizaje automático integrado". Conferencia y exposición sobre diseño, automatización y pruebas en Europa de 2020 (DATE) . págs. 1049–1054. arXiv : 2004.03640 . doi :10.23919/DATE48585.2020.9116317. ISBN 978-3-9819263-4-7. S2CID  210928161. Archivado desde el original el 18 de enero de 2022. Consultado el 17 de enero de 2022 .
  168. ^ Louis, Marcia Sahaya; Azad, Zahra; Delshadtehrani, Leila; Gupta, Suyog; Warden, Pete; Reddi, Vijay Janapa; Joshi, Ajay (2019). "Hacia el aprendizaje profundo utilizando TensorFlow Lite en RISC-V". Universidad de Harvard . Archivado desde el original el 17 de enero de 2022. Consultado el 17 de enero de 2022 .
  169. ^ Ibrahim, Ali; Osta, Mario; Alameh, Mohamad; Saleh, Moustafa; Chible, Hussein; Valle, Maurizio (21 de enero de 2019). "Métodos de cálculo aproximados para el aprendizaje automático integrado". 25.ª Conferencia internacional IEEE sobre electrónica, circuitos y sistemas (ICECS) de 2018. págs. 845–848. doi :10.1109/ICECS.2018.8617877. ISBN 978-1-5386-9562-3. S2CID  58670712. Archivado desde el original el 17 de enero de 2022. Consultado el 17 de enero de 2022 .
  170. ^ "dblp: TensorFlow Eager: un DSL integrado en Python y de múltiples etapas para el aprendizaje automático". dblp.org . Archivado desde el original el 2022-01-18 . Consultado el 2022-01-17 .
  171. ^ Branco, Sergio; Ferreira, André G.; Cabral, Jorge (05-11-2019). "Aprendizaje automático en sistemas integrados, FPGA y dispositivos finales con escasos recursos: una encuesta". Electrónica . 8 (11): 1289. doi : 10.3390/electrónica8111289 . hdl : 1822/62521 . ISSN  2079-9292.

Fuentes

  • Domingos, Pedro (22 de septiembre de 2015). El algoritmo maestro: cómo la búsqueda de la máquina de aprendizaje definitiva transformará nuestro mundo . Basic Books. ISBN 978-0465065707.
  • Nilsson, Nils (1998). Inteligencia artificial: una nueva síntesis . Morgan Kaufmann. ISBN 978-1-55860-467-4Archivado del original el 26 de julio de 2020 . Consultado el 18 de noviembre de 2019 .
  • Poole, David; Mackworth, Alan ; Goebel, Randy (1998). Inteligencia computacional: un enfoque lógico. Nueva York: Oxford University Press. ISBN 978-0-19-510270-3Archivado del original el 26 de julio de 2020 . Consultado el 22 de agosto de 2020 .
  • Russell, Stuart J. ; Norvig, Peter (2003), Inteligencia artificial: un enfoque moderno (2.ª ed.), Upper Saddle River, Nueva Jersey: Prentice Hall, ISBN 0-13-790395-2.

Lectura adicional

  • Sociedad Internacional de Aprendizaje Automático
  • mloss es una base de datos académica de software de aprendizaje automático de código abierto.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Machine_learning&oldid=1252022898"