Ajuste de curvas

Proceso de construcción de una curva que se ajuste mejor a una serie de puntos de datos.
Ajuste de una curva ruidosa mediante un modelo de pico asimétrico, con un proceso iterativo ( algoritmo de Gauss-Newton con factor de amortiguamiento variable α).

El ajuste de curvas [1] [2] es el proceso de construcción de una curva o función matemática que se ajuste mejor a una serie de puntos de datos , [3] posiblemente sujeta a restricciones. [4] [5] El ajuste de curvas puede implicar interpolación , [6] [7] donde se requiere un ajuste exacto a los datos, o suavizado , [8] [9] en el que se construye una función "suave" que se ajusta aproximadamente a los datos. Un tema relacionado es el análisis de regresión , [10] [11] que se centra más en cuestiones de inferencia estadística como cuánta incertidumbre está presente en una curva que se ajusta a datos observados con errores aleatorios. Las curvas ajustadas se pueden utilizar como ayuda para la visualización de datos, [12] [13] para inferir valores de una función cuando no hay datos disponibles, [14] y para resumir las relaciones entre dos o más variables. [15] La extrapolación se refiere al uso de una curva ajustada más allá del rango de los datos observados, [16] y está sujeta a un grado de incertidumbre [17] ya que puede reflejar el método utilizado para construir la curva tanto como refleja los datos observados.

Para el análisis algebraico-lineal de datos, "ajuste" generalmente significa tratar de encontrar la curva que minimice el desplazamiento vertical ( eje y ) de un punto de la curva (por ejemplo, mínimos cuadrados ordinarios ). Sin embargo, para aplicaciones gráficas y de imágenes, el ajuste geométrico busca proporcionar el mejor ajuste visual; lo que generalmente significa tratar de minimizar la distancia ortogonal a la curva (por ejemplo, mínimos cuadrados totales ), o de lo contrario incluir ambos ejes de desplazamiento de un punto de la curva. Los ajustes geométricos no son populares porque generalmente requieren cálculos no lineales y/o iterativos, aunque tienen la ventaja de un resultado más estético y geométricamente preciso. [18] [19] [20]

Ajuste algebraico de funciones a puntos de datos

Lo más común es ajustar una función de la forma y = f ( x ) .

Ajuste de líneas y funciones polinómicas a puntos de datos

Curvas polinómicas que se ajustan a una función seno
Puntos de ajuste de curvas polinómicas generados con una función seno. La línea de puntos negra representa los datos "verdaderos", la línea roja es un polinomio de primer grado , la línea verde es de segundo grado , la línea naranja es de tercer grado y la línea azul es de cuarto grado.

La ecuación polinómica de primer grado

y = a incógnita + b {\displaystyle y=ax+b\;}

es una línea con pendiente a . Una línea conectará dos puntos cualesquiera, por lo que una ecuación polinómica de primer grado es un ajuste exacto a través de dos puntos cualesquiera con coordenadas x distintas.

Si se aumenta el orden de la ecuación a un polinomio de segundo grado, se obtiene el siguiente resultado:

y = a incógnita 2 + b incógnita + do . {\displaystyle y=ax^{2}+bx+c\;.}

Esto ajustará exactamente una curva simple a tres puntos.

Si se aumenta el orden de la ecuación a un polinomio de tercer grado, se obtiene lo siguiente:

y = a incógnita 3 + b incógnita 2 + do incógnita + d . {\displaystyle y=ax^{3}+bx^{2}+cx+d\;.}

Esto encajará exactamente en cuatro puntos.

Una afirmación más general sería decir que se ajustará exactamente a cuatro restricciones . Cada restricción puede ser un punto, un ángulo o una curvatura (que es el recíproco del radio de un círculo osculador ). Las restricciones de ángulo y curvatura se añaden con mayor frecuencia a los extremos de una curva y, en tales casos, se denominan condiciones finales . Con frecuencia, se utilizan condiciones finales idénticas para garantizar una transición suave entre curvas polinómicas contenidas dentro de una única spline . También se podrían añadir restricciones de orden superior, como "el cambio en la tasa de curvatura". Esto, por ejemplo, sería útil en el diseño de tréboles de carreteras para comprender la tasa de cambio de las fuerzas aplicadas a un automóvil (consulte el tirón ), a medida que sigue el trébol, y para establecer límites de velocidad razonables, en consecuencia.

La ecuación polinómica de primer grado también podría ser un ajuste exacto para un único punto y un ángulo, mientras que la ecuación polinómica de tercer grado también podría ser un ajuste exacto para dos puntos, una restricción de ángulo y una restricción de curvatura. Son posibles muchas otras combinaciones de restricciones para estas y para ecuaciones polinómicas de orden superior.

Si hay más de n  + 1 restricciones ( siendo n el grado del polinomio), la curva polinómica puede seguir realizándose a través de esas restricciones. No es seguro que se ajuste exactamente a todas las restricciones (pero podría suceder, por ejemplo, en el caso de un polinomio de primer grado que se ajuste exactamente a tres puntos colineales ). Sin embargo, en general, se necesita algún método para evaluar cada aproximación. El método de mínimos cuadrados es una forma de comparar las desviaciones.

Se dan varias razones para obtener un ajuste aproximado cuando es posible simplemente aumentar el grado de la ecuación polinomial y obtener una coincidencia exacta:

  • Incluso si existe una coincidencia exacta, no necesariamente se puede descubrir fácilmente. Según el algoritmo utilizado, puede haber un caso divergente, en el que no se puede calcular el ajuste exacto, o puede llevar demasiado tiempo de computadora encontrar la solución. Esta situación puede requerir una solución aproximada.
  • El efecto de promediar los puntos de datos cuestionables en una muestra, en lugar de distorsionar la curva para ajustarlos exactamente, puede ser deseable.
  • Fenómeno de Runge : los polinomios de orden superior pueden ser muy oscilatorios. Si una curva pasa por dos puntos A y B , se esperaría que la curva pasara también algo cerca del punto medio de A y B. Esto puede no suceder con las curvas polinómicas de orden superior; incluso pueden tener valores muy grandes en magnitud positiva o negativa . Con polinomios de orden inferior, es más probable que la curva caiga cerca del punto medio (incluso se garantiza que pase exactamente por el punto medio en un polinomio de primer grado).
  • Los polinomios de orden bajo tienden a ser suaves y las curvas polinómicas de orden alto tienden a ser "irregulares". Para definir esto con más precisión, el número máximo de puntos de inflexión posibles en una curva polinómica es n-2 , donde n es el orden de la ecuación polinómica. Un punto de inflexión es una ubicación en la curva donde cambia de un radio positivo a negativo. También podemos decir que aquí es donde pasa de "retener agua" a "derramar agua". Tenga en cuenta que solo es "posible" que los polinomios de orden alto sean irregulares; también podrían ser suaves, pero no hay garantía de esto, a diferencia de lo que ocurre con las curvas polinómicas de orden bajo. Un polinomio de grado quince podría tener, como máximo, trece puntos de inflexión, pero también podría tener once, o nueve o cualquier número impar hasta uno. (Los polinomios con grado par podrían tener cualquier número par de puntos de inflexión desde n  - 2 hasta cero).

El grado de la curva polinómica es mayor que el necesario para un ajuste exacto, lo que no es deseable por todas las razones mencionadas anteriormente para los polinomios de orden superior, pero también conduce a un caso en el que hay un número infinito de soluciones. Por ejemplo, un polinomio de primer grado (una línea) restringido por un solo punto, en lugar de los dos habituales, daría un número infinito de soluciones. Esto plantea el problema de cómo comparar y elegir una sola solución, lo que puede ser un problema para el software y también para los humanos. Por este motivo, normalmente es mejor elegir un grado lo más bajo posible para una coincidencia exacta en todas las restricciones, y quizás un grado incluso más bajo, si un ajuste aproximado es aceptable.

Relación entre el rendimiento del trigo y la salinidad del suelo [21]

Adaptación de otras funciones a los puntos de datos

También se pueden utilizar, en ciertos casos, otros tipos de curvas, como funciones trigonométricas (como el seno y el coseno).

En espectroscopia, los datos pueden ajustarse con funciones gaussianas , lorentzianas , de Voigt y funciones relacionadas.

En biología, ecología, demografía, epidemiología y muchas otras disciplinas, el crecimiento de una población , la propagación de enfermedades infecciosas, etc. se pueden ajustar utilizando la función logística .

En agricultura, la función sigmoidea logística invertida (curva S) se utiliza para describir la relación entre el rendimiento de los cultivos y los factores de crecimiento. La figura azul se elaboró ​​mediante una regresión sigmoidea de datos medidos en tierras agrícolas. Se puede observar que inicialmente, es decir, cuando la salinidad del suelo es baja, el rendimiento de los cultivos se reduce lentamente a medida que aumenta la salinidad del suelo, mientras que después la disminución avanza más rápidamente.

Ajuste geométrico de curvas planas a puntos de datos

Si no se puede postular una función de la forma , todavía se puede intentar ajustar una curva plana . y = F ( incógnita ) {\displaystyle y=f(x)}

En ciertos casos, también se pueden utilizar otros tipos de curvas, como secciones cónicas (arcos circulares, elípticos, parabólicos e hiperbólicos) o funciones trigonométricas (como el seno y el coseno). Por ejemplo, las trayectorias de los objetos bajo la influencia de la gravedad siguen una trayectoria parabólica cuando se ignora la resistencia del aire. Por lo tanto, tendría sentido hacer coincidir los puntos de datos de trayectoria con una curva parabólica. Las mareas siguen patrones sinusoidales, por lo que los puntos de datos de mareas deberían coincidir con una onda sinusoidal, o la suma de dos ondas sinusoidales de diferentes períodos, si se consideran los efectos de la Luna y el Sol.

Para una curva paramétrica , es eficaz ajustar cada una de sus coordenadas como una función separada de la longitud del arco ; suponiendo que los puntos de datos se pueden ordenar, se puede utilizar la distancia de la cuerda . [22]

Ajuste de un círculo por ajuste geométrico

Ajuste circular con el método de Coope, los puntos describen un arco de círculo, centro (1; 1), radio 4.
Diferentes modelos de ajuste de elipse
Ajuste de elipse minimizando la distancia algebraica (método de Fitzgibbon).

Coope [23] aborda el problema de intentar encontrar el mejor ajuste visual del círculo a un conjunto de puntos de datos 2D. El método transforma elegantemente el problema normalmente no lineal en un problema lineal que se puede resolver sin utilizar métodos numéricos iterativos y, por lo tanto, es mucho más rápido que las técnicas anteriores.

Ajuste de una elipse mediante ajuste geométrico

La técnica anterior se extiende a elipses generales [24] añadiendo un paso no lineal, lo que da como resultado un método rápido, pero que encuentra elipses visualmente agradables con orientación y desplazamiento arbitrarios.

Superficies de montaje

Tenga en cuenta que, si bien este debate se realizó en términos de curvas 2D, gran parte de esta lógica también se extiende a superficies 3D, cada parche de las cuales está definido por una red de curvas en dos direcciones paramétricas, normalmente llamadas u y v . Una superficie puede estar compuesta por uno o más parches de superficie en cada dirección.

Software

Muchos paquetes estadísticos como R y software numérico como gnuplot , GNU Scientific Library , Igor Pro , MLAB , Maple , MATLAB , TK Solver 6.0, Scilab , Mathematica , GNU Octave y SciPy incluyen comandos para realizar ajustes de curvas en una variedad de escenarios. También hay programas escritos específicamente para realizar ajustes de curvas; se pueden encontrar en las listas de programas estadísticos y de análisis numérico , así como en Categoría:Software de regresión y ajuste de curvas .

Véase también

Referencias

  1. ^ Sandra Lach Arlinghaus, PHB Manual práctico de ajuste de curvas. CRC Press, 1994.
  2. ^ William M. Kolb. Ajuste de curvas para calculadoras programables. Syntec, Incorporated, 1984.
  3. ^ SS Halli, KV Rao. 1992. Técnicas avanzadas de análisis de población. ISBN  0306439972 Página 165 ( cf. ... funciones se cumplen si tenemos un ajuste bueno a moderado para los datos observados).
  4. ^ La señal y el ruido: por qué tantas predicciones fallan, pero algunas no. Por Nate Silver
  5. ^ Preparación de datos para minería de datos: texto. Por Dorian Pyle.
  6. ^ Métodos numéricos en ingeniería con MATLAB®. Por Jaan Kiusalaas. Página 24.
  7. ^ Métodos numéricos en ingeniería con Python 3. Por Jaan Kiusalaas. Página 21.
  8. ^ Métodos numéricos de ajuste de curvas. Por PG Guest, Philip George Guest. Página 349.
  9. ^ Véase también: Mollifier
  10. ^ Ajuste de modelos a datos biológicos mediante regresión lineal y no lineal. Por Harvey Motulsky y Arthur Christopoulos.
  11. ^ Análisis de regresión por Rudolf J. Freund, William J. Wilson, Ping Sa. Página 269.
  12. ^ Informática visual. Editado por Halimah Badioze Zaman, Peter Robinson, Maria Petrou, Patrick Olivier, Heiko Schröder. Página 689.
  13. ^ Métodos numéricos para modelos de ingeniería no lineales. Por John R. Hauser. Página 227.
  14. ^ Métodos de física experimental: espectroscopia, volumen 13, parte 1. Por Claire Marton. Página 150.
  15. ^ Enciclopedia de diseño de investigación, volumen 1. Editado por Neil J. Salkind. Página 266.
  16. ^ Técnicas de análisis y planificación comunitaria. Por Richard E. Klosterman. Página 1.
  17. ^ Introducción al riesgo y la incertidumbre en la evaluación de inversiones ambientales. DIANE Publishing. Pág. 69
  18. ^ Ahn, Sung-Joon (diciembre de 2008), "Ajuste geométrico de curvas y superficies paramétricas" (PDF) , Journal of Information Processing Systems , 4 (4): 153–158, doi :10.3745/JIPS.2008.4.4.153, archivado desde el original (PDF) el 13 de marzo de 2014
  19. ^ Chernov, N.; Ma, H. (2011), "Ajuste de curvas y superficies cuadráticas por mínimos cuadrados", en Yoshida, Sota R. (ed.), Computer Vision , Nova Science Publishers, págs. 285–302, ISBN 9781612093994
  20. ^ Liu, Yang; Wang, Wenping (2008), "Una revisión del ajuste de distancias ortogonales por mínimos cuadrados de curvas y superficies paramétricas", en Chen, F.; Juttler, B. (eds.), Avances en modelado y procesamiento geométrico , Lecture Notes in Computer Science, vol. 4975, págs. 384–397, CiteSeerX 10.1.1.306.6085 , doi :10.1007/978-3-540-79246-8_29, ISBN  978-3-540-79245-1
  21. ^ Calculadora para regresión sigmoidea
  22. ^ p.51 en Ahlberg & Nilson (1967) La teoría de splines y sus aplicaciones , Academic Press, 1967 [1]
  23. ^ Coope, ID (1993). "Ajuste de círculos mediante mínimos cuadrados lineales y no lineales". Revista de teoría y aplicaciones de la optimización . 76 (2): 381–388. doi :10.1007/BF00939613. hdl : 10092/11104 . S2CID  59583785.
  24. ^ Paul Sheer, Un asistente de software para fotometrología estereoscópica manual, tesis de maestría, 1997

Lectura adicional

  • N. Chernov (2010), Regresión circular y lineal: ajuste de círculos y líneas por mínimos cuadrados , Chapman & Hall/CRC, Monografías sobre estadística y probabilidad aplicada, volumen 117 (256 pp.). [2]
Obtenido de "https://es.wikipedia.org/w/index.php?title=Ajuste_de_curvas&oldid=1240549346"