Suavizado

Ajuste de una función de aproximación a los datos
Ejemplo simple de suavizado exponencial. Datos brutos: temperaturas medias diarias en la estación meteorológica de París-Montsouris (Francia) del 01/01/1960 al 29/02/1960. Datos suavizados con factor alfa = 0,1.

En estadística y procesamiento de imágenes , suavizar un conjunto de datos es crear una función de aproximación que intenta capturar patrones importantes en los datos, mientras deja de lado el ruido u otras estructuras de escala fina/fenómenos rápidos. En el suavizado, los puntos de datos de una señal se modifican de modo que los puntos individuales más altos que los puntos adyacentes (presumiblemente debido al ruido) se reducen, y los puntos que son más bajos que los puntos adyacentes se incrementan, lo que lleva a una señal más suave. El suavizado se puede utilizar de dos formas importantes que pueden ayudar en el análisis de datos (1) al poder extraer más información de los datos siempre que la suposición de suavizado sea razonable y (2) al poder proporcionar análisis que sean flexibles y robustos. [1] Se utilizan muchos algoritmos diferentes en el suavizado.

El suavizado puede distinguirse del concepto relacionado y parcialmente superpuesto de ajuste de curvas de las siguientes maneras:

  • El ajuste de curvas a menudo implica el uso de una forma de función explícita para el resultado, mientras que los resultados inmediatos del suavizado son los valores "suavizados" sin ningún uso posterior de una forma funcional si existe una;
  • El objetivo del suavizado es dar una idea general de cambios de valor relativamente lentos con poca atención a la coincidencia cercana de los valores de los datos, mientras que el ajuste de curvas se concentra en lograr una coincidencia lo más cercana posible.
  • Los métodos de suavizado suelen tener un parámetro de ajuste asociado que se utiliza para controlar el grado de suavizado. El ajuste de curvas ajustará cualquier número de parámetros de la función para obtener el "mejor" ajuste.

Suavizadores lineales

En el caso de que los valores suavizados puedan escribirse como una transformación lineal de los valores observados, la operación de suavizado se conoce como suavizador lineal ; la matriz que representa la transformación se conoce como matriz suavizadora o matriz de sombrero . [ cita requerida ]

La operación de aplicar dicha transformación matricial se denomina convolución . Por lo tanto, la matriz también se denomina matriz de convolución o núcleo de convolución . En el caso de una serie simple de puntos de datos (en lugar de una imagen multidimensional), el núcleo de convolución es un vector unidimensional .

Algoritmos

Uno de los algoritmos más comunes es el de " promedio móvil ", que se utiliza a menudo para intentar capturar tendencias importantes en encuestas estadísticas repetidas . En el procesamiento de imágenes y la visión artificial , las ideas de suavizado se utilizan en representaciones espaciales a escala . El algoritmo de suavizado más simple es el "rectangular" o "smooth de promedio móvil no ponderado". Este método reemplaza cada punto de la señal con el promedio de "m" puntos adyacentes, donde "m" es un entero positivo llamado "ancho de suavizado". Por lo general, m es un número impar. El suavizado triangular es como el suavizado rectangular excepto que implementa una función de suavizado ponderada. [2]

Algunos tipos específicos de suavizado y filtro, con sus respectivos usos, pros y contras son:

AlgoritmoDescripción general y usosVentajasContras
Suavizado aditivoSe utiliza para suavizar datos categóricos .
Filtro ButterworthCaída más lenta que la de un filtro Chebyshev tipo I/tipo II o un filtro elíptico
  • Respuesta de fase más lineal en la banda de paso que la que pueden lograr los filtros Chebyshev Tipo I/Tipo II y los elípticos.
  • Diseñado para tener una respuesta de frecuencia lo más plana posible en la banda de paso.
Filtro de ChebyshevTiene una caída más pronunciada y más ondulación de banda de paso (tipo I) o de banda de supresión (tipo II) que los filtros Butterworth .
  • Minimiza el error entre la característica idealizada y la característica real del filtro en el rango del filtro.
Filtro digitalSe utiliza en una señal muestreada de tiempo discreto para reducir o mejorar ciertos aspectos de esa señal.
Filtro elíptico
Suavizado exponencial
  • Se utiliza para reducir irregularidades (fluctuaciones aleatorias) en datos de series de tiempo, proporcionando así una visión más clara del verdadero comportamiento subyacente de la serie.
  • Además, proporciona un medio eficaz para predecir valores futuros de las series temporales (previsión). [3]
Filtro KalmanLas estimaciones de variables desconocidas que produce tienden a ser más precisas que las basadas en una sola medición.
Suavizado de núcleos
  • Se utiliza para estimar una función de valor real como el promedio ponderado de datos observados vecinos.
  • más apropiado cuando la dimensión del predictor es baja ( p < 3), por ejemplo para visualización de datos.
La función estimada es suave y el nivel de suavidad se establece mediante un solo parámetro.
Filtro Kolmogorov-Zurbenko
  • Robusto y casi óptimo
  • Funciona bien en un entorno de datos faltantes, especialmente en tiempo y espacio multidimensionales donde los datos faltantes pueden causar problemas derivados de la escasez espacial.
  • Los dos parámetros tienen interpretaciones claras para que puedan ser fácilmente adoptados por especialistas en diferentes áreas.
  • Se han desarrollado implementaciones de software para series de tiempo, datos longitudinales y espaciales en el popular paquete estadístico R , que facilitan el uso del filtro KZ y sus extensiones en diferentes áreas.
Suavizado laplacianoAlgoritmo para suavizar una malla poligonal . [4] [5]
Regresión local también conocida como "loess" o "lowess"una generalización de la regresión polinomial y de media móvil .
  • Ajustar modelos simples a subconjuntos localizados de los datos para construir una función que describa la parte determinista de la variación en los datos, punto por punto.
  • Uno de los principales atractivos de este método es que no se requiere que el analista de datos especifique una función global de ningún tipo para ajustar un modelo a los datos, sino sólo para ajustar segmentos de los datos.
  • Mayor capacidad computacional. Debido a que requiere tantos cálculos, LOESS habría sido prácticamente imposible de usar en la época en que se estaba desarrollando la regresión de mínimos cuadrados.
Filtro de paso bajo
  • Un filtro que pasa señales con una frecuencia inferior a una frecuencia de corte seleccionada y atenúa las señales con frecuencias superiores a la frecuencia de corte.
  • Se utiliza para la realización de tiempo continuo y la realización de tiempo discreto.
Promedio móvil
  • Un cálculo para analizar puntos de datos mediante la creación de una serie de promedios de diferentes subconjuntos del conjunto de datos completo.
  • una técnica de suavizado utilizada para hacer más claras las tendencias a largo plazo de una serie temporal. [3]
  • El primer elemento de la media móvil se obtiene tomando la media del subconjunto fijo inicial de la serie de números.
  • Se utiliza comúnmente con datos de series de tiempo para suavizar fluctuaciones de corto plazo y resaltar tendencias o ciclos de largo plazo.
  • Se ha ajustado para permitir componentes estacionales o cíclicos de una serie temporal.
Algoritmo de Ramer-Douglas-Peuckerdiezma una curva compuesta de segmentos de línea a una curva similar con menos puntos.
Filtro de suavizado Savitzky-Golay
  • basado en el ajuste de mínimos cuadrados de polinomios a segmentos de los datos
Spline suavizante
Método de cuadrícula estirada
  • Una técnica numérica para encontrar soluciones aproximadas de varios problemas matemáticos y de ingeniería que pueden relacionarse con el comportamiento de una red elástica.
  • Los meteorólogos utilizan el método de cuadrícula estirada para la predicción del tiempo
  • Los ingenieros utilizan el método de cuadrícula estirada para diseñar tiendas de campaña y otras estructuras tensadas .

Véase también

Referencias

  1. ^ Simonoff, Jeffrey S. (1998) Métodos de suavizado en estadística , 2.ª edición. Springer ISBN  978-0387947167 [ página necesaria ]
  2. ^ O'Haver, T. (enero de 2012). "Suavizado". terpconnect.umd.edu .
  3. ^ ab Easton, VJ; y McColl, JH (1997) "Series temporales", Glosario de estadísticas STEPS
  4. ^ Herrmann, Leonard R. (1976), "Esquema de generación de cuadrícula laplaciana-isoparamétrica", Journal of the Engineering Mechanics Division , 102 (5): 749–756, doi :10.1061/JMCEA3.0002158.
  5. ^ Sorkine, O., Cohen-Or, D., Lipman, Y., Alexa, M. , Rössl, C., Seidel, H.-P. (2004). "Edición de superficies laplacianas". Actas del Simposio Eurographics/ACM SIGGRAPH de 2004 sobre procesamiento geométrico . SGP '04. Niza, Francia: ACM. págs. 175–184. doi :10.1145/1057432.1057456. ISBN 3-905673-13-4.S2CID 1980978  .{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )

Lectura adicional

  • Hastie, TJ y Tibshirani, RJ (1990), Modelos aditivos generalizados , Nueva York: Chapman y Hall.
Obtenido de "https://es.wikipedia.org/w/index.php?title=Suavizado&oldid=1248481257"