En estadística y procesamiento de imágenes , suavizar un conjunto de datos es crear una función de aproximación que intenta capturar patrones importantes en los datos, mientras deja de lado el ruido u otras estructuras de escala fina/fenómenos rápidos. En el suavizado, los puntos de datos de una señal se modifican de modo que los puntos individuales más altos que los puntos adyacentes (presumiblemente debido al ruido) se reducen, y los puntos que son más bajos que los puntos adyacentes se incrementan, lo que lleva a una señal más suave. El suavizado se puede utilizar de dos formas importantes que pueden ayudar en el análisis de datos (1) al poder extraer más información de los datos siempre que la suposición de suavizado sea razonable y (2) al poder proporcionar análisis que sean flexibles y robustos. [1] Se utilizan muchos algoritmos diferentes en el suavizado.
El suavizado puede distinguirse del concepto relacionado y parcialmente superpuesto de ajuste de curvas de las siguientes maneras:
El ajuste de curvas a menudo implica el uso de una forma de función explícita para el resultado, mientras que los resultados inmediatos del suavizado son los valores "suavizados" sin ningún uso posterior de una forma funcional si existe una;
El objetivo del suavizado es dar una idea general de cambios de valor relativamente lentos con poca atención a la coincidencia cercana de los valores de los datos, mientras que el ajuste de curvas se concentra en lograr una coincidencia lo más cercana posible.
Los métodos de suavizado suelen tener un parámetro de ajuste asociado que se utiliza para controlar el grado de suavizado. El ajuste de curvas ajustará cualquier número de parámetros de la función para obtener el "mejor" ajuste.
Suavizadores lineales
En el caso de que los valores suavizados puedan escribirse como una transformación lineal de los valores observados, la operación de suavizado se conoce como suavizador lineal ; la matriz que representa la transformación se conoce como matriz suavizadora o matriz de sombrero . [ cita requerida ]
Uno de los algoritmos más comunes es el de " promedio móvil ", que se utiliza a menudo para intentar capturar tendencias importantes en encuestas estadísticas repetidas . En el procesamiento de imágenes y la visión artificial , las ideas de suavizado se utilizan en representaciones espaciales a escala . El algoritmo de suavizado más simple es el "rectangular" o "smooth de promedio móvil no ponderado". Este método reemplaza cada punto de la señal con el promedio de "m" puntos adyacentes, donde "m" es un entero positivo llamado "ancho de suavizado". Por lo general, m es un número impar. El suavizado triangular es como el suavizado rectangular excepto que implementa una función de suavizado ponderada. [2]
Algunos tipos específicos de suavizado y filtro, con sus respectivos usos, pros y contras son:
Se utiliza para reducir irregularidades (fluctuaciones aleatorias) en datos de series de tiempo, proporcionando así una visión más clara del verdadero comportamiento subyacente de la serie.
Además, proporciona un medio eficaz para predecir valores futuros de las series temporales (previsión). [3]
Utiliza una serie de mediciones observadas a lo largo del tiempo, que contienen ruido estadístico y otras imprecisiones, al estimar una distribución de probabilidad conjunta sobre las variables para cada período de tiempo.
Las estimaciones de variables desconocidas que produce tienden a ser más precisas que las basadas en una sola medición.
Utiliza una serie de iteraciones de un filtro de media móvil de longitud m , donde m es un entero positivo impar.
Robusto y casi óptimo
Funciona bien en un entorno de datos faltantes, especialmente en tiempo y espacio multidimensionales donde los datos faltantes pueden causar problemas derivados de la escasez espacial.
Los dos parámetros tienen interpretaciones claras para que puedan ser fácilmente adoptados por especialistas en diferentes áreas.
Se han desarrollado implementaciones de software para series de tiempo, datos longitudinales y espaciales en el popular paquete estadístico R , que facilitan el uso del filtro KZ y sus extensiones en diferentes áreas.
Ajustar modelos simples a subconjuntos localizados de los datos para construir una función que describa la parte determinista de la variación en los datos, punto por punto.
Uno de los principales atractivos de este método es que no se requiere que el analista de datos especifique una función global de ningún tipo para ajustar un modelo a los datos, sino sólo para ajustar segmentos de los datos.
Mayor capacidad computacional. Debido a que requiere tantos cálculos, LOESS habría sido prácticamente imposible de usar en la época en que se estaba desarrollando la regresión de mínimos cuadrados.
Una técnica numérica para encontrar soluciones aproximadas de varios problemas matemáticos y de ingeniería que pueden relacionarse con el comportamiento de una red elástica.
Los meteorólogos utilizan el método de cuadrícula estirada para la predicción del tiempo
Los ingenieros utilizan el método de cuadrícula estirada para diseñar tiendas de campaña y otras estructuras tensadas .
^ O'Haver, T. (enero de 2012). "Suavizado". terpconnect.umd.edu .
^ ab Easton, VJ; y McColl, JH (1997) "Series temporales", Glosario de estadísticas STEPS
^ Herrmann, Leonard R. (1976), "Esquema de generación de cuadrícula laplaciana-isoparamétrica", Journal of the Engineering Mechanics Division , 102 (5): 749–756, doi :10.1061/JMCEA3.0002158.
^ Sorkine, O., Cohen-Or, D., Lipman, Y., Alexa, M. , Rössl, C., Seidel, H.-P. (2004). "Edición de superficies laplacianas". Actas del Simposio Eurographics/ACM SIGGRAPH de 2004 sobre procesamiento geométrico . SGP '04. Niza, Francia: ACM. págs. 175–184. doi :10.1145/1057432.1057456. ISBN3-905673-13-4.S2CID 1980978 .{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )
Lectura adicional
Hastie, TJ y Tibshirani, RJ (1990), Modelos aditivos generalizados , Nueva York: Chapman y Hall.