Un mapa de calor (o mapa de calor ) es una técnica de visualización de datos bidimensional que representa la magnitud de valores individuales dentro de un conjunto de datos como un color. La variación en el color puede ser por tono o intensidad .
En algunas aplicaciones, como el análisis de delitos o el seguimiento de clics en sitios web, se utiliza el color para representar la densidad de los puntos de datos en lugar de un valor asociado con cada punto.
"Mapa de calor" es un término relativamente nuevo, pero la práctica de sombrear matrices existe desde hace más de un siglo. [1]
Los mapas de calor se originaron en visualizaciones 2D de los valores en una matriz de datos. Los valores más grandes se representaban mediante pequeños cuadrados (píxeles) de color gris oscuro o negro y los valores más pequeños mediante cuadrados más claros. Toussaint Loua (1873) utilizó una matriz de sombreado para visualizar las estadísticas sociales en los distritos de París . [1] Sneath (1957) mostró los resultados de un análisis de conglomerados permutando las filas y las columnas de una matriz para colocar valores similares cerca uno del otro de acuerdo con la agrupación. Jacques Bertin utilizó una representación similar para mostrar datos que se ajustaban a una escala de Guttman . La idea de unir árboles de conglomerados a las filas y columnas de la matriz de datos se originó con Robert Ling en 1973. Ling utilizó caracteres de impresora tachados para representar diferentes tonos de gris, un ancho de carácter por píxel. Leland Wilkinson desarrolló el primer programa informático en 1994 ( SYSTAT ) para producir mapas de calor de conglomerados con gráficos en color de alta resolución. Eisen et al. La pantalla que se muestra en la figura es una réplica del diseño anterior de SYSTAT. [ cita requerida ]
El diseñador de software Cormac Kinney registró el término "mapa de calor" en 1991 para describir una pantalla 2D que mostraba información del mercado financiero . [2] La empresa que adquirió la invención de Kinney en 2003 permitió que la marca caducara sin querer. [3]
Hay dos tipos principales de mapas de calor: espaciales y de cuadrícula.
Un mapa de calor espacial muestra la magnitud de un fenómeno espacial en forma de color, generalmente proyectado sobre un mapa. En la imagen denominada "Ejemplo de mapa de calor espacial", la temperatura se muestra en un rango de colores en un mapa del mundo. Los colores van del azul (frío) al rojo (caliente).
Un mapa de calor de cuadrícula muestra la magnitud como color en una matriz bidimensional, donde cada dimensión representa una categoría de rasgo y el color representa la magnitud de alguna medición en los rasgos combinados de cada una de las dos categorías. Por ejemplo, una dimensión podría representar el año y la otra podría representar el mes, y el valor medido podría ser la temperatura. Este mapa de calor mostraría cómo cambió la temperatura a lo largo de los años en cada mes. Los mapas de calor de cuadrícula se clasifican además en dos tipos diferentes de matrices: agrupadas y correlogramas. [ cita requerida ]
En un mapa de calor de cuadrícula, los colores se presentan en una cuadrícula de un tamaño fijo, y cada celda de la cuadrícula también tiene el mismo tamaño y forma. El objetivo es detectar agrupaciones o sugerir la presencia de agrupaciones.
Un mapa de calor espacial se utiliza a menudo en mapas o imágenes de satélite (véase SIG ), donde no existe el concepto de celdas y, en cambio, los colores varían continuamente.
Los mapas de calor tienen una amplia gama de posibilidades entre las aplicaciones debido a su capacidad para simplificar los datos y hacer que su lectura sea más atractiva. A continuación se enumeran muchas aplicaciones que utilizan diferentes tipos de mapas de calor.
Análisis empresarial : los mapas de calor se utilizan en el análisis empresarial para ofrecer una representación visual del funcionamiento actual de una empresa, su rendimiento y la necesidad de mejoras. Los mapas de calor son una forma de analizar los datos existentes de una empresa y actualizarlos para reflejar el crecimiento y otros esfuerzos específicos. Los mapas de calor resultan atractivos visualmente para los miembros del equipo y los clientes de la empresa o negocio.
Sitios web: existen muchas formas diferentes de utilizar los mapas de calor en los sitios web para determinar las acciones de los usuarios que visitan un sitio. Normalmente, se utilizan varios mapas de calor en conjunto para determinar qué elementos de un sitio web tienen mejor y peor rendimiento. A continuación, se enumeran algunos mapas de calor específicos que se utilizan para el análisis de sitios web.
Análisis exploratorio de datos : al trabajar con conjuntos de datos pequeños y grandes, los científicos y analistas de datos observan y determinan las relaciones y características esenciales entre los diferentes puntos de un conjunto de datos, así como las características de esos puntos de datos. Los científicos y analistas de datos trabajan con un equipo de otras personas en diferentes profesiones. El uso de mapas de calor permite resumir visualmente los hallazgos y los componentes principales de manera sencilla. Existen otras formas de representar datos, sin embargo, los mapas de calor pueden visualizar estos puntos de datos y sus relaciones en un espacio de alta dimensión sin volverse demasiado compactos y visualmente poco atractivos. Los mapas de calor en el análisis de datos permiten variables específicas de filas y/o columnas en los ejes e incluso en la diagonal.
Análisis financiero : los valores de los distintos productos y activos fluctúan de forma rápida o gradual a lo largo del tiempo. La necesidad de registrar los cambios en los mercados diarios es imperativa. Esto permite hacer predicciones a partir de patrones y, al mismo tiempo, revisar datos numéricos anteriores. Los mapas de calor permiten eliminar el tedioso proceso y permitir al usuario visualizar puntos de datos y comparar entre los distintos actores. [5]
Visualización geográfica : Los mapas de calor se utilizan para visualizar y mostrar una distribución geográfica de datos. Los mapas de calor representan diferentes densidades de puntos de datos en un mapa geográfico para ayudar a los usuarios a ver las intensidades de ciertos fenómenos y mostrar elementos de mayor o menor importancia. Los mapas de calor utilizados en la visualización geográfica a veces se confunden con los mapas coropléticos , pero la diferencia radica en cómo se presentan ciertos datos que los diferencian. [6]
Deportes: Los mapas de calor se pueden utilizar en muchos deportes y pueden influir en las decisiones de los entrenadores y/o directores técnicos en función de la alta y baja densidad de datos que se muestran. Los usuarios pueden identificar patrones dentro del juego, las estrategias de los oponentes y del propio equipo, tomar decisiones más informadas que beneficien al jugador, al equipo y a la empresa, y pueden mejorar el rendimiento en diferentes áreas identificando las mejoras necesarias. Los mapas de calor también visualizan comparaciones y relaciones entre diferentes equipos del mismo deporte o entre diferentes deportes en conjunto. [7]
Se pueden utilizar muchos esquemas de colores diferentes para ilustrar el mapa de calor, con ventajas y desventajas perceptivas para cada uno. Elegir un buen esquema de colores es fundamental para mostrar los datos de forma precisa y eficaz, mientras que un esquema de colores deficiente puede llevar a los espectadores a conclusiones inexactas o excluir a aquellos con deficiencias de color del análisis adecuado de dichos datos.
Los mapas de colores del arco iris son una opción común, ya que los humanos pueden percibir más tonos de color que de gris, y esto supuestamente aumentaría la cantidad de detalles perceptibles en la imagen. Sin embargo, esto está fuertemente desaconsejado en la comunidad científica por varias razones. Posiblemente la razón más importante es que cuando hay una gran cantidad de colores involucrados, la visualización puede dar la impresión de que existen gradientes en los datos que en realidad no están presentes. Cuantos más colores se utilizan en una visualización, más valores comienzan a mezclarse y el color carece del orden perceptual natural que se encuentra en los mapas de colores de espectro de cuerpo negro o escala de grises . Además, los valores representados por diferentes tonos del mismo color pueden implicar que los valores están relacionados cuando no lo están. [8] [9] [10]
Una consideración importante al elegir un esquema de colores es si los datos serán vistos por personas con algún tipo de deficiencia de color. Si la audiencia incluye personas con algún tipo de daltonismo , puede ser conveniente evitar esquemas de colores con rojos y verdes prominentes o gradientes de color desiguales . [10]
Además de las consideraciones de la audiencia, también es importante considerar la forma en que se visualizarán los datos. Por ejemplo, si los datos se van a imprimir en blanco y negro o se van a proyectar en una pantalla grande, puede ser conveniente ajustar la elección del esquema de colores. Los mapas de colores comunes (como el mapa de colores "jet" utilizado como predeterminado en muchos paquetes de software de visualización) tienen cambios no controlados en la luminancia que impiden una conversión significativa a escala de grises para su visualización o impresión . Esto también distrae de los datos reales, haciendo que las regiones amarillas y cian parezcan arbitrariamente más prominentes que las regiones de los datos que son realmente más importantes. [8] [10]
Hay varias implementaciones de software de mapas de calor disponibles de forma gratuita:
Los mapas de coropletas y los mapas de calor se utilizan a menudo en lugar de uno del otro de forma incorrecta cuando se hace referencia a datos visualizados geográficamente. [23] Ambas técnicas muestran la proporción de una variable de interés, pero las dos difieren en cómo se construyen los límites para las agregaciones de datos de la variable. Si los datos se recopilaron y agregaron utilizando límites irregulares, como unidades administrativas, entonces un mapa de calor que muestre esos datos será el mismo que un mapa de coropletas, lo que fomenta la confusión sobre cómo se diferencian los dos.
Los mapas coropléticos muestran datos agrupados por límites geográficos, como países, estados, provincias o incluso llanuras aluviales. Cada región tiene un valor singular, visualizado por la intensidad del color, el sombreado o el patrón. La figura de la derecha, que muestra un mapa coroplético que muestra la densidad de población de los Estados Unidos por estado, se puede utilizar como ejemplo. La figura ilustra un valor singular (población) indicado por la intensidad del color azul proporcional al valor del estado en relación con los valores de todos los demás estados, delimitado por la frontera de cada estado.
De manera similar, los mapas de calor también pueden visualizar datos sobre una región geográfica. Sin embargo, a diferencia de los mapas coropléticos, los mapas de calor muestran la proporción de una variable sobre un tamaño de cuadrícula arbitrario, pero generalmente pequeño, independientemente de los límites geográficos. [24] [25] La figura de la derecha que muestra un mapa de calor de la población mundial es un ejemplo. La figura ilustra un solo valor (población) delimitado en una cuadrícula arbitraria (kilómetros cuadrados) con cada celda de la cuadrícula representada por una intensidad de color proporcional al valor de la celda en relación con todas las demás celdas. Algunos mapas de calor que se crean utilizando datos regionales aproximados pueden mostrar fronteras geográficas familiares en la visualización donde realmente no existen. La ilusión de fronteras geográficas se debe a la existencia de patrones dentro del conjunto de datos en lugar de a la técnica de visualización. La figura de la derecha que muestra un mapa de calor de la población mundial también contiene esta ocurrencia. Las áreas en partes rurales de los Estados Unidos y Sudamérica pueden parecerse mucho a fronteras geográficas familiares en esas regiones.
Esta sección contiene una galería de imágenes no enciclopédica o excesiva . |