Un mapa de calor (o mapa de calor ) es una visualización de datos técnica que muestra la magnitud de un fenómeno como el color en dos dimensiones. La variación de color puede ser por tono o intensidad., dando pistas visuales obvias al lector sobre cómo el fenómeno se agrupa o varía en el espacio. Hay dos categorías fundamentalmente diferentes de mapas de calor: el mapa de calor del clúster y el mapa de calor espacial. En un mapa de calor de conglomerados, las magnitudes se presentan en una matriz de tamaño de celda fijo cuyas filas y columnas son fenómenos y categorías discretos, y la clasificación de filas y columnas es intencional y algo arbitraria, con el objetivo de sugerir conglomerados o representarlos como descubierto mediante análisis estadístico. El tamaño de la celda es arbitrario pero lo suficientemente grande como para ser claramente visible. Por el contrario, la posición de una magnitud en un mapa de calor espacial está forzada por la ubicación de la magnitud en ese espacio, y no existe la noción de células; se considera que el fenómeno varía continuamente.
"Mapa de calor" es un término relativamente nuevo, pero la práctica de las matrices de sombreado existe desde hace más de un siglo. [1]
Historia
Los mapas de calor se originaron en visualizaciones 2D de los valores en una matriz de datos. Los valores más grandes fueron representados por pequeños cuadrados grises oscuros o negros (píxeles) y los valores más pequeños por cuadrados más claros. Loua (1873) utilizó una matriz de sombreado para visualizar las estadísticas sociales en los distritos de París . [1] Sneath (1957) mostró los resultados de un análisis de conglomerados permutando las filas y las columnas de una matriz para colocar valores similares cerca unos de otros según el conglomerado. Jacques Bertin usó una representación similar para mostrar datos que se ajustaban a una escala de Guttman . La idea de unir árboles de clúster a las filas y columnas de la matriz de datos se originó con Robert Ling en 1973. Ling usó caracteres de impresora sobrecargados para representar diferentes tonos de gris, un carácter de ancho por píxel. Leland Wilkinson desarrolló el primer programa informático en 1994 ( SYSTAT ) para producir mapas de calor de grupos con gráficos en color de alta resolución. Eisen et al. La pantalla que se muestra en la figura es una réplica del diseño SYSTAT anterior. [ cita requerida ]
El diseñador de software Cormac Kinney registró el término "mapa de calor" en 1991 para describir una pantalla en 2D que representa la información del mercado financiero . [2] La empresa que adquirió la invención de Kinney en 2003 permitió involuntariamente que la marca caducara. [3]
Tipos
Hay diferentes tipos de mapas de calor:
- Los mapas de calor biológicos se utilizan normalmente en biología molecular para representar el nivel de expresión de muchos genes en una serie de muestras comparables (p. Ej., Células en diferentes estados, muestras de diferentes pacientes) según se obtienen a partir de microarrays de ADN .
- El mapa de árbol es una partición jerárquica de datos en 2D que se asemeja visualmente a un mapa de calor.
- Un diagrama de mosaico es un mapa de calor en mosaico para representar una tabla de datos bidireccional o superior. Al igual que con los mapas de árbol, las regiones rectangulares en un diagrama de mosaico están organizadas jerárquicamente. Eso significa que las regiones son rectángulos en lugar de cuadrados. Friendly (1994) analiza la historia y el uso de este gráfico.
- Una visualización de función de densidad es un mapa de calor para representar la densidad de puntos en un mapa. Permite percibir la densidad de puntos independientemente del factor de zoom. Perrot y col. (2015) propuso una forma de utilizar la función de densidad para visualizar miles de millones y miles de millones de puntos utilizando la infraestructura de big data con Spark y Hadoop. [5]
Esquemas de color
Se pueden usar muchos esquemas de colores diferentes para ilustrar el mapa de calor, con ventajas y desventajas de percepción para cada uno. Los mapas de colores del arco iris se utilizan a menudo, ya que los humanos pueden percibir más tonos de color que de gris, y esto supuestamente aumentaría la cantidad de detalles perceptibles en la imagen. Sin embargo, esto es desaconsejado por muchos en la comunidad científica, por las siguientes razones: [6] [7] [8] [9] [10] [11]
- Los colores carecen del orden de percepción natural que se encuentra en los mapas de colores de espectro de escala de grises o de cuerpo negro . [6] [11]
- Los mapas de colores comunes (como el mapa de colores "jet" utilizado como predeterminado en muchos paquetes de software de visualización) tienen cambios incontrolados en la luminancia que impiden una conversión significativa a escala de grises para su visualización o impresión . Esto también distrae de los datos reales, haciendo arbitrariamente que las regiones amarillas y cian parezcan más prominentes que las regiones de los datos que son realmente más importantes. [6] [11]
- Los cambios entre colores también conducen a la percepción de degradados que en realidad no están presentes, lo que hace que los degradados reales sean menos prominentes, lo que significa que los mapas de colores del arco iris pueden ocultar los detalles en muchos casos en lugar de mejorarlos. [6] [10] [11]
- No todos los colores en un mapa de colores del arco iris pueden ser diferenciados por lectores con visión deficiente del color, lo que hace que las figuras que utilizan estos esquemas de color sean inaccesibles para una proporción significativa de la población. [11]
Mapas de coropletas frente a mapas de calor
Los mapas de coropletas a veces se denominan incorrectamente mapas de calor. Un mapa de coropletas presenta diferentes patrones o sombreados dentro de los límites geográficos para mostrar la proporción de una variable de interés, mientras que la coloración de un mapa de calor (en un contexto de mapa) no corresponde a los límites geográficos. [12]
Implementaciones de software
Varias implementaciones de software de mapas de calor están disponibles gratuitamente:
- R , un entorno de software libre para computación estadística y gráficos, contiene varias funciones para rastrear mapas de calor, [13] [14] incluyendo mapas de calor de clúster interactivos [15] (a través del paquete heatmaply R).
- Gnuplot , un programa de trazado de línea de comandos universal y gratuito, puede trazar mapas de calor 2D y 3D. [dieciséis]
- Google Fusion Tables puede generar un mapa de calor a partir de una hoja de cálculo de Google Sheets limitada a 1000 puntos de datos geográficos. [17]
- El esquema de color 'cubehelix' de Dave Green proporciona recursos para un esquema de color que se imprime como una escala de grises que aumenta monótonamente en dispositivos postscript en blanco y negro. [18]
- Openlayers 3 puede representar una capa de mapa de calor de una propiedad seleccionada de todas las características geográficas en una capa vectorial. [19]
- D3.js , [20] [21] AnyChart [22] [23] y Highcharts [24] [25] son bibliotecas JavaScript para visualización de datos que brindan la capacidad de crear gráficos de mapas de calor interactivos, desde básicos hasta altamente personalizados, como parte de sus soluciones.
Ejemplos de
Nieve con efecto lago: la información del radar meteorológico generalmente se muestra mediante un mapa de calor.
Voz humana visualizada con un espectrograma ; un mapa de calor que representa la magnitud de la STFT . Una visualización alternativa es el diagrama de cascada .
Ejemplo que muestra las relaciones entre un mapa de calor, un gráfico de superficie y líneas de contorno de los mismos datos
Combinación de gráfico de superficie y mapa de calor, donde la altura de la superficie representa la amplitud de la función y el color representa el ángulo de fase.
Puntuación de cada región contigua de un tablero de dardos (no a escala)
Ver también
- Color falso
Referencias
- ↑ a b Wilkinson L, Friendly M (mayo de 2009). "La historia del mapa de calor del clúster". El estadístico estadounidense . 63 (2): 179-184. CiteSeerX 10.1.1.165.7924 . doi : 10.1198 / tas.2009.0033 . S2CID 122792460 .
- ^ "Oficina de Patentes y Marcas de los Estados Unidos, registro # 75263259" . 1993-09-01.
- ^ Silhavy R, Senkerik R, Oplatkova ZK, Silhavy P, Prokopova Z (26 de abril de 2016). Perspectivas de la Ingeniería de Software y Aplicación en Sistemas Inteligentes . ISBN 978-3-319-33622-0.
- ^ MH370 - Definición de áreas de búsqueda submarina (PDF) (Informe). Oficina de Seguridad del Transporte de Australia . 3 de diciembre de 2015.
- ^ Perrot A, Bourqui R, Hanusse N, Lalanne F, Auber D (2015). "Gran visualización interactiva de funciones de densidad en infraestructura de big data" (PDF) . 2015 IEEE 5th Symposium on Large Data Analysis and Visualization (LDAV) . Quinto Simposio de IEEE sobre Análisis y Visualización de Grandes Datos (LDAV), 2015 . págs. 99-106. doi : 10.1109 / LDAV.2015.7348077 . ISBN 978-1-4673-8517-6. S2CID 4768931 .
- ^ a b c d Borland D, Taylor MR (2007). "Mapa de color del arco iris (todavía) considerado dañino". Aplicaciones y gráficos informáticos IEEE . 27 (2): 14–7. doi : 10.1109 / MCG.2007.323435 . PMID 17388198 .
- ^ Cómo NO mentir con la visualización - Bernice E. Rogowitz y Lloyd A. Treinish - IBM Thomas J. Watson Research Center, Yorktown Heights, NY
- ^ Harrower M, Brewer CA (2003). "ColorBrewer.org: una herramienta en línea para seleccionar esquemas de color para mapas". En Dodge M, Kitchin R, Perkins C (eds.). El diario cartográfico . págs. 27–37. doi : 10.1179 / 000870403235002042 . ISBN 978-0-470-98007-1. S2CID 140173239 .
- ^ Green DA (2011). "Un esquema de color para la visualización de imágenes de intensidad astronómica". Boletín de la Sociedad Astronómica de la India . 39 : 289–95. arXiv : 1108.5083 . Código bibliográfico : 2011BASI ... 39..289G .
- ^ a b Borkin MA, Gajos KZ, Peters A, Mitsouras D, Melchionna S, Rybicki FJ, et al. (Diciembre de 2011). "Evaluación de visualizaciones de arterias para el diagnóstico de enfermedades cardíacas". Transacciones IEEE sobre visualización y gráficos por computadora . 17 (12): 2479–88. CiteSeerX 10.1.1.309.590 . doi : 10.1109 / TVCG.2011.192 . PMID 22034369 . S2CID 2548700 .
- ^ a b c d e Crameri F, Shephard GE, Heron PJ (octubre de 2020). "El mal uso del color en la comunicación científica" . Comunicaciones de la naturaleza . 11 (1): 5444. doi : 10.1038 / s41467-020-19160-7 . PMC 7595127 . PMID 33116149 .
- ^ "Coropleta vs. Mapa de calor -" . gretchenpeterson.com .
- ^ "Usando R para dibujar un mapa de calor de datos de microarrays" . Organización y ensamblaje molecular en células . 26 de noviembre de 2009.
- ^ "Dibujar un mapa de calor" . R Manual .
- ^ Galili T, O'Callaghan A, Sidi J, Sievert C (mayo de 2018). "heatmaply: un paquete de R para crear mapas de calor de clúster interactivos para la publicación en línea" . Bioinformática . 34 (9): 1600–1602. doi : 10.1093 / bioinformática / btx657 . PMC 5925766 . PMID 29069305 .
- ^ "Script de demostración de Gnuplot: Heatmaps.dem" .
- ^ "Ayuda de Fusion Tables: crear un mapa de calor" . Enero de 2018. support.google.com
- ^ "Esquema de color 'cubehelix' de Dave Green" .
- ^ "ol / layer / Heatmap ~ Heatmap" . OpenLayers . Consultado el 1 de enero de 2019 .
- ^ "Mapa de calor" . D3.js Galería Gráfico . Consultado el 25 de julio de 2020 .
- ^ "Mapa de calor más básico en d3.js" . D3.js Galería Gráfico . Consultado el 25 de julio de 2020 .
- ^ "Gráfico de mapa de calor" . Documentación de AnyChart . Consultado el 25 de julio de 2020 .
- ^ "Gráficos de mapas de calor - Galería" . Galería AnyChart . Consultado el 25 de julio de 2020 .
- ^ "Mapa de calor - Documentos de Highcharts" . Highcharts . Consultado el 9 de diciembre de 2019 .
- ^ "Mapas de calor y árboles - demostraciones de Highcharts" . Highcharts . Consultado el 9 de diciembre de 2019 .
Otras lecturas
- Bertin J (1967). Sémiologie Graphique. Les diagrammes, les réseaux, les cartes [ Semiótica gráfica. Diagramas, redes, mapas ] (en francés). Gauthier-Villars. OCLC 2656278 .
- Eisen MB, Spellman PT, Brown PO, Botstein D (diciembre de 1998). "Análisis de conglomerados y visualización de patrones de expresión de todo el genoma" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 95 (25): 14863–8. Código bibliográfico : 1998PNAS ... 9514863E . doi : 10.1073 / pnas.95.25.14863 . PMC 24541 . PMID 9843981 .
- Friendly M (marzo de 1994). "Pantallas de mosaico para tablas de contingencia de múltiples direcciones". Revista de la Asociación Estadounidense de Estadística . 89 (425): 190–200. doi : 10.1080 / 01621459.1994.10476460 . JSTOR 2291215 .
- Ling RL (1973). "Una ayuda generada por computadora para el análisis de conglomerados". Comunicaciones de la ACM . 16 (6): 355–361. doi : 10.1145 / 362248.362263 . S2CID 8033024 .
- Sneath PH (agosto de 1957). "La aplicación de las computadoras a la taxonomía" . Revista de Microbiología General . 17 (1): 201–26. doi : 10.1099 / 00221287-17-1-201 . PMID 13475686 .
- Wilkinson L. (1994). Aplicaciones avanzadas: Systat para DOS versión 6 . SYSTAT. ISBN 978-0-13-447285-0.
- Trueque RL, Yu B (2018). "Superheat: un paquete R para crear mapas de calor hermosos y extensibles para visualizar datos complejos" . Revista de Estadística Computacional y Gráfica . 27 (4): 910–922. arXiv : 1512.01524 . doi : 10.1080 / 10618600.2018.1473780 . PMC 6430237 . PMID 30911216 .
enlaces externos
- Wilkinson L, friendly M . "La historia del mapa de calor del clúster" (PDF) .
- Albergotti R (7 de mayo de 2014). "Strava, popular entre ciclistas y corredores, quiere vender sus datos a urbanistas" . El Wall Street Journal .