En matemáticas aplicadas , el análisis de datos topológicos ( TDA ) es un enfoque para el análisis de conjuntos de datos utilizando técnicas de topología . La extracción de información de conjuntos de datos de gran dimensión, incompletos y ruidosos suele ser un desafío. TDA proporciona un marco general para analizar dichos datos de una manera que es insensible a la métrica particular elegida y proporciona reducción de dimensionalidad y robustez al ruido. Más allá de esto, hereda functoriality , un concepto fundamental de la matemática moderna, desde su naturaleza topológica, lo que le permite adaptarse a las nuevas herramientas matemáticas.
La motivación inicial es estudiar la forma de los datos. TDA ha combinado la topología algebraica y otras herramientas de las matemáticas puras para permitir un estudio matemáticamente riguroso de la "forma". La herramienta principal es la homología persistente , una adaptación de la homología a los datos de la nube de puntos . Se ha aplicado una homología persistente a muchos tipos de datos en muchos campos. Además, su base matemática también es de importancia teórica. Las características únicas de TDA lo convierten en un puente prometedor entre topología y geometría.
Teoría básica
Intuición
La premisa subyacente a la TDA es que la forma importa. Los datos reales en dimensiones altas son casi siempre escasos y tienden a tener características relevantes de dimensiones bajas. Una de las tareas de TDA es proporcionar una caracterización precisa de este hecho. Un ejemplo ilustrativo es un sistema simple depredador-presa gobernado por las ecuaciones de Lotka-Volterra . [1] Se puede observar fácilmente que la trayectoria del sistema forma un círculo cerrado en el espacio de estados. TDA proporciona herramientas para detectar y cuantificar dicho movimiento recurrente. [2]
Muchos algoritmos para el análisis de datos, incluidos los utilizados en TDA, requieren la elección de varios parámetros. Sin un conocimiento previo del dominio, es difícil elegir la recopilación correcta de parámetros para un conjunto de datos. La principal idea de la homología persistente es que podemos utilizar la información obtenida de todos los valores de un parámetro. Por supuesto, esta idea por sí sola es fácil de hacer; lo difícil es codificar esta enorme cantidad de información en una forma comprensible y fácil de representar. Con TDA, hay una interpretación matemática cuando la información es un grupo de homología. En general, se asume que las características que persisten para una amplia gama de parámetros son características "verdaderas". Se presume que las características que persisten solo para un rango estrecho de parámetros son ruido, aunque la justificación teórica de esto no está clara. [3]
Historia temprana
Los precursores del concepto completo de homología persistente aparecieron gradualmente con el tiempo. [4] En 1990, Patrizio Frosini introdujo la función de tamaño, que es equivalente a la 0ª homología persistente. [5] Casi una década después, Vanessa Robins estudió las imágenes de homomorfismos inducidos por la inclusión. [6] Finalmente, poco después, Edelsbrunner et al. introdujo el concepto de homología persistente junto con un algoritmo eficiente y su visualización como un diagrama de persistencia. [7] Carlsson y col. reformuló la definición inicial y dio un método de visualización equivalente llamado códigos de barras de persistencia, [8] interpretando la persistencia en el lenguaje del álgebra conmutativa. [9]
En topología algebraica, la homología persistente ha surgido a través del trabajo de Sergey Barannikov sobre la teoría Morse. El conjunto de valores críticos de la función Morse suave se particionó canónicamente en pares "nacimiento-muerte", se clasificaron los complejos filtrados, sus invariantes, equivalentes al diagrama de persistencia y los códigos de barras de persistencia, junto con el algoritmo eficiente para su cálculo, se describieron bajo el nombre de formas canónicas en 1994 por Barannikov. [10] [11]
Conceptos
A continuación se presentan algunos conceptos ampliamente utilizados. Tenga en cuenta que algunas definiciones pueden variar de un autor a otro.
Una nube de puntos se define a menudo como un conjunto finito de puntos en algún espacio euclidiano, pero puede tomarse como cualquier espacio métrico finito.
El complejo de Čech de una nube de puntos es el nervio de la cubierta de bolas de un radio fijo alrededor de cada punto de la nube.
Un módulo de persistencia indexado por es un espacio vectorial para cada y un mapa lineal cuando sea , tal que para todos y cuando sea [12] Una definición equivalente es un funtor de considerado como un conjunto parcialmente ordenado a la categoría de espacios vectoriales.
El grupo de homología persistente de una nube de puntos es el módulo de persistencia definido como , dónde es el complejo de radio de Čech de la nube de puntos y es el grupo de homología.
Un código de barras de persistencia es un conjunto múltiple de intervalos en, y un diagrama de persistencia es un conjunto múltiple de puntos en().
La distancia de Wasserstein entre dos diagramas de persistencia y Se define como
La distancia del cuello de botella entre y es
Propiedad básica
Teorema de estructura
El primer teorema de clasificación para la homología persistente apareció en 1994 [10] a través de las formas canónicas de Barannikov. El teorema de clasificación que interpreta la persistencia en el lenguaje del álgebra conmutativa apareció en 2005: [9] para un módulo de persistencia generado finitamente con campo coeficientes,
La homología persistente se visualiza mediante un código de barras o un diagrama de persistencia. El código de barras tiene su raíz en matemáticas abstractas. Es decir, la categoría de complejos filtrados finitos sobre un campo es semi-simple. Cualquier complejo filtrado es isomorfo a su forma canónica, una suma directa de complejos filtrados simples unidimensionales y bidimensionales.
Estabilidad
La estabilidad es deseable porque proporciona robustez frente al ruido. Si es cualquier espacio que es homeomorfo a un complejo simplicial, y son funciones continuas domesticadas [14] , entonces los espacios vectoriales de persistencia y están finamente presentados, y , dónde se refiere a la distancia del cuello de botella [15] y es el mapa que toma una función domesticada continua al diagrama de persistencia de su -ésima homología.
Flujo de trabajo
El flujo de trabajo básico en TDA es: [16]
punto de nube | complejos anidados | módulo de persistencia | código de barras o diagrama |
- Si es una nube de puntos, reemplace con una familia anidada de complejos simpliciales (como el complejo Čech o Vietoris-Rips). Este proceso convierte la nube de puntos en una filtración de complejos simpliciales. Tomando la homología de cada complejo en esta filtración se obtiene un módulo de persistencia
- Aplicar el teorema de la estructura para proporcionar una versión parametrizada del número de Betti , diagrama de persistencia o, equivalentemente, código de barras.
Gráficamente hablando,
Cálculo
El primer algoritmo sobre todos los campos para la homología persistente en la configuración de topología algebraica fue descrito por Barannikov [10] mediante la reducción a la forma canónica mediante matrices triangulares superiores. El primer algoritmo de homología persistente sobrefue proporcionado por Edelsbrunner et al. [7] Zomorodian y Carlsson dieron el primer algoritmo práctico para calcular la homología persistente en todos los campos. [9] El libro de Edelsbrunner y Harer ofrece una guía general sobre topología computacional. [18]
Un problema que surge en la computación es la elección del complejo. El complejo Čech y el complejo Vietoris – Rips son más naturales a primera vista; sin embargo, su tamaño crece rápidamente con el número de puntos de datos. Se prefiere el complejo Vietoris-Rips sobre el complejo Čech porque su definición es más simple y el complejo Čech requiere un esfuerzo adicional para definirlo en un espacio métrico finito general. Se han estudiado formas eficientes de reducir el costo computacional de la homología. Por ejemplo, el complejo α y el complejo testigo se utilizan para reducir la dimensión y el tamaño de los complejos. [19]
Recientemente, la teoría de Morse discreta se ha mostrado prometedora para la homología computacional porque puede reducir un complejo simplicial dado a un complejo celular mucho más pequeño que es homotópico al original. [20] De hecho, esta reducción se puede realizar a medida que se construye el complejo mediante el uso de la teoría matroide , lo que conduce a mayores aumentos de rendimiento. [21] Otro algoritmo reciente ahorra tiempo al ignorar las clases de homología con baja persistencia. [22]
Hay varios paquetes de software disponibles, como javaPlex , Dionysus , Perseus , PHAT , DIPHA , GUDHI , Ripser y TDAstats . Otter et al. [23] Giotto-tda es un paquete de Python dedicado a integrar TDA en el flujo de trabajo de aprendizaje automático mediante una API scikit-learn . Un paquete R TDA es capaz de calcular conceptos recientemente inventados como paisaje y el estimador de distancia del núcleo. [24] El Kit de herramientas de topología está especializado para datos continuos definidos en variedades de baja dimensión (1, 2 o 3), como se encuentra típicamente en la visualización científica . Otro paquete de R, TDAstats , implementa la rápida biblioteca C ++ Ripser para calcular la homología persistente. [25] También utiliza el ubicuo paquete ggplot2 para generar visualizaciones reproducibles, personalizables y con calidad de publicación de homología persistente, específicamente códigos de barras topológicos y diagramas de persistencia. El código de muestra a continuación ofrece un ejemplo de cómo se puede utilizar el lenguaje de programación R para calcular la homología persistente.
# instalar el paquete desde CRAN y cargar conjuntos de datos install.packages ( "TDAstats" ) biblioteca ( "TDAstats" ) datos ( "unif2d" ) datos ( "circle2d" )# calcular la homología persistente para ambos conjuntos de datos unif.phom <- calculate_homology ( unif2d ) circ.phom <- calculate_homology ( circle2d )# trazar la nube de puntos uniformemente distribuida como diagrama de persistencia plot_persist ( unif.phom )# trazar la nube de puntos del círculo como código de barras topológico # vemos una sola barra persistente, como se esperaba para un círculo (1 ciclo / bucle único ) plot_barcode ( circ.phom )
Visualización
Los datos de alta dimensión son imposibles de visualizar directamente. Se han inventado muchos métodos para extraer una estructura de baja dimensión del conjunto de datos, como el análisis de componentes principales y el escalado multidimensional . [26] Sin embargo, es importante señalar que el problema en sí está mal planteado, ya que se pueden encontrar muchas características topológicas diferentes en el mismo conjunto de datos. Por tanto, el estudio de la visualización de espacios de alta dimensión es de importancia central para TDA, aunque no implica necesariamente el uso de homología persistente. Sin embargo, se han realizado intentos recientes para utilizar homología persistente en la visualización de datos. [27]
Carlsson y col. han propuesto un método general llamado MAPPER . [28] Hereda la idea de Serre de que una cubierta conserva la homotopía. [29] Una formulación generalizada de MAPPER es la siguiente:
Dejar y ser espacios topológicos y dejar ser un mapa continuo. Dejar ser una cubierta abierta finita de . La salida de MAPPER es el nervio de la cubierta de retroceso, donde cada preimagen se divide en sus componentes conectados. [27] Este es un concepto muy general, del cual el gráfico Reeb [30] y los árboles de fusión son casos especiales.
Esta no es la definición original. [28] Carlsson y col. escoger ser - estar o y cúbralo con conjuntos abiertos de modo que como máximo dos se crucen. [3] Esta restricción significa que la salida tiene la forma de una red compleja . Debido a que la topología de una nube de puntos finita es trivial, los métodos de agrupamiento (como el enlace único ) se utilizan para producir el análogo de conjuntos conectados en la preimagen. cuando MAPPER se aplica a datos reales.
Matemáticamente hablando, MAPPER es una variación del gráfico Reeb . Si el es como mucho unidimensional, entonces para cada ,
Se pueden encontrar tres aplicaciones exitosas de MAPPER en Carlsson et al. [33] Un comentario de J. Curry sobre las aplicaciones en este artículo es que "una característica común de interés en las aplicaciones es la presencia de llamaradas o zarcillos". [34]
Una implementación gratuita de MAPPER está disponible en línea escrita por Daniel Müllner y Aravindakshan Babu. MAPPER también forma la base de la plataforma de inteligencia artificial de Ayasdi .
Persistencia multidimensional
La persistencia multidimensional es importante para TDA. El concepto surge tanto en la teoría como en la práctica. La primera investigación de la persistencia multidimensional se realizó en las primeras etapas del desarrollo de la ADT [35] . Carlsson-Zomorodian introdujo la teoría de la persistencia multidimensional en [36] y en colaboración con Singh [37] introdujo el uso de herramientas del álgebra simbólica (métodos de base de Grobner) para calcular módulos MPH. Su definición presenta persistencia multidimensional con n parámetros como un módulo graduado Z ^ n sobre un anillo polinomial en n variables. Se aplican herramientas del álgebra conmutativa y homológica al estudio de la persistencia multidimensional en el trabajo de Harrington-Otter-Schenck-Tillman. [38] La primera aplicación que aparece en la literatura es un método para comparar formas, similar a la invención de TDA. [39]
La definición de un módulo de persistencia n- dimensional enes [34]
- espacio vectorial se asigna a cada punto en
- mapa se asigna si (
- los mapas satisfacen para todos
Vale la pena señalar que existen controversias sobre la definición de persistencia multidimensional. [34]
Una de las ventajas de la persistencia unidimensional es su representabilidad mediante un diagrama o código de barras. Sin embargo, no existen invariantes completos discretos de módulos de persistencia multidimensionales. [40] La razón principal de esto es que la estructura de la colección de indecomponibles es extremadamente complicada por el teorema de Gabriel en la teoría de las representaciones de carcaj, [41] aunque un módulo de persistencia finitamente n-tenue puede descomponerse únicamente en una suma directa de indecomponibles debido al teorema de Krull-Schmidt. [42]
No obstante, se han establecido muchos resultados. Carlsson y Zomorodian introdujeron la invariante de rango , definido como el , en el cual es un módulo de grado n generado de forma finita. En una dimensión, es equivalente al código de barras. En la literatura, el invariante de rango a menudo se conoce como números de Betti persistentes (PBN). [18] En muchos trabajos teóricos, los autores han utilizado una definición más restringida, un análogo de la persistencia del conjunto de subniveles. Específicamente, la persistencia de números Betti de una función están dados por la función , tomando cada uno a , dónde y .
Algunas propiedades básicas incluyen la monotonicidad y el salto diagonal. [43] Los números de Betti persistentes serán finitos si es un subespacio compacto y localmente contractible de . [44]
Usando un método de foliación, las PBN k-dim se pueden descomponer en una familia de PBN 1-dim por deducción de dimensionalidad. [45] Este método también ha dado lugar a una prueba de que las PBN de varios niveles de intensidad son estables. [46] Las discontinuidades de PBN solo ocurren en puntos donde ya sea es un punto discontinuo de o es un punto discontinuo de bajo el supuesto de que y es un espacio topológico compacto y triangulable. [47]
El espacio persistente, una generalización del diagrama persistente, se define como el conjunto múltiple de todos los puntos con multiplicidad mayor que 0 y la diagonal. [48] Proporciona una representación estable y completa de PBN. Un trabajo en curso de Carlsson et al. está tratando de dar una interpretación geométrica de la homología persistente, lo que podría proporcionar información sobre cómo combinar la teoría del aprendizaje automático con el análisis de datos topológicos. [49]
El primer algoritmo práctico para calcular la persistencia multidimensional se inventó muy pronto. [50] Después de eso, se han propuesto muchos otros algoritmos, basados en conceptos como la teoría morse discreta [51] y la estimación de muestras finitas. [52]
Otras persistencias
El paradigma estándar en TDA a menudo se denomina persistencia de subnivel . Aparte de la persistencia multidimensional, se han realizado muchos trabajos para ampliar este caso especial.
Persistencia en zigzag
Los mapas distintos de cero en el módulo de persistencia están restringidos por la relación de preorden en la categoría. Sin embargo, los matemáticos han descubierto que la unanimidad de dirección no es esencial para muchos resultados. "El punto filosófico es que la teoría de la descomposición de las representaciones gráficas es algo independiente de la orientación de los bordes del gráfico". [53] La persistencia en zigzag es importante desde el punto de vista teórico. Todos los ejemplos dados en el artículo de revisión de Carlsson para ilustrar la importancia de la funcionalidad comparten algunas de sus características. [3]
Persistencia extendida y persistencia de niveles
Algunos intentos es perder la restricción más estricta de la función. [54] Para obtener más información, consulte las secciones Categorización y cosheaves e Impacto en las matemáticas .
Es natural extender la homología de persistencia a otros conceptos básicos en topología algebraica, como cohomología y homología / cohomología relativa. [55] Una aplicación interesante es el cálculo de coordenadas circulares para un conjunto de datos a través del primer grupo de cohomología persistente. [56]
Persistencia circular
La homología de persistencia normal estudia funciones de valor real. El mapa con valores circulares podría ser útil, "la teoría de persistencia para mapas con valores circulares promete desempeñar el papel para algunos campos vectoriales al igual que la teoría de persistencia estándar para campos escalares", como se comentó en D. Burghelea et al. [57] La principal diferencia es que las celdas de Jordan (muy similares en formato a los bloques de Jordan en álgebra lineal) no son triviales en funciones con valores circulares, que serían cero en el caso de valores reales, y la combinación con códigos de barras da las invariantes de un mapa domesticado, en condiciones moderadas. [57]
Dos técnicas que utilizan son la teoría de Morse-Novikov [58] y la teoría de representación gráfica. [59] Se pueden encontrar resultados más recientes en D. Burghelea et al. [60] Por ejemplo, el requisito de mansedumbre puede reemplazarse por la condición mucho más débil, continua.
Persistencia con torsión
La prueba del teorema de la estructura se basa en que el dominio base es el campo, por lo que no se han realizado muchos intentos de homología de persistencia con torsión. Frosini definió una pseudometría en este módulo específico y demostró su estabilidad. [61] Una de sus novedades es que no depende de alguna teoría de clasificación para definir la métrica. [62]
Categorización y cosheaves
Una ventaja de la teoría de categorías es su capacidad para elevar resultados concretos a un nivel superior, mostrando relaciones entre objetos aparentemente inconexos. Bubenik y col. [63] ofrece una breve introducción de la teoría de categorías ajustada para TDA.
La teoría de categorías es el lenguaje del álgebra moderna y se ha utilizado ampliamente en el estudio de la topología y la geometría algebraica. Se ha señalado que "la observación clave de [9] es que el diagrama de persistencia producido por [7] depende sólo de la estructura algebraica que lleva este diagrama". [64] El uso de la teoría de categorías en TDA ha demostrado ser fructífero. [63] [64]
Siguiendo las anotaciones hechas en Bubenik et al., [64] la categoría de indexación es cualquier conjunto preordenado (no necesariamente o ), la categoría objetivo es cualquier categoría (en lugar de la comúnmente utilizada ) y functores se denominan módulos de persistencia generalizada en, encima .
Una ventaja de utilizar la teoría de categorías en TDA es una comprensión más clara de los conceptos y el descubrimiento de nuevas relaciones entre las pruebas. Tome dos ejemplos como ilustración. La comprensión de la correspondencia entre el entrelazado y el emparejamiento es de gran importancia, ya que el emparejamiento ha sido el método utilizado al principio (modificado de la teoría Morse). Un resumen de los trabajos se puede encontrar en Vin de Silva et al. [65] Muchos teoremas pueden demostrarse mucho más fácilmente en un entorno más intuitivo. [62] Otro ejemplo es la relación entre la construcción de diferentes complejos a partir de nubes de puntos. Desde hace tiempo se ha notado que los complejos Čech y Vietoris-Rips están relacionados. Específicamente,. [66] La relación esencial entre los complejos de Cech y Rips se puede ver mucho más claramente en un lenguaje categórico. [sesenta y cinco]
El lenguaje de la teoría de categorías también ayuda a proyectar resultados en términos reconocibles para la comunidad matemática en general. La distancia de cuello de botella se usa ampliamente en TDA debido a los resultados sobre la estabilidad con respecto a la distancia de cuello de botella. [12] [15] De hecho, la distancia de entrelazado es el objeto terminal en una categoría poset de métricas estables en módulos de persistencia multidimensionales en un campo principal . [62] [67]
Las gavillas , un concepto central en la geometría algebraica moderna , están intrínsecamente relacionadas con la teoría de categorías. En términos generales, las gavillas son la herramienta matemática para comprender cómo la información local determina la información global. Justin Curry considera la persistencia del conjunto de niveles como el estudio de fibras de funciones continuas. Los objetos que estudia son muy similares a los de MAPPER, pero con la teoría de la gavilla como fundamento teórico. [34] Aunque ningún avance en la teoría de TDA ha utilizado todavía la teoría de la gavilla, es prometedora ya que hay muchos teoremas hermosos en geometría algebraica relacionados con la teoría de la gavilla. Por ejemplo, una pregunta teórica natural es si diferentes métodos de filtración dan como resultado el mismo resultado. [68]
Estabilidad
La estabilidad es de vital importancia para el análisis de datos, ya que los datos reales transportan ruidos. Mediante el uso de la teoría de categorías, Bubenik et al. han distinguido entre teoremas de estabilidad blandos y duros, y han demostrado que los casos blandos son formales. [64] Específicamente, el flujo de trabajo general de TDA es
datos | módulo de persistencia topológica | módulo de persistencia algebraica | invariante discreto |
El teorema de estabilidad blanda afirma que es Lipschitz continuo , y el teorema de estabilidad dura afirma que es Lipschitz continuo.
La distancia de cuello de botella se usa ampliamente en TDA. El teorema de isometría afirma que la distancia de entrelazado es igual a la distancia del cuello de botella. [62] Bubenik y col. han abstraído la definición a la entre functores Cuándo Está dotado de una proyección sublineal o superlineal familiar, en la que aún permanece una pseudométrica. [64] Teniendo en cuenta los magníficos personajes de distancia entrelazado, [69] Aquí presentamos la definición general de intercalado de distancia (en lugar de la primera introducida): [12] Let (una función de a que es monótono y satisface para todos ). A-el entrelazado entre F y G consiste en transformaciones naturales y , tal que y .
Los dos resultados principales son [64]
- Dejar ser un conjunto preordenado con una proyección sublineal o una familia superlineal. Dejar ser un functor entre categorías arbitrarias . Luego, para dos functores cualesquiera, tenemos .
- Dejar ser un poset de un espacio métrico , ser un espacio topológico. Y deja (no necesariamente continuas) ser funciones, y para ser el diagrama de persistencia correspondiente. Luego.
Estos dos resultados resumen muchos resultados sobre la estabilidad de diferentes modelos de persistencia.
Para conocer el teorema de estabilidad de la persistencia multidimensional, consulte la subsección de persistencia.
Teorema de estructura
El teorema de la estructura es de vital importancia para TDA; como comenta G. Carlsson, "lo que hace que la homología sea útil como discriminador entre espacios topológicos es el hecho de que existe un teorema de clasificación para grupos abelianos generados finitamente". [3] (ver el teorema fundamental de los grupos abelianos generados finitamente ).
El principal argumento utilizado en la demostración del teorema de la estructura original es el teorema de la estructura estándar para módulos generados finitamente sobre un dominio ideal principal . [9] Sin embargo, este argumento falla si el conjunto de indexación es. [3]
En general, no todos los módulos de persistencia se pueden descomponer en intervalos. [70] Se han realizado muchos intentos para relajar las restricciones del teorema de la estructura original. [ aclaración necesaria ] El caso de los módulos de persistencia puntuales de dimensión finita indexados por un subconjunto localmente finito dese resuelve en base al trabajo de Webb. [71] El resultado más notable es el de Crawley-Boevey, que resolvió el caso de. El teorema de Crawley-Boevey establece que cualquier módulo de persistencia de dimensión finita puntual es una suma directa de módulos de intervalo. [72]
Para comprender la definición de su teorema, es necesario introducir algunos conceptos. Un intervalo en se define como un subconjunto teniendo la propiedad que si y si hay un tal que , luego también. Un módulo de intervalo asigna a cada elemento el espacio vectorial y asigna el espacio vectorial cero a elementos en . Todos los mapas son el mapa cero, a menos que y , en ese caso es el mapa de identidad. [34] Los módulos de intervalo son independientes. [73]
Aunque el resultado de Crawley-Boevey es un teorema muy poderoso, todavía no se extiende al caso q-tame. [70] Un módulo de persistencia es q-tame si el rango de es finito para todos . Hay ejemplos de módulos de persistencia q-tame que no logran ser finitos puntuales. [74] Sin embargo, resulta que un teorema de estructura similar todavía se mantiene si se eliminan las características que existen solo en un valor de índice. [73] Esto es así porque las partes dimensionales infinitas en cada valor de índice no persisten, debido a la condición de rango finito. [75] Formalmente, la categoría observable Se define como , en el cual denota la subcategoría completa de cuyos objetos son los módulos efímeros ( cuando sea ). [73]
Tenga en cuenta que los resultados extendidos enumerados aquí no se aplican a la persistencia en zigzag, ya que el análogo de un módulo de persistencia en zigzag sobre no es inmediatamente obvio.
Estadísticas
Los datos reales son siempre finitos, por lo que su estudio requiere que tengamos en cuenta la estocasticidad. El análisis estadístico nos brinda la capacidad de separar las características reales de los datos de los artefactos introducidos por el ruido aleatorio. La homología persistente no tiene un mecanismo inherente para distinguir entre características de baja probabilidad y características de alta probabilidad.
Una forma de aplicar estadísticas al análisis de datos topológicos es estudiar las propiedades estadísticas de las características topológicas de las nubes de puntos. El estudio de complejos simpliciales aleatorios ofrece una idea de la topología estadística. K. Turner y col. [76] ofrece un resumen del trabajo en este sentido.
Una segunda forma es estudiar las distribuciones de probabilidad en el espacio de persistencia. El espacio de persistencia es , dónde es el espacio de todos los códigos de barras que contienen exactamente intervalos y las equivalencias son Si . [77] Este espacio es bastante complicado; por ejemplo, no está completo en la métrica de cuello de botella. El primer intento de estudiarlo es por Y. Mileyko et al. [78] El espacio de los diagramas de persistencia en su artículo se define como
Una tercera forma es considerar directamente la cohomología del espacio probabilístico o sistemas estadísticos, llamados estructuras de información y que consisten básicamente en la triple (), espacio muestral, variables aleatorias y leyes de probabilidad. [82] [83] Las variables aleatorias se consideran particiones de las n probabilidades atómicas (vistas como una probabilidad (n-1) -simplex,) en la celosía de particiones (). Las variables aleatorias o módulos de funciones medibles proporcionan los complejos de cocadena, mientras que la co-frontera se considera como el álgebra homológica general descubierta por primera vez por Hochschild con una acción izquierda que implementa la acción de condicionamiento. La primera condición de ciclo corresponde a la regla de la cadena de la entropía, lo que permite derivar únicamente hasta la constante multiplicativa, la entropía de Shannon como primera clase de cohomología. La consideración de una acción de izquierda deformada generaliza el marco a las entropías de Tsallis. La cohomología de la información es un ejemplo de topos anillados. Multivariante k- La información mutua aparece en expresiones de co-límites, y su desaparición, relacionada con la condición del ciclo, da condiciones equivalentes para la independencia estadística. [84] Los mínimos de información mutua, también llamados sinergias, dan lugar a interesantes configuraciones de independencia análogas a los enlaces homotópicos. Debido a su complejidad combinatoria, solo se ha investigado sobre los datos el subcaso simple de la cohomología y de la estructura de la información. Aplicadas a los datos, esas herramientas cohomológicas cuantifican las dependencias e independientes estadísticas, incluidas las cadenas de Markov y la independencia condicional , en el caso multivariado. [85] En particular, la información mutua generaliza el coeficiente de correlación y la covarianza a dependencias estadísticas no lineales. Estos enfoques se desarrollaron de forma independiente y solo indirectamente relacionados con los métodos de persistencia, pero pueden entenderse aproximadamente en el caso simple utilizando el teorema de Hu Kuo Tin, que establece una correspondencia uno a uno entre las funciones de información mutua y la función medible finita de un conjunto con el operador de intersección. , para construir el esqueleto complejo Čech . La cohomología de la información ofrece alguna interpretación y aplicación directa en términos de neurociencia (teoría del ensamblaje neuronal y cognición cualitativa [86] ), física estadística y red neuronal profunda para la cual la estructura y el algoritmo de aprendizaje son impuestos por el complejo de variables aleatorias y la cadena de información. regla. [87]
Los paisajes de persistencia, presentados por Peter Bubenik, son una forma diferente de representar códigos de barras, más susceptible al análisis estadístico. [88] El panorama de persistencia de un módulo persistente se define como una función , , dónde denota la línea real extendida y. El espacio de los paisajes de persistencia es muy agradable: hereda todas las buenas propiedades de la representación del código de barras (estabilidad, fácil representación, etc.), pero las cantidades estadísticas se pueden definir fácilmente, y algunos problemas en el trabajo de Y. Mileyko et al., Como como la no unicidad de las expectativas, [78] puede superarse. Se encuentran disponibles algoritmos efectivos para el cálculo con paisajes de persistencia. [89] Otro enfoque es utilizar la persistencia revisada, que es la persistencia de imagen, kernel y cokernel. [90]
Aplicaciones
Clasificación de aplicaciones
Existe más de una forma de clasificar las aplicaciones de TDA. Quizás la forma más natural sea por campo. Una lista muy incompleta de aplicaciones exitosas incluye [91] esqueletización de datos, [92] estudio de formas, [93] reconstrucción de gráficos, [94] [95] [96] [97] [98] análisis de imágenes, [99] [100] material, [101] análisis de progresión de la enfermedad, [102] [103] red de sensores, [66] análisis de señales, [104] red cósmica, [105] red compleja, [106] [107] [108] [109] fractal geometría, [110] evolución viral, [111] propagación de contagios en redes, [112] clasificación de bacterias mediante espectroscopia molecular, [113] imagen hiperespectral en fisicoquímica [114] y teledetección. [115]
Otra forma es distinguir las técnicas de G. Carlsson, [77]
uno es el estudio de invariantes homológicos de datos, uno de conjuntos de datos individuales, y el otro es el uso de invariantes homológicos en el estudio de bases de datos donde los puntos de datos en sí mismos tienen estructura geométrica.
Características de TDA en aplicaciones
Hay varias características interesantes notables de las aplicaciones recientes de TDA:
- Combinar herramientas de varias ramas de las matemáticas . Además de la obvia necesidad de álgebra y topología, las ecuaciones diferenciales parciales, [116] geometría algebraica, [40] teoría de la representación, [53] estadística, combinatoria y geometría de Riemann [75] han encontrado uso en TDA.
- Análisis cuantitativo . Se considera que la topología es muy suave ya que muchos conceptos son invariantes bajo homotopía. Sin embargo, la topología persistente es capaz de registrar el nacimiento (aparición) y la muerte (desaparición) de las características topológicas, por lo que se incorpora información geométrica adicional. Una evidencia en teoría es un resultado parcialmente positivo sobre la singularidad de la reconstrucción de curvas; [117] dos de las aplicaciones se refieren al análisis cuantitativo de la estabilidad del fullereno y al análisis cuantitativo de la auto-semejanza , por separado. [110] [118]
- El papel de la corta persistencia . También se ha encontrado que la persistencia corta es útil, a pesar de la creencia común de que el ruido es la causa de los fenómenos. [119] Esto es interesante para la teoría matemática.
Uno de los principales campos del análisis de datos en la actualidad es el aprendizaje automático . Algunos ejemplos de aprendizaje automático en TDA se pueden encontrar en Adcock et al. [120] Una conferencia está dedicada al vínculo entre TDA y aprendizaje automático. Para aplicar herramientas de aprendizaje automático, la información obtenida de TDA debe representarse en forma vectorial. Un intento continuo y prometedor es el panorama de la persistencia discutido anteriormente. Otro intento utiliza el concepto de imágenes de persistencia. [121] Sin embargo, un problema de este método es la pérdida de estabilidad, ya que el teorema de estabilidad dura depende de la representación del código de barras.
Impacto en las matemáticas
El análisis de datos topológicos y la homología persistente han tenido impactos en la teoría de Morse . La teoría de Morse ha jugado un papel muy importante en la teoría de TDA, incluso en la computación. Algunos trabajos en homología persistente han ampliado los resultados sobre las funciones de Morse para domesticar funciones o, incluso, para funciones continuas. Un resultado olvidado de R. Deheuvels mucho antes de la invención de la homología persistente extiende la teoría de Morse a todas las funciones continuas. [122]
Un resultado reciente es que la categoría de gráficos Reeb es equivalente a una clase particular de coheaf. [123] Esto está motivado por el trabajo teórico en TDA, ya que el gráfico Reeb está relacionado con la teoría Morse y MAPPER se deriva de ella. La prueba de este teorema se basa en la distancia de entrelazado.
La homología persistente está estrechamente relacionada con las secuencias espectrales . [124] [125] En particular, el algoritmo que lleva un complejo filtrado a su forma canónica [10] permite un cálculo de secuencias espectrales mucho más rápido que el procedimiento estándar de cálculogrupos página por página. La persistencia en zigzag puede resultar de importancia teórica para las secuencias espectrales.
Ver también
- Reducción de dimensionalidad
- Procesamiento de datos
- Visión por computador
- Topología computacional
- Teoría de Morse discreta
- Análisis de formas (geometría digital)
- Teoría del tamaño
- Topología algebraica
Referencias
- ^ Epstein, Charles ; Carlsson, Gunnar ; Edelsbrunner, Herbert (1 de diciembre de 2011 ). "Análisis de datos topológicos". Problemas inversos . 27 (12): 120201. arXiv : 1609.08227 . Código Bibliográfico : 2011InvPr..27a0101E . doi : 10.1088 / 0266-5611 / 27/12/120201 .
- ^ "diva-portal.org/smash/record.jsf?pid=diva2%253A575329&dswid=4297" . www.diva-portal.org . Archivado desde el original el 19 de noviembre de 2015 . Consultado el 5 de noviembre de 2015 .
- ^ a b c d e Carlsson, Gunnar (1 de enero de 2009). "Topología y datos" . Boletín de la American Mathematical Society . 46 (2): 255–308. doi : 10.1090 / S0273-0979-09-01249-X . ISSN 0273-0979 .
- ^ Edelsbrunner H. Homología persistente: teoría y práctica [J]. 2014.
- ^ Frosini, Patrizio (1 de diciembre de 1990). "Una distancia para clases de similitud de subvariedades de un espacio euclidiano" . Boletín de la Sociedad Matemática Australiana . 42 (3): 407–415. doi : 10.1017 / S0004972700028574 . ISSN 1755-1633 .
- ^ Robins V . Hacia el cálculo de la homología a partir de aproximaciones finitas [C] // Procedimientos de topología. 1999, 24 (1): 503-532.
- ^ a b c Edelsbrunner; Letscher; Zomorodian (1 de noviembre de 2002). "Simplificación y persistencia topológica" . Geometría discreta y computacional . 28 (4): 511–533. doi : 10.1007 / s00454-002-2885-2 . ISSN 0179-5376 .
- ^ Carlsson, Gunnar; Zomorodian, Afra; Collins, Anne; Guibas, Leonidas J. (1 de diciembre de 2005). "Códigos de barras de persistencia para formas". Revista Internacional de Modelado de Formas . 11 (2): 149–187. CiteSeerX 10.1.1.5.2718 . doi : 10.1142 / S0218654305000761 . ISSN 0218-6543 .
- ^ a b c d e Zomorodian, Afra; Carlsson, Gunnar (19 de noviembre de 2004). "Computación de homología persistente" . Geometría discreta y computacional . 33 (2): 249–274. doi : 10.1007 / s00454-004-1146-y . ISSN 0179-5376 .
- ^ a b c d e Barannikov, Sergey (1994). "Complejo Morse enmarcado y sus invariantes" . Avances en las matemáticas soviéticas . 21 : 93-115.
- ^ "Coloquio del Departamento de Matemáticas de UC Berkeley: homología persistente y aplicaciones de PDE a topología simpléctica" . events.berkeley.edu . Consultado el 27 de marzo de 2021 .
- ^ a b c Chazal, Frédéric; Cohen-Steiner, David; Glisse, Marc; Guibas, Leonidas J .; Oudot, Steve Y. (1 de enero de 2009). Proximidad de módulos de persistencia y sus diagramas . Actas del vigésimo quinto simposio anual sobre geometría computacional . SCG '09. Nueva York, NY, EE.UU .: ACM. págs. 237–246. CiteSeerX 10.1.1.473.2112 . doi : 10.1145 / 1542362.1542407 . ISBN 978-1-60558-501-7. S2CID 840484 .
- ^ Munch E. Aplicaciones de la homología persistente a sistemas que varían en el tiempo [D]. Universidad de Duke, 2013.
- ^ Shikhman, Vladimir (2011). Aspectos topológicos de la optimización no suave . Springer Science & Business Media. págs. 169-170. ISBN 9781461418979. Consultado el 22 de noviembre de 2017 .
- ^ a b Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John (12 de diciembre de 2006). "Diagramas de estabilidad de persistencia" . Geometría discreta y computacional . 37 (1): 103–120. doi : 10.1007 / s00454-006-1276-5 . ISSN 0179-5376 .
- ^ Ghrist, Robert (1 de enero de 2008). "Códigos de barras: la topología persistente de datos" . Boletín de la American Mathematical Society . 45 (1): 61–75. doi : 10.1090 / S0273-0979-07-01191-3 . ISSN 0273-0979 .
- ^ Chazal, Frédéric; Glisse, Marc; Labruère, Catherine; Michel, Bertrand (27 de mayo de 2013). "Índices óptimos de convergencia para diagramas de persistencia en análisis de datos topológicos". arXiv : 1305.6239 [ math.ST ].
- ^ a b Edelsbrunner, Herbert; Harer, John (1 de enero de 2010). Topología computacional: una introducción . American Mathematical Soc. ISBN 9780821849255.
- ^ De Silva, Vin; Carlsson, Gunnar (1 de enero de 2004). Estimación topológica mediante complejos de testigos . Actas de la primera conferencia Eurographics sobre gráficos basados en puntos . SPBG'04. Aire-la-Ville, Suiza, Suiza: Asociación Eurográfica. págs. 157-166. doi : 10.2312 / SPBG / SPBG04 / 157-166 . ISBN 978-3-905673-09-8.
- ^ Mischaikow, Konstantin; Nanda, Vidit (27 de julio de 2013). "Teoría Morse para filtraciones y cálculo eficiente de homología persistente" . Geometría discreta y computacional . 50 (2): 330–353. doi : 10.1007 / s00454-013-9529-6 . ISSN 0179-5376 .
- ^ Henselman, Gregory; Ghrist, Robert (1 de junio de 2016). "Filtraciones matroides y homología persistente computacional". arXiv : 1606.00199 . Código bibliográfico : 2016arXiv160600199H . Cite journal requiere
|journal=
( ayuda ) - ^ Chen, Chao; Kerber, Michael (1 de mayo de 2013). "Un algoritmo sensible a la salida para la homología persistente" . Geometría computacional . 27º Simposio Anual de Geometría Computacional (SoCG 2011). 46 (4): 435–447. doi : 10.1016 / j.comgeo.2012.02.010 .
- ^ Nutria, Nina; Porter, Mason A .; Tillmann, Ulrike; Grindrod, Peter; Harrington, Heather A. (29 de junio de 2015). "Una hoja de ruta para el cálculo de la homología persistente" . EPJ Data Science . 6 (1): 17. arXiv : 1506.08903 . Código bibliográfico : 2015arXiv150608903O . doi : 10.1140 / epjds / s13688-017-0109-5 . PMC 6979512 . PMID 32025466 .
- ^ Fasy, Brittany Terese; Kim, Jisu; Lecci, Fabrizio; Maria, Clément (7 de noviembre de 2014). "Introducción al paquete R TDA". arXiv : 1411,1830 [ cs.MS ].
- ^ Wadhwa, Raoul; Williamson, Drew; Dhawan, Andrew; Scott, Jacob (2018). "TDAstats: tubería de R para calcular la homología persistente en el análisis de datos topológicos" . Revista de software de código abierto . 3 (28): 860. Bibcode : 2018JOSS .... 3..860R . doi : 10.21105 / joss.00860 . PMC 7771879 . PMID 33381678 .
- ^ Liu S, Maljovec D, Wang B, et al. Visualización de datos de alta dimensión: avances en la última década [J].
- ^ a b c Dey, Tamal K .; Memoli, Facundo; Wang, Yusu (14 de abril de 2015). "Mapeador de múltiples escalas: un marco para el resumen topológico de datos y mapas". arXiv : 1504.03763 [ cs.CG ].
- ^ a b "Límite de descarga excedido". CiteSeerX 10.1.1.161.8956 . Cite journal requiere
|journal=
( ayuda ) - ^ Bott, Raoul; Tu, Loring W. (17 de abril de 2013). Formas diferenciales en topología algebraica . Springer Science & Business Media. ISBN 978-1-4757-3951-0.
- ^ Pascucci, Valerio; Scorzelli, Giorgio; Bremer, Peer-Timo; Mascarenhas, Ajith (2007). "Cálculo robusto en línea de gráficos Reeb: simplicidad y velocidad" . Transacciones ACM en gráficos . 33 : 58.1–58.9. doi : 10.1145 / 1275808.1276449 .
- ^ Curry, Justin (13 de marzo de 2013). "Gavillas, Cosheaves y Aplicaciones". arXiv : 1303.3255 [ math.AT ].
- ^ Liu, Xu; Xie, Zheng; Yi, Dongyun (1 de enero de 2012). "Un algoritmo rápido para construir estructura topológica en grandes datos" . Homología, Homotopía y Aplicaciones . 14 (1): 221–238. doi : 10.4310 / hha.2012.v14.n1.a11 . ISSN 1532-0073 .
- ^ Lum, PY; Singh, G .; Lehman, A .; Ishkanov, T .; Vejdemo-Johansson, M .; Alagappan, M .; Carlsson, J .; Carlsson, G. (7 de febrero de 2013). "Extracción de conocimientos de la forma de datos complejos mediante topología" . Informes científicos . 3 : 1236. Código Bibliográfico : 2013NatSR ... 3E1236L . doi : 10.1038 / srep01236 . PMC 3566620 . PMID 23393618 .
- ^ a b c d e Curry, Justin (3 de noviembre de 2014). "Análisis de datos topológicos y cosheaves". arXiv : 1411.0613 [ matemáticas.AT ].
- ^ Frosini P, Mulazzani M. Grupos de homotopía de tamaño para el cálculo de distancias de tamaño natural [J]. Boletín de la Sociedad Belga de Matemáticas Simon Stevin, 1999, 6 (3): 455-464.
- ^ Carlsson G, Zomorodian A. La teoría de la persistencia multidimensional, geometría discreta y computacional, 2009, 42 (1): 71-93
- ^ Carlsson G, Singh A, Zomorodian, A. Computación persistencia multidimensional, Journal of Computational Geometry, 2010 1: 72-100.
- ^ Harrington H, Otter N, Schenck H, Tillman U.Homología persistente multiparamétrica estratificada, SIAM Journal on Applied Algebra and Geometry, 2019, (3) 439-471
- ^ Biasotti, S .; Cerri, A .; Frosini, P .; Giorgi, D .; Landi, C. (17 de mayo de 2008). "Funciones de tamaño multidimensional para la comparación de formas". Revista de Visión y Imágenes Matemáticas . 32 (2): 161-179. doi : 10.1007 / s10851-008-0096-z . ISSN 0924-9907 . S2CID 13372132 .
- ^ a b Carlsson, Gunnar; Zomorodian, Afra (24 de abril de 2009). "La teoría de la persistencia multidimensional" . Geometría discreta y computacional . 42 (1): 71–93. doi : 10.1007 / s00454-009-9176-0 . ISSN 0179-5376 .
- ^ Derksen H, Representaciones de Weyman J. Quiver [J]. Avisos de la AMS, 2005, 52 (2): 200-206.
- ^ Atiyah M F. Sobre el teorema de Krull-Schmidt con aplicación a gavillas [J]. Bulletin de la Société Mathématique de France, 1956, 84: 307-317.
- ^ Cerri A, Di Fabio B, Ferri M, et al. La homología persistente multidimensional es estable [J]. arXiv : 0908.0064 , 2009.
- ^ Cagliari, Francesca; Landi, Claudia (1 de abril de 2011). "Finitud de invariantes de rango de grupos de homología persistente multidimensional". Letras de matemáticas aplicadas . 24 (4): 516–518. arXiv : 1001.0358 . doi : 10.1016 / j.aml.2010.11.004 . S2CID 14337220 .
- ^ Cagliari, Francesca; Di Fabio, Barbara; Ferri, Massimo (1 de enero de 2010). "Reducción unidimensional de homología persistente multidimensional". Actas de la American Mathematical Society . 138 (8): 3003–3017. arXiv : matemáticas / 0702713 . doi : 10.1090 / S0002-9939-10-10312-8 . ISSN 0002-9939 . S2CID 18284958 .
- ^ Cerri, Andrea; Fabio, Barbara Di; Ferri, Massimo; Frosini, Patrizio; Landi, Claudia (1 de agosto de 2013). "Los números de Betti en la homología persistente multidimensional son funciones estables" . Métodos matemáticos en las ciencias aplicadas . 36 (12): 1543-1557. Código bibliográfico : 2013MMAS ... 36.1543C . doi : 10.1002 / mma.2704 . ISSN 1099-1476 .
- ^ Cerri, Andrea; Frosini, Patrizio (15 de marzo de 2015). "Condiciones necesarias para discontinuidades de números Betti persistentes multidimensionales". Métodos matemáticos en las ciencias aplicadas . 38 (4): 617–629. Código bibliográfico : 2015MMAS ... 38..617C . doi : 10.1002 / mma.3093 . ISSN 1099-1476 .
- ^ Cerri, Andrea; Landi, Claudia (20 de marzo de 2013). González-Díaz, Rocío; Jiménez, María-José; Medrano, Belén (eds.). El espacio de persistencia en homología persistente multidimensional . Apuntes de conferencias en Ciencias de la Computación. Springer Berlín Heidelberg. págs. 180-191. doi : 10.1007 / 978-3-642-37067-0_16 . ISBN 978-3-642-37066-3.
- ^ Skryzalin, Jacek; Carlsson, Gunnar (14 de noviembre de 2014). "Invariantes numéricos de persistencia multidimensional". arXiv : 1411.4022 [ cs.CG ].
- ^ Carlsson, Gunnar; Singh, Gurjeet; Zomorodian, Afra (16 de diciembre de 2009). Dong, Yingfei; Du, Ding-Zhu; Ibarra, Oscar (eds.). Computación de persistencia multidimensional . Apuntes de conferencias en Ciencias de la Computación. Springer Berlín Heidelberg. págs. 730–739. CiteSeerX 10.1.1.313.7004 . doi : 10.1007 / 978-3-642-10631-6_74 . ISBN 978-3-642-10630-9. S2CID 15529723 .
- ^ Allili, Madjid; Kaczynski, Tomasz; Landi, Claudia (30 de octubre de 2013). "Reducción de complejos en teoría de homología persistente multidimensional". arXiv : 1310.8089 [ cs.CG ].
- ^ Cavazza N, Ferri M, Landi C. Estimación de la homología persistente multidimensional a través de un muestreo finito [J]. 2010.
- ^ a b Carlsson, Gunnar; Silva, Vin de (21 de abril de 2010). "Persistencia en zigzag" . Fundamentos de la matemática computacional . 10 (4): 367–405. doi : 10.1007 / s10208-010-9066-0 . ISSN 1615-3375 .
- ^ Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John (4 de abril de 2008). "Extendiendo la persistencia usando la dualidad de Poincaré y Lefschetz". Fundamentos de la matemática computacional . 9 (1): 79–103. doi : 10.1007 / s10208-008-9027-z . ISSN 1615-3375 . S2CID 33297537 .
- ^ de Silva, Vin; Morozov, Dmitriy; Vejdemo-Johansson, Mikael (2011). "Dualidades en (co) homología persistente". Problemas inversos . 27 (12): 124003. arXiv : 1107.5665 . Código Bibliográfico : 2011InvPr..27l4003D . doi : 10.1088 / 0266-5611 / 27/12/124003 . S2CID 5706682 .
- ^ Silva, Vin de; Morozov, Dmitriy; Vejdemo-Johansson, Mikael (30 de marzo de 2011). "Cohomología persistente y coordenadas circulares". Geometría discreta y computacional . 45 (4): 737–759. arXiv : 0905.4887 . doi : 10.1007 / s00454-011-9344-x . ISSN 0179-5376 . S2CID 31480083 .
- ^ a b Burghelea, Dan; Dey, Tamal K. (9 de abril de 2013). "Persistencia topológica para mapas con valores de círculo". Geometría discreta y computacional . 50 (1): 69–98. arXiv : 1104,5646 . doi : 10.1007 / s00454-013-9497-x . ISSN 0179-5376 . S2CID 17407953 .
- ^ Novikov S P. Estructuras cuasiperiódicas en topología [C] // Métodos topológicos en matemáticas modernas, Actas del simposio en honor al sexagésimo cumpleaños de John Milnor celebrado en la Universidad Estatal de Nueva York, Stony Brook, Nueva York. 1991: 223-233.
- ^ Gross, Jonathan L .; Yellen, Jay (2 de junio de 2004). Manual de teoría de grafos . Prensa CRC. ISBN 978-0-203-49020-4.
- ^ Burghelea, Dan; Haller, Stefan (4 de junio de 2015). "Topología de mapas con valores de ángulos, códigos de barras y bloques de Jordan". arXiv : 1303.4328 [ math.AT ].
- ^ Frosini, Patrizio (23 de junio de 2012). "Comparación estable de grupos de homología persistente multidimensional con torsión". Acta Applicandae Mathematicae . 124 (1): 43–54. arXiv : 1012.4169 . doi : 10.1007 / s10440-012-9769-0 . ISSN 0167-8019 . S2CID 4809929 .
- ^ a b c d Lesnick, Michael (24 de marzo de 2015). "La teoría de la distancia de entrelazado en módulos de persistencia multidimensional". Fundamentos de la matemática computacional . 15 (3): 613–650. arXiv : 1106.5305 . doi : 10.1007 / s10208-015-9255-y . ISSN 1615-3375 . S2CID 17184609 .
- ^ a b Bubenik, Peter; Scott, Jonathan A. (28 de enero de 2014). "Categorificación de la homología persistente". Geometría discreta y computacional . 51 (3): 600–627. arXiv : 1205.3669 . doi : 10.1007 / s00454-014-9573-x . ISSN 0179-5376 . S2CID 11056619 .
- ^ a b c d e f Bubenik, Peter; Silva, Vin de; Scott, Jonathan (9 de octubre de 2014). "Métricas para módulos de persistencia generalizada". Fundamentos de la matemática computacional . 15 (6): 1501-1531. CiteSeerX 10.1.1.748.3101 . doi : 10.1007 / s10208-014-9229-5 . ISSN 1615-3375 . S2CID 16351674 .
- ^ a b de Silva, Vin; Nanda, Vidit (1 de enero de 2013). Geometría en el espacio de los módulos de persistencia . Actas del Vigésimo Noveno Simposio Anual de Geometría Computacional . SoCG '13. Nueva York, NY, EE.UU .: ACM. págs. 397–404. doi : 10.1145 / 2462356.2462402 . ISBN 978-1-4503-2031-3. S2CID 16326608 .
- ↑ a b De Silva V, Ghrist R. Cobertura en redes de sensores a través de homología persistente [J]. Topología algebraica y geométrica, 2007, 7 (1): 339-358.
- ^ d'Amico, Michele; Frosini, Patrizio; Landi, Claudia (14 de octubre de 2008). "Pseudodistancia natural y correspondencia óptima entre funciones de tamaño reducido". Acta Applicandae Mathematicae . 109 (2): 527–554. arXiv : 0804.3500 . Código bibliográfico : 2008arXiv0804.3500D . doi : 10.1007 / s10440-008-9332-1 . ISSN 0167-8019 . S2CID 1704971 .
- ^ Di Fabio, B .; Frosini, P. (1 de agosto de 2013). "Filtraciones inducidas por funciones continuas". Topología y sus aplicaciones . 160 (12): 1413-1422. arXiv : 1304.1268 . Código bibliográfico : 2013arXiv1304.1268D . doi : 10.1016 / j.topol.2013.05.013 . S2CID 13971804 .
- ^ Lesnick, Michael (6 de junio de 2012). "Entrelazados multidimensionales y aplicaciones a la inferencia topológica". arXiv : 1206.1365 [ math.AT ].
- ^ a b Chazal, Frederic; de Silva, Vin; Glisse, Marc; Oudot, Steve (16 de julio de 2012). "La estructura y estabilidad de los módulos de persistencia". arXiv : 1207.3674 [ matemáticas.AT ].
- ^ Webb, Cary (1 de enero de 1985). "Descomposición de módulos graduados" . Actas de la American Mathematical Society . 94 (4): 565–571. doi : 10.1090 / S0002-9939-1985-0792261-6 . ISSN 0002-9939 .
- ^ Crawley-Boevey, William (2015). "Descomposición de módulos de persistencia puntuales de dimensión finita". Revista de álgebra y sus aplicaciones . 14 (5): 1550066. arXiv : 1210.0819 . doi : 10.1142 / s0219498815500668 . S2CID 119635797 .
- ^ a b c Chazal, Frederic; Crawley-Boevey, William; de Silva, Vin (22 de mayo de 2014). "La estructura observable de los módulos de persistencia". arXiv : 1405.5644 [ math.RT ].
- ^ Droz, Jean-Marie (15 de octubre de 2012). "Un subconjunto del espacio euclidiano con gran homología Vietoris-Rips". arXiv : 1210.4097 [ math.GT ].
- ^ a b Weinberger S. ¿Qué es ... homología persistente? [J]. Avisos de la AMS, 2011, 58 (1): 36-39.
- ^ Turner, Katharine; Mileyko, Yuriy; Mukherjee, Sayan; Harer, John (12 de julio de 2014). "Medios de Fréchet para distribuciones de diagramas de persistencia". Geometría discreta y computacional . 52 (1): 44–70. arXiv : 1206.2790 . doi : 10.1007 / s00454-014-9604-7 . ISSN 0179-5376 . S2CID 14293062 .
- ^ a b Carlsson, Gunnar (1 de mayo de 2014). "Reconocimiento de patrones topológicos para datos de nubes de puntos" . Acta Numerica . 23 : 289–368. doi : 10.1017 / S0962492914000051 . ISSN 1474-0508 .
- ^ a b Mileyko, Yuriy; Mukherjee, Sayan; Harer, John (10 de noviembre de 2011). "Medidas de probabilidad en el espacio de diagramas de persistencia" . Problemas inversos . 27 (12): 124007. Código Bibliográfico : 2011InvPr..27l4007M . doi : 10.1088 / 0266-5611 / 27/12/124007 . ISSN 0266-5611 . S2CID 250676 .
- ^ Robinson, Andrew; Turner, Katharine (28 de octubre de 2013). "Prueba de hipótesis para el análisis de datos topológicos". arXiv : 1310.7467 [ stat.AP ].
- ^ Fasy, Brittany Terese; Lecci, Fabrizio; Rinaldo, Alessandro; Wasserman, Larry; Balakrishnan, Sivaraman; Singh, Aarti (1 de diciembre de 2014). "Conjuntos de confianza para diagramas de persistencia" . The Annals of Statistics . 42 (6): 2301–2339. doi : 10.1214 / 14-AOS1252 . ISSN 0090-5364 .
- ^ Blumberg, Andrew J .; Gal, Itamar; Mandell, Michael A .; Pancia, Matthew (15 de mayo de 2014). "Estadísticas robustas, pruebas de hipótesis e intervalos de confianza para la homología persistente en espacios de medidas métricas". Fundamentos de la matemática computacional . 14 (4): 745–789. arXiv : 1206.4581 . doi : 10.1007 / s10208-014-9201-4 . ISSN 1615-3375 . S2CID 17150103 .
- ^ Baudot, Pierre; Bennequin, Daniel (2015). "La naturaleza homológica de la entropía" . Entropía . 17 (5): 3253–3318. Código Bibliográfico : 2015Entrp..17.3253B . doi : 10.3390 / e17053253 .
- ^ Vigneaux, Juan-Pablo (2019). "Topología de sistemas estadísticos: un enfoque cohomológico de la teoría de la información" (PDF) . Manuscrito de Doctorado : 0–226.
- ^ Baudot, Pierre; Tapia, Monica; Bennequin, Daniel; Goaillard, Jean-Marc (2019). "Análisis de datos de información topológica" . Entropía . 21 (9): 881. Bibcode : 2019Entrp..21..881B . doi : 10.3390 / e21090881 .
- ^ Tapia, Monica; al., et al. (2018). "La identidad del neurotransmisor y el fenotipo electrofisiológico están acoplados genéticamente en las neuronas dopaminérgicas del mesencéfalo" . Informes científicos . 8 (1): 13637. Bibcode : 2018NatSR ... 813637T . doi : 10.1038 / s41598-018-31765-z . PMC 6134142 . PMID 30206240 .
- ^ Baudot, Pierre (2019). "Elementos de la cognición cualitativa: una perspectiva de topología de la información". Reseñas de Física de la Vida . 31 : 263-275. arXiv : 1807.04520 . Código bibliográfico : 2019PhLRv..31..263B . doi : 10.1016 / j.plrev.2019.10.003 . PMID 31679788 .
- ^ Baudot, Pierre (2019). "La máquina de Poincaré-Shannon: aspectos de la física estadística y el aprendizaje automático de la cohomología de la información" . Entropía . 21 (9): 881. Bibcode : 2019Entrp..21..881B . doi : 10.3390 / e21090881 .
- ^ Bubenik, Peter (26 de julio de 2012). "Análisis estadístico de datos topológicos utilizando paisajes de persistencia". arXiv : 1207.6437 [ math.AT ].
- ^ Bubenik, Peter; Dlotko, Pawel (31 de diciembre de 2014). "Una caja de herramientas de paisajes de persistencia para estadísticas topológicas". Revista de Computación Simbólica . 78 : 91-114. arXiv : 1501.00179 . Código bibliográfico : 2015arXiv150100179B . doi : 10.1016 / j.jsc.2016.03.009 . S2CID 9789489 .
- ^ Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John; Morozov, Dmitriy (2009). Actas del vigésimo simposio anual ACM-SIAM sobre algoritmos discretos . págs. 1011–1020. CiteSeerX 10.1.1.179.3236 . doi : 10.1137 / 1.9781611973068.110 . ISBN 978-0-89871-680-1.
- ^ Kurlin, V. (2015). "Un esqueleto unidimensional homológicamente persistente de una nube de puntos no estructurada en cualquier espacio métrico" (PDF) . Foro de Gráficos por Computadora (CGF) . 34 (5): 253–262. doi : 10.1111 / cgf.12713 . S2CID 10610111 .
- ^ Kurlin, V. (2014). "Un algoritmo rápido y robusto para contar agujeros topológicamente persistentes en nubes ruidosas". 2014 IEEE Conference on Computer Vision and Pattern Recognition (PDF) . Conferencia IEEE sobre visión artificial y reconocimiento de patrones . págs. 1458-1463. arXiv : 1312.1492 . doi : 10.1109 / CVPR.2014.189 . ISBN 978-1-4799-5118-5. S2CID 10118087 .
- ^ Kurlin, V. (2015). "Un esqueleto homológicamente persistente es un descriptor rápido y robusto de puntos de interés en imágenes 2D". Análisis informático de imágenes y patrones (PDF) . Lecture Notes in Computer Science (Proceedings of CAIP: Computer Analysis of Images and Patterns) . Apuntes de conferencias en Ciencias de la Computación. 9256 . págs. 606–617. doi : 10.1007 / 978-3-319-23192-1_51 . ISBN 978-3-319-23191-4.
- ^ Cerri, A .; Ferri, M .; Giorgi, D. (1 de septiembre de 2006). "Recuperación de imágenes de marca mediante funciones de tamaño". Modelos gráficos . Número especial sobre la conferencia sobre visión, video y gráficos de 2005. 68 (5–6): 451–471. doi : 10.1016 / j.gmod.2006.07.001 .
- ^ Chazal, Frédéric; Cohen-Steiner, David; Guibas, Leonidas J .; Mémoli, Facundo; Oudot, Steve Y. (1 de julio de 2009). "Firmas estables de Gromov-Hausdorff para formas que utilizan persistencia". Foro de Gráficos por Computadora . 28 (5): 1393–1403. CiteSeerX 10.1.1.161.9103 . doi : 10.1111 / j.1467-8659.2009.01516.x . ISSN 1467-8659 . S2CID 8173320 .
- ^ Biasotti, S .; Giorgi, D .; Spagnuolo, M .; Falcidieno, B. (1 de septiembre de 2008). "Funciones de tamaño para comparar modelos 3D". Reconocimiento de patrones . 41 (9): 2855–2873. doi : 10.1016 / j.patcog.2008.02.003 .
- ^ Li, C .; Ovsjanikov, M .; Chazal, F. (2014). "Reconocimiento estructural basado en persistencia" (PDF) . Conferencia IEEE sobre visión artificial y reconocimiento de patrones .
- ^ Tapia, Monica; al., et al. (2018). "La identidad del neurotransmisor y el fenotipo electrofisiológico están acoplados genéticamente en las neuronas dopaminérgicas del mesencéfalo" . Informes científicos . 8 (1): 13637. Bibcode : 2018NatSR ... 813637T . doi : 10.1038 / s41598-018-31765-z . PMC 6134142 . PMID 30206240 .
- ^ Bendich, P .; Edelsbrunner, H .; Kerber, M. (1 de noviembre de 2010). "Robustez y persistencia informática para imágenes". Transacciones IEEE sobre visualización y gráficos por computadora . 16 (6): 1251-1260. CiteSeerX 10.1.1.185.523 . doi : 10.1109 / TVCG.2010.139 . ISSN 1077-2626 . PMID 20975165 . S2CID 8589124 .
- ^ Carlsson, Gunnar; Ishkhanov, Tigran; Silva, Vin de; Zomorodian, Afra (30 de junio de 2007). "Sobre el comportamiento local de espacios de imágenes naturales". Revista Internacional de Visión por Computador . 76 (1): 1–12. CiteSeerX 10.1.1.463.7101 . doi : 10.1007 / s11263-007-0056-x . ISSN 0920-5691 . S2CID 207252002 .
- ^ Nakamura, Takenobu; Hiraoka, Yasuaki; Hirata, Akihiko; Escolar, Emerson G .; Nishiura, Yasumasa (26 de febrero de 2015). "Homología persistente y estructura atómica de muchos cuerpos para orden de rango medio en el vidrio". Nanotecnología . 26 (30): 304001. arXiv : 1502.07445 . Código Bibliográfico : 2015Nanot..26D4001N . doi : 10.1088 / 0957-4484 / 26/30/304001 . PMID 26150288 . S2CID 7298655 .
- ^ Nicolau, Monica; Levine, Arnold J .; Carlsson, Gunnar (26 de abril de 2011). "El análisis de datos basado en topología identifica un subgrupo de cánceres de mama con un perfil mutacional único y una supervivencia excelente" . Actas de la Academia Nacional de Ciencias . 108 (17): 7265–7270. Código Bibliográfico : 2011PNAS..108.7265N . doi : 10.1073 / pnas.1102826108 . ISSN 0027-8424 . PMC 3084136 . PMID 21482760 .
- ^ Schmidt, Stephan; Post, Teun M .; Boroujerdi, Massoud A .; Kesteren, camioneta de Charlotte; Ploeger, Bart A .; Pasqua, Oscar E. Della; Danhof, Meindert (1 de enero de 2011). Kimko, Holly HC; Peck, Carl C. (eds.). Análisis de progresión de la enfermedad: hacia modelos basados en mecanismos . Avances de la AAPS en la serie de ciencias farmacéuticas. Springer Nueva York. págs. 433–455. doi : 10.1007 / 978-1-4419-7415-0_19 . ISBN 978-1-4419-7414-3.
- ^ Perea, Jose A .; Harer, John (29 de mayo de 2014). "Ventanas deslizantes y persistencia: una aplicación de métodos topológicos al análisis de señales". Fundamentos de la matemática computacional . 15 (3): 799–838. CiteSeerX 10.1.1.357.6648 . doi : 10.1007 / s10208-014-9206-z . ISSN 1615-3375 . S2CID 592832 .
- ^ van de Weygaert, Rien; Vegter, Gert; Edelsbrunner, Herbert; Jones, Bernard JT; Pranav, Pratyush; Park, Changbom; Hellwing, Wojciech A .; Anciano, Bob; Kruithof, Nico (1 de enero de 2011). Gavrilova, Marina L .; Tan, C. Kenneth; Mostafavi, Mir Abolfazl (eds.). Transacciones en Ciencias Computacionales XIV . Berlín, Heidelberg: Springer-Verlag. págs. 60–101. ISBN 978-3-642-25248-8.
- ^ Horak, Danijela; Maletić, Slobodan; Rajković, Milán (1 de marzo de 2009). "Homología persistente de redes complejas - IOPscience". Revista de Mecánica Estadística: Teoría y Experimento . 2009 (3): P03034. arXiv : 0811.2203 . Código bibliográfico : 2009JSMTE..03..034H . doi : 10.1088 / 1742-5468 / 2009/03 / p03034 . S2CID 15592802 .
- ^ Carstens, CJ; Horadam, KJ (4 de junio de 2013). "Homología persistente de redes de colaboración" . Problemas matemáticos en ingeniería . 2013 : 1–7. doi : 10.1155 / 2013/815035 .
- ^ Lee, Hyekyoung; Kang, Hyejin; Chung, MK; Kim, Bung-Nyun; Lee, Dong Soo (1 de diciembre de 2012). "Homología de red cerebral persistente desde la perspectiva del dendrograma". Transacciones IEEE sobre imágenes médicas . 31 (12): 2267–2277. CiteSeerX 10.1.1.259.2692 . doi : 10.1109 / TMI.2012.2219590 . ISSN 0278-0062 . PMID 23008247 . S2CID 858022 .
- ^ Petri, G .; Experto, P .; Turkheimer, F .; Carhart-Harris, R .; Nutt, D .; Hellyer, PJ; Vaccarino, F. (6 de diciembre de 2014). "Andamios homológicos de redes funcionales cerebrales" . Revista de la interfaz de la Royal Society . 11 (101): 20140873. doi : 10.1098 / rsif.2014.0873 . ISSN 1742-5689 . PMC 4223908 . PMID 25401177 .
- ^ a b MacPherson, Robert; Schweinhart, Benjamin (1 de julio de 2012). "Medición de forma con topología". Revista de Física Matemática . 53 (7): 073516. arXiv : 1011.2258 . Código bibliográfico : 2012JMP .... 53g3516M . doi : 10.1063 / 1.4737391 . ISSN 0022-2488 . S2CID 17423075 .
- ^ Chan, Joseph Minhow; Carlsson, Gunnar; Rabadan, Raúl (12 de noviembre de 2013). "Topología de la evolución viral" . Actas de la Academia Nacional de Ciencias . 110 (46): 18566–18571. Código bibliográfico : 2013PNAS..11018566C . doi : 10.1073 / pnas.1313480110 . ISSN 0027-8424 . PMC 3831954 . PMID 24170857 .
- ^ Taylor, D .; al, et. (21 de agosto de 2015). "Análisis de datos topológicos de mapas de contagio para examinar procesos de propagación en redes" . Comunicaciones de la naturaleza . 6 (6): 7723. arXiv : 1408.1168 . Código bibliográfico : 2015NatCo ... 6E7723T . doi : 10.1038 / ncomms8723 . ISSN 2041-1723 . PMC 4566922 . PMID 26194875 .
- ^ Offroy, M. (2016). "Análisis de datos topológicos: una prometedora herramienta de exploración de big data en biología, química analítica y química física". Analytica Chimica Acta . 910 : 1–11. doi : 10.1016 / j.aca.2015.12.037 . PMID 26873463 .
- ^ Duponchel, L. (2018). "Exploración de conjuntos de datos de imágenes hiperespectrales con análisis de datos topológicos". Analytica Chimica Acta . 1000 : 123-131. doi : 10.1016 / j.aca.2017.11.029 . PMID 29289301 .
- ^ Duponchel, L. (2018). "Cuando la teledetección se encuentra con el análisis de datos topológicos" . Revista de imágenes espectrales . 7 : a1. doi : 10.1255 / jsi.2018.a1 .
- ^ Wang, Bao; Wei, Guo-Wei (7 de diciembre de 2014). "Homología persistente orientada a objetivos". arXiv : 1412.2368 [ q-bio.BM ].
- ^ Frosini, Patrizio; Landi, Claudia (2011). "Unicidad de modelos en homología persistente: el caso de las curvas". Problemas inversos . 27 (12): 124005. arXiv : 1012.5783 . Código Bibliográfico : 2011InvPr..27l4005F . doi : 10.1088 / 0266-5611 / 27/12/124005 . S2CID 16636182 .
- ^ Xia, Kelin; Feng, Xin; Tong, Yiying; Wei, Guo Wei (5 de marzo de 2015). "Homología persistente para la predicción cuantitativa de la estabilidad del fullereno" . Revista de Química Computacional . 36 (6): 408–422. doi : 10.1002 / jcc.23816 . ISSN 1096-987X . PMC 4324100 . PMID 25523342 .
- ^ Xia, Kelin; Wei, Guo-Wei (1 de agosto de 2014). "Análisis de homología persistente de estructura, flexibilidad y plegamiento de proteínas" . Revista Internacional de Métodos Numéricos en Ingeniería Biomédica . 30 (8): 814–844. arXiv : 1412.2779 . Código bibliográfico : 2014arXiv1412.2779X . doi : 10.1002 / cnm.2655 . ISSN 2040-7947 . PMC 4131872 . PMID 24902720 .
- ^ Adcock, Aaron; Carlsson, Erik; Carlsson, Gunnar (31 de mayo de 2016). "El anillo de funciones algebraicas en códigos de barras de persistencia" (PDF) . Homología, Homotopía y Aplicaciones . 18 (1): 381–402. doi : 10.4310 / hha.2016.v18.n1.a21 . S2CID 2964961 .
- ^ Chepushtanova, Sofya; Emerson, Tegan; Hanson, Eric; Kirby, Michael; Motta, Francis; Neville, Rachel; Peterson, Chris; Shipman, Patrick; Ziegelmeier, Lori (22 de julio de 2015). "Imágenes de persistencia: una representación alternativa de homología persistente". arXiv : 1507.06217 [ cs.CG ].
- ^ Deheuvels, Rene (1 de enero de 1955). "Topologie D'Une Fonctionnelle". Annals of Mathematics . Segunda Serie. 61 (1): 13–72. doi : 10.2307 / 1969619 . JSTOR 1969619 .
- ^ de Silva, Vin; Munch, Elizabeth; Patel, Amit (13 de abril de 2016). "Gráficos Reeb categorizados". Geometría discreta y computacional . 55 (4): 854–906. arXiv : 1501.04147 . doi : 10.1007 / s00454-016-9763-9 . S2CID 7111141 .
- ^ Goodman, Jacob E. (1 de enero de 2008). Encuestas sobre geometría discreta y computacional: veinte años después: Conferencia de investigación conjunta de verano AMS-IMS-SIAM, 18-22 de junio de 2006, Snowbird, Utah . American Mathematical Soc. ISBN 9780821842393.
- ^ Edelsbrunner, Herbert; Harer, John (2008). Homología persistente: una encuesta . Matemáticas contemporáneas. 453 . AMS. págs. 15-18. CiteSeerX 10.1.1.87.7764 . doi : 10.1090 / conm / 453/08802 . ISBN 9780821842393.
Sección 5
Otras lecturas
Breve introducción
- Estudio de la forma de los datos mediante topología , por Michael Lesnick
- Material de origen para el análisis de datos topológicos por Mikael Vejdemo-Johansson
Monografía
- Teoría de la persistencia: de representaciones de carcaj al análisis de datos , por Steve Oudot
Conferencia en video
- Introducción a la topología y homología persistente para el análisis de datos , por Matthew Wright
- La forma de los datos , de Gunnar Carlsson
Libro de texto sobre topología
- Topología algebraica , por Allen Hatcher
- Topología computacional: una introducción , por Herbert Edelsbrunner y John L. Harer
- Topología aplicada elemental , por Robert Ghrist
Otros recursos de TDA
- Topología aplicada , de Stanford
- Red de investigación de topología algebraica aplicada , por el Instituto de Matemáticas y sus Aplicaciones
- Aprendizaje topológico del kernel: la teoría de Morse discreta se utiliza para conectar el aprendizaje automático del kernel con el análisis de datos topológicos. https://www.researchgate.net/publication/327427685_Topological_Kernel_Learning