En estadística , un modelo de clases latentes ( LCM ) relaciona un conjunto de variables multivariadas observadas (generalmente discretas) con un conjunto de variables latentes . Es un tipo de modelo de variable latente . Se llama modelo de clases latentes porque la variable latente es discreta. Una clase se caracteriza por un patrón de probabilidades condicionales que indican la posibilidad de que las variables tomen ciertos valores.
El análisis de clases latentes ( LCA ) es un subconjunto del modelado de ecuaciones estructurales , que se utiliza para encontrar grupos o subtipos de casos en datos categóricos multivariados. Estos subtipos se denominan "clases latentes". [1] [2]
Al enfrentarse a una situación de la siguiente manera, un investigador podría optar por utilizar el LCA para comprender los datos: Imagine que los síntomas y se han medido en una variedad de pacientes con enfermedades X, Y y Z, y que la enfermedad X está asociada con la presencia de síntomas a, byc, enfermedad Y con síntomas b, c, d, y enfermedad Z con síntomas a, cy d.
La LCA intentará detectar la presencia de clases latentes (las entidades patológicas), creando patrones de asociación en los síntomas. Al igual que en el análisis factorial, el LCA también se puede utilizar para clasificar el caso de acuerdo con su pertenencia a la clase de máxima verosimilitud . [1]
Porque el criterio para resolver el ACV es lograr clases latentes dentro de las cuales ya no exista asociación de un síntoma con otro (porque la clase es la enfermedad que provoca su asociación), y el conjunto de enfermedades que tiene un paciente (o clase a caso es miembro de) causa la asociación de síntomas, los síntomas serán "condicionalmente independientes", es decir, condicionados a la pertenencia a una clase, ya no están relacionados. [1]
Modelo
Dentro de cada clase latente, las variables observadas son estadísticamente independientes . Este es un aspecto importante. Por lo general, las variables observadas son estadísticamente dependientes. Al introducir la variable latente, se restaura la independencia en el sentido de que dentro de las clases las variables son independientes ( independencia local ). Luego decimos que la asociación entre las variables observadas se explica por las clases de la variable latente (McCutcheon, 1987).
En una forma, el modelo de clases latentes se escribe como
dónde es el número de clases latentes y son las llamadas probabilidades de reclutamiento o incondicionales que deben sumar uno. son las probabilidades marginales o condicionales.
Para un modelo de clase latente bidireccional, la forma es
Este modelo bidireccional está relacionado con el análisis semántico latente probabilístico y la factorización matricial no negativa .
Métodos relacionados
Hay varios métodos con nombres y usos distintos que comparten una relación común. El análisis de conglomerados , como el LCA, se utiliza para descubrir grupos de casos similares a taxones en los datos. La estimación de mezcla multivariante (MME) es aplicable a datos continuos y asume que dichos datos surgen de una mezcla de distribuciones: imagine un conjunto de alturas que surja de una mezcla de hombres y mujeres. Si una estimación de mezcla multivariante está restringida de modo que las medidas deban no estar correlacionadas dentro de cada distribución, se denomina análisis de perfil latente . Modificado para manejar datos discretos, este análisis restringido se conoce como LCA. Los modelos de rasgos latentes discretos restringen aún más las clases para que se formen a partir de segmentos de una sola dimensión: esencialmente asignando miembros a clases en esa dimensión: un ejemplo sería asignar casos a clases sociales en una dimensión de capacidad o mérito.
Como ejemplo práctico, las variables podrían ser elementos de opción múltiple de un cuestionario político. Los datos en este caso consisten en una tabla de contingencia de N factores con respuestas a los ítems para varios encuestados. En este ejemplo, la variable latente se refiere a la opinión política y las clases latentes a los grupos políticos. Dada la pertenencia a un grupo, las probabilidades condicionales especifican la posibilidad de que se elijan determinadas respuestas.
Solicitud
La LCA se puede utilizar en muchos campos, tales como: filtrado colaborativo , [3] Genética del comportamiento [4] y Evaluación de pruebas de diagnóstico . [5]
Referencias
- ^ a b c Lazarsfeld, PF y Henry, NW (1968) Análisis de estructura latente . Boston: Houghton Mifflin
- ^ Formann , AK (1984). Análisis de clase latente: Einführung in die Theorie und Anwendung [Análisis de clase latente: Introducción a la teoría y aplicación] . Weinheim: Beltz.
- ^ Cheung, Kwok-Wai; Tsui, Kwok-Ching; Liu, Jiming (2004). "Modelos extendidos de clases latentes para recomendación colaborativa". Transacciones IEEE sobre sistemas, hombre y cibernética - Parte A: Sistemas y seres humanos . 34 (1): 143-148. CiteSeerX 10.1.1.6.2234 . doi : 10.1109 / TSMCA.2003.818877 .
- ^ Aleros, LJ, Silberg, JL, Hewitt, JK, Rutter, M., Meyer, JM, Neale, MC y Pickles, A (1993). "Análisis de semejanza de gemelos en datos de múltiples síntomas: aplicaciones genéticas de un modelo de clase latente para los síntomas del trastorno de conducta en niños menores". Genética del comportamiento . 23 (1): 5–19. doi : 10.1007 / bf01067550 . PMID 8476390 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Bermingham, ML, Handel, IG, Glass, EJ, Woolliams, JA, de Clare Bronsvoort, BM, McBride, SH, Skuce, RA, Allen, A. R., McDowell, SWJ y Bishop, SC (2015). "El modelo de clase latente de Hui y Walter extendido para estimar las propiedades de las pruebas de diagnóstico a partir de los datos de vigilancia: un modelo latente para los datos latentes" . Informes científicos . 5 : 11861. doi : 10.1038 / srep11861 . PMC 4493568 . PMID 26148538 .CS1 maint: varios nombres: lista de autores ( enlace )
- Linda M. Collins; Stephanie T. Lanza (2010). Análisis de clases latentes y de transición latente para las ciencias sociales, del comportamiento y de la salud . Nueva York: Wiley . ISBN 978-0-470-22839-5.
- Allan L. McCutcheon (1987). Análisis de clases latentes . Aplicaciones cuantitativas en la serie de ciencias sociales No. 64. Thousand Oaks, California: Sage Publications . ISBN 978-0-521-59451-6.
- Leo A. Goodman (1974). "Análisis exploratorio de estructuras latentes utilizando modelos identificables y no identificables". Biometrika . 61 (2): 215–231. doi : 10.1093 / biomet / 61.2.215 .
- Paul F. Lazarsfeld , Neil W. Henry (1968). Análisis de estructura latente .
enlaces externos
- Innovaciones estadísticas, página de inicio , 2016. Sitio web con software de clase latente (Latent GOLD 5.1), demostraciones gratuitas, tutoriales, guías de usuario y publicaciones para descargar. También se incluyen: cursos en línea, preguntas frecuentes y otro software relacionado.
- El Centro de Metodología, Análisis de clases latentes , un centro de investigación en Penn State , software gratuito, Preguntas frecuentes
- John Uebersax, Latent Class Analysis , 2006. Un sitio web con bibliografía, software, enlaces y preguntas frecuentes para el análisis de clases latentes.