Open Mind Common Sense ( OMCS ) es un proyecto de inteligencia artificial basado en el Laboratorio de Medios del Instituto de Tecnología de Massachusetts (MIT) cuyo objetivo es construir y utilizar una gran base de conocimientos de sentido común a partir de las contribuciones de muchos miles de personas en la Web.
Desde su fundación en 1999, ha acumulado más de un millón de datos en inglés de más de 15.000 colaboradores, además de bases de conocimientos en otros idiomas. Gran parte del software de OMCS se basa en tres representaciones interconectadas: el corpus de lenguaje natural con el que las personas interactúan directamente, una red semántica construida a partir de este corpus llamada ConceptNet y una representación matricial de ConceptNet llamada AnalogySpace que puede inferir nuevos conocimientos mediante la reducción de dimensionalidad . [1] El conocimiento recopilado por Open Mind Common Sense ha permitido proyectos de investigación en el MIT y en otros lugares.
Historia
El proyecto fue una creación de Marvin Minsky , Push Singh, Catherine Havasi y otros. El trabajo de desarrollo comenzó en septiembre de 1999 y el proyecto se abrió a Internet un año después. Havasi lo describió en su disertación como "un intento de ... aprovechar parte del poder de cómputo humano distribuido de Internet, una idea que entonces estaba solo en sus primeras etapas". [2] El OMCS original fue influenciado por el sitio web Everything2 y su predecesor, y presentó una interfaz minimalista inspirada en Google .
Push Singh estaba programado para convertirse en profesor en el MIT Media Lab para dirigir el grupo Common Sense Computing en 2007 hasta su suicidio el martes 28 de febrero de 2006. [3]
El proyecto está actualmente a cargo del Digital Intuition Group en el MIT Media Lab bajo la dirección de Catherine Havasi. [ cita requerida ]
Base de datos y sitio web
Hay muchos tipos diferentes de conocimiento en OMCS. Algunas declaraciones transmiten relaciones entre objetos o eventos, expresadas como frases simples de lenguaje natural: algunos ejemplos incluyen "Se usa un abrigo para mantener el calor", "El sol hace mucho calor" y "Lo último que haces cuando cocinas la cena es lava tus platos ". La base de datos también contiene información sobre el contenido emocional de situaciones, en declaraciones como "Pasar tiempo con amigos causa felicidad" y "Meterse en un accidente automovilístico enfada". OMCS contiene información sobre los deseos y metas de las personas, tanto grandes como pequeñas, como "La gente quiere ser respetada" y "La gente quiere un buen café". [1]
Originalmente, estas declaraciones podían ingresarse en el sitio web como oraciones de texto sin restricciones, que debían analizarse más tarde. La versión actual del sitio web recopila conocimientos únicamente mediante plantillas más estructuradas para rellenar los espacios en blanco. OMCS también hace uso de los datos recopilados por el Juego con un Propósito " Verbosidad ". [4]
En su forma nativa, la base de datos OMCS es simplemente una colección de estas frases cortas que transmiten algunos conocimientos comunes. Para utilizar este conocimiento computacionalmente, debe transformarse en una representación más estructurada.
ConceptNet
ConceptNet es una red semántica basada en la información de la base de datos OMCS. ConceptNet se expresa como un grafo dirigido cuyos nodos son conceptos y cuyas aristas son afirmaciones de sentido común sobre estos conceptos. Los conceptos representan conjuntos de frases en lenguaje natural estrechamente relacionadas, que pueden ser frases nominales, frases verbales, frases adjetivas o cláusulas. [5]
ConceptNet se crea a partir de las afirmaciones de lenguaje natural en OMCS comparándolas con patrones utilizando un analizador superficial. Las afirmaciones se expresan como relaciones entre dos conceptos, seleccionados de un conjunto limitado de posibles relaciones. Las diversas relaciones representan patrones de oraciones comunes que se encuentran en el corpus OMCS y, en particular, cada plantilla de "llenar los espacios en blanco" utilizada en el sitio web de recopilación de conocimientos está asociada con una relación particular. [5]
Las estructuras de datos que componen ConceptNet se reorganizaron significativamente en 2007 y se publicaron como ConceptNet 3. [5] El grupo de agentes de software actualmente distribuye una base de datos y una API para la nueva versión 4.0. [6]
En 2010, la cofundadora y directora de OMCS, Catherine Havasi, junto con Robyn Speer, Dennis Clark y Jason Alonso, crearon Luminoso , una empresa de software de análisis de texto que se basa en ConceptNet. [7] [8] [9] [10] Utiliza ConceptNet como su principal recurso léxico para ayudar a las empresas a entender y obtener información a partir de grandes cantidades de datos cualitativos, incluidas encuestas, reseñas de productos y redes sociales. [7] [11] [12]
Herramientas de aprendizaje automático
La información de ConceptNet se puede utilizar como base para algoritmos de aprendizaje automático . Una representación, llamada AnalogySpace, utiliza la descomposición de valores singulares para generalizar y representar patrones en el conocimiento en ConceptNet, de una manera que se puede utilizar en aplicaciones de IA. Sus creadores distribuyen un juego de herramientas de aprendizaje automático de Python llamado Divisi [13] para realizar aprendizaje automático basado en corpus de texto, bases de conocimiento estructuradas como ConceptNet y combinaciones de los dos.
Comparación con otros proyectos
Otros proyectos similares incluyen Never-Ending Language Learning , Mindpixel (descontinuado), Cyc , Learner, SenticNet, Freebase , YAGO , DBpedia y Open Mind 1001 Questions, que han explorado enfoques alternativos para recopilar conocimientos y proporcionar incentivos para la participación.
El proyecto Open Mind Common Sense se diferencia de Cyc porque se ha centrado en representar el conocimiento de sentido común que recopiló como oraciones en inglés, en lugar de utilizar una estructura lógica formal. ConceptNet es descrito por uno de sus creadores, Hugo Liu, como estructurado más como WordNet que como Cyc, debido a su "énfasis en la conexión conceptual informal sobre el rigor lingüístico formal". [14]
También está la iniciativa brasileña, denominada Open Mind Common Sense in Brazil (OMCS-Br), liderada por el Laboratorio de Interacción Avanzada de la Universidad Federal de São Carlos ( LIA-UFSCar ). Este proyecto se inició en 2005, en colaboración con el Grupo de Agentes de Software en el MIT Media Lab, el objetivo principal es recopilar el sentido común expresado en portugués brasileño y utilizarlo para desarrollar aplicaciones de software culturalmente sensibles basadas en la extracción del conocimiento de perfiles culturales de ConceptNet. Esto está destinado a ayudar a los desarrolladores y usuarios con un software de contenido contextualizado culturalmente, haciendo que las aplicaciones finales sean más flexibles, adaptables, accesibles y utilizables. Los enfoques de las principales aplicaciones son la educación y la salud. [ cita requerida ]
Ver también
- Intento de inglés controlado
- Aprendizaje de idiomas sin fin
- Mindpixel
- Pensamiento Tesoro
- Web semántica
- DBpedia
- Freebase (base de datos)
- yago (base de datos)
Referencias
- ↑ a b Robyn Speer, Catherine Havasi y Henry Lieberman. AnalogySpace: Reducción de la dimensionalidad del conocimiento de sentido común Archivado el 9 de julio de 2010 en la Wayback Machine . AAAI 2008.
- ^ Catherine Havasi. Descubrimiento de relaciones semánticas utilizando técnicas basadas en la descomposición de valores singulares. Tesis de doctorado, Brandeis University, junio de 2009.
- ^ Oficina de noticias del MIT (8 de marzo de 2006). "Servicio conmemorativo programado mañana para Pushpinder Singh" . Charla técnica del MIT . Consultado el 7 de octubre de 2009 .
- ^ "Perfil de verbosidad" . Sentido común de mente abierta. Archivado desde el original el 25 de junio de 2010.
- ^ a b c Catherine Havasi, Robyn Speer y Jason Alonso. ConceptNet 3: una red semántica flexible y multilingüe para el conocimiento del sentido común . Actas de avances recientes en el procesamiento del lenguaje natural, 2007. pruebe ConceptNet 3: ... Archivado el 29 de mayo de 2015 en Wayback Machine.
- ^ Iniciativa de computación de sentido común (2009-02-24). "API de ConceptNet en Launchpad" . Consultado el 7 de octubre de 2009 .
- ^ a b Lohr, Steve (27 de junio de 2014). "El partido entre Estados Unidos y Alemania a través de la lente de las redes sociales" . New York Times . Consultado el 3 de marzo de 2015 .
- ^ Rusli, Evelyn (14 de abril de 2014). "Las empresas utilizan la inteligencia artificial para aprovechar las opiniones de los compradores" . El Wall Street Journal . Consultado el 3 de marzo de 2015 .
- ^ Alba, Davey (12 de febrero de 2015). "La startup que le ayuda a analizar Twitter Chatter en tiempo real" . Cableado . Consultado el 3 de marzo de 2015 .
- ^ Noyes, Katherine (11 de febrero de 2015). "Luminoso para las empresas: esto es lo que realmente significa todo ese parloteo" . PC World . Consultado el 3 de marzo de 2015 .
- ^ Miller, Ron (2 de julio de 2014). "Luminoso consigue $ 6,5 millones en la serie A para seguir construyendo el servicio de análisis de texto en la nube" . TechCrunch . Consultado el 3 de marzo de 2015 .
- ^ Darrow, Barb (11 de febrero de 2015). "Luminoso lleva su inteligencia de análisis de texto a la transmisión de datos" . GigaOm . Consultado el 3 de marzo de 2015 .
- ^ Iniciativa de computación de sentido común (2009-02-24). "Divisi en Launchpad" . Consultado el 7 de octubre de 2009 .
- ^ "El Proyecto ConceptNet V2.1" . Consultado el 17 de diciembre de 2008 .
enlaces externos
- Sentido común de mente abierta
- Meta-repositorio de Open Mind Common Sense Github
- ConceptNet
- AnalogíaEspacio
- El kit de herramientas de inferencia de Divisi
- Página web de Commonsense Computing Initiative (el sitio no existe)
- La iniciativa Open Mind (el sitio no existe)
- OMCSNetCPP: motor de inferencia C ++ de código abierto que utiliza los datos de OMCSNet
- Sentido común de mente abierta en Brasil (sitio roto)
- Laboratorio de interacción avanzada