Marti Hearst es profesor de la Escuela de Información de la Universidad de California, Berkeley . Ella hizo un trabajo temprano en la lingüística computacional basados en corpus, incluyendo algunos de los primeros trabajos en la automatización de análisis de sentimientos , [1] y la desambiguación del sentido de la palabra . [2] Inventó un algoritmo que se conoció como "patrones de Hearst" [3] que aplica patrones léxico-sintácticos para reconocer las relaciones de hiponimia [4] (ISA) con alta precisión en grandes colecciones de texto, incluida una aplicación temprana a WordNet. ; [5] este algoritmo se utiliza ampliamente en aplicaciones comercialesaplicaciones de minería de texto , incluido el aprendizaje de ontologías . Hearst también desarrolló un trabajo temprano en la segmentación automática de texto en límites de discurso temático, inventando un enfoque ahora bien conocido llamado TextTiling. [6]
Marti Hearst | |
---|---|
Nacionalidad | americano |
Otros nombres | Martha Alice Hearst |
alma mater | Universidad de California, Berkeley |
Conocido por | Patrones de Hearst |
Carrera científica | |
Campos | Ciencias de la Computación |
Instituciones | |
Tesis | Contexto y estructura en el acceso automatizado a la información de texto completo (1994) |
Asesor de doctorado | Robert Wilensky |
Otros asesores académicos | Michael Stonebraker |
Estudiantes de doctorado | Cecilia R. Aragón |
Sitio web | gente |
La investigación de Hearst se centra en las interfaces de usuario para la tecnología de motores de búsqueda [7] [8] [9] y el análisis de macrodatos . [10] [11] [12] Hizo un trabajo temprano en interfaces de usuario y visualización de información para interfaces de usuario de búsqueda, inventando la visualización de términos de consulta TileBars. [13] Su proyecto de investigación Flamenco investigó y desarrolló el enfoque de navegación por facetas ahora ampliamente utilizado para buscar y navegar en sitios web y colecciones de información. Escribió el primer libro académico sobre el tema de las interfaces de usuario de búsqueda (Cambridge University Press, 2009). [14] [15]
Hearst es un autor colaborador de Edge Foundation y miembro del panel de uso del American Heritage Dictionary of the English Language .
Hearst recibió su BA, MS y Ph.D. en Ciencias de la Computación, todos de UC Berkeley. [16] En 2013 se convirtió en miembro de la Association for Computing Machinery . [17] Se convirtió en miembro de la Academia CHI en 2017 y anteriormente se desempeñó como Presidenta de la Asociación de Lingüística Computacional y en el Consejo Asesor de la Dirección CISE de NSF. Además, ha sido miembro del Web Board de CACM, del Usage Panel del American Heritage Dictionary, del panel de expertos de Edge.org, del personal de investigación de Xerox PARC y de los consejos de ACM Transactions on the Web, Computational Linguistics , Transacciones ACM en sistemas de información y sistemas inteligentes IEEE.
Hearst ha recibido un premio NSF CAREER, un premio IBM Faculty Award y una beca de la Fundación Okawa. Su trabajo en interfaces de usuario ha tenido un impacto profundo en la industria, lo que le valió a Hearst dos premios de investigación de Google y cuatro premios a la excelencia en la enseñanza. También ha dirigido proyectos por valor de más de $ 3,5 millones en becas de investigación.
Las publicaciones de Hearst se remontan a 1990, cuando se publicó "Un enfoque híbrido para la interpretación restringida de textos" en el Simposio de primavera de AAAI sobre sistemas inteligentes basados en texto de la Universidad de Stanford en marzo de ese año.
Referencias
- ^ Hearst, M. (1992). Interpretación de texto basada en direcciones como acceso a la información ( en sistemas inteligentes basados en texto) . Lawrence Erlbaum.
- ^ Hearst, M. (1991). "Sustantivo homógrafo desambiguación utilizando contexto local en grandes corpora de texto" (PDF) . Actas de la 7ma Conferencia Anual del Centro de la UW para la Nueva OED y la Investigación de Texto: Usando Corpora . Oxford . Consultado el 15 de febrero de 2013 .
- ^ Indurkhya, N., Damerau, F. (2010). Manual de procesamiento del lenguaje natural . Chapman y Hall / CRC. pag. 594.CS1 maint: varios nombres: lista de autores ( enlace )
- ^ "Adquisición automática de hipónimos de grandes corpora de texto" (PDF) . Actas de la XIV Conferencia Internacional de Lingüística Computacional . Nantes, Francia. 1992 . Consultado el 15 de febrero de 2013 .
- ^ Fellbaum, C. (1998). WordNet: una base de datos léxica electrónica . Prensa del MIT.
- ^ "Segmentación de varios párrafos de texto expositivo" (PDF) . Actas de la 32ª Reunión Anual de la Asociación de Lingüística Computacional . 32ª Reunión Anual de la Asociación de Lingüística Computacional. Las Cruces, NM. Junio de 1994 . Consultado el 15 de febrero de 2013 .
- ^ "Notas clave de ACM Hypertext 2011" . 22ª Conferencia ACM sobre Hipertexto e Hipermedia . Asociación para Maquinaria de Computación. 2011-06-06. Archivado desde el original el 4 de junio de 2016 . Consultado el 8 de mayo de 2013 .
- ^ Tate, Ryan (15 de enero de 2013). "Facebook anuncia nuevo motor de búsqueda" . Cableado . Wired.com . Consultado el 8 de mayo de 2013 .
- ^ Hearst, Marti A. (1 de noviembre de 2011). " Interfaces de usuario de búsqueda ' natural'" . Comunicaciones de la ACM, vol. 54, N ° 11 . Asociación para Maquinaria de Computación. págs. 60–67 . Consultado el 8 de mayo de 2013 .
- ^ Isaac, Mike (14 de diciembre de 2012). "Twitter lleva Big Data a la escuela" . AllThingsD . Consultado el 8 de mayo de 2013 .
- ^ Keen, Andrew (12 de mayo de 2012). "Interesado en ... Big Data: por qué UC Berkeley podría tener una ventaja sobre Stanford [TCTV]" . TechCrunch.com . Consultado el 8 de mayo de 2013 .
- ^ Yee, Christopher (13 de noviembre de 2012). "Cinco preguntas con Marti Hearst, pionero del 'Big Data'" . The Daily Californian . Universidad de California, Berkeley . Consultado el 8 de mayo de 2013 .
- ^ Hearst, M. (1995). "TileBars: visualización de la información de distribución de términos en el acceso a la información de texto completo" (PDF) . Actas de la Conferencia ACM SIGCHI sobre factores humanos en sistemas informáticos (CHI) . Conferencia ACM SIGCHI sobre factores humanos en sistemas informáticos. Denver, CO . Consultado el 15 de febrero de 2013 .
- ^ Hearst, M. (septiembre de 2000). "Búsqueda web de próxima generación: configuración de nuestros sitios" (PDF) . En Gravano, Luis (ed.). En el Boletín de ingeniería de datos del IEEE . Número especial sobre la búsqueda web de próxima generación . Consultado el 15 de febrero de 2013 .
- ^ Yee, KP., Swearingen, K., Li, K. y Hearst, M. (2003). "Búsqueda y navegación de imágenes de metadatos facetados" (PDF) . en Actas de ACM CHI 2003 . Consultado el 15 de febrero de 2013 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Hearst, Martha Alice (1994). Contexto y estructura en el acceso automatizado a la información de texto completo (tesis doctoral). Universidad de California, Berkeley . OCLC 33496523 . ProQuest 304100421 .
- ^ ACM nombra becarios para los avances informáticos que están transformando la ciencia y la sociedad. Archivado el 22 de julio de 2014 en Wayback Machine , Asociación de maquinaria de computación , consultado el 10 de diciembre de 2013.
enlaces externos
- Página web en UC Berkeley
- Sitio web para el libro de interfaces de usuario de búsqueda (texto disponible y de búsqueda gratuita)
- Proyecto de Navegación y Búsqueda Facetas Flamencas