Entidad nombrada


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En la extracción de información , una entidad nombrada es un objeto del mundo real , como una persona, ubicación, organización, producto, etc., que se puede denotar con un nombre propio . Puede ser abstracto o tener existencia física. Los ejemplos de entidades nombradas incluyen a Barack Obama , la ciudad de Nueva York , Volkswagen Golf o cualquier otra cosa que se pueda nombrar. Las entidades nombradas pueden verse simplemente como instancias de entidad (por ejemplo, la ciudad de Nueva York es una instancia de una ciudad ).

Desde una perspectiva histórica, el término Entidad Nombrada se acuñó durante la campaña de evaluación del MUC-6 [1] y contenía ENAMEX (expresiones del nombre de la entidad, por ejemplo, personas, ubicaciones y organizaciones) y NUMEX (expresión numérica).

Una definición más formal puede derivarse del designador rígido de Saul Kripke . En la expresión "Entidad con nombre", la palabra "Con nombre" tiene como objetivo restringir el posible conjunto de entidades a solo aquellas para las que uno o varios designadores rígidos representan el referente. [2] Un designador es rígido cuando designa lo mismo en todos los mundos posibles. Por el contrario, los designadores flácidos pueden designar diferentes cosas en diferentes mundos posibles.

Como ejemplo, considere la oración, "Biden es el presidente de los Estados Unidos". Tanto "Biden" como los "Estados Unidos" son entidades con nombre ya que se refieren a objetos específicos ( Joe Biden y Estados Unidos ). Sin embargo, "presidente" no es una entidad nombrada, ya que puede usarse para referirse a muchos objetos diferentes en diferentes mundos (en diferentes períodos presidenciales que se refieren a diferentes personas, o incluso en diferentes países u organizaciones que se refieren a diferentes personas). Los designadores rígidos generalmente incluyen nombres propios, así como ciertos términos naturales como especies y sustancias biológicas.

También existe un acuerdo general en la comunidad de reconocimiento de entidades nombradas para considerar las expresiones temporales y numéricas como entidades nombradas, como cantidades de dinero y otros tipos de unidades, que pueden violar la perspectiva rígida del designador.

La tarea de reconocer entidades nombradas en el texto se denomina Reconocimiento de entidades nombradas, mientras que la tarea de determinar la identidad de las entidades nombradas mencionadas en el texto se llama Desambiguación de entidades nombradas . Ambas tareas requieren que se aborden algoritmos y recursos dedicados. [3]

Ver también

Referencias

  1. ^ Grishman, Ralph; Sundheim, Beth (1996). Diseño de la evaluación MUC-6 (PDF) . Procedimientos de TIPSTER '96.
  2. ^ Nadeau, David; Sekine, Satoshi (2007). Una encuesta sobre el reconocimiento y la clasificación de entidades nombradas (PDF) . Investigados Lingvisticae.
  3. ^ Nouvel, Damien; Ehrmann, Maud; Rosset, Sophie (2015). Wiley (ed.). Entidades designadas para la lingüística computacional . ISBN 978-1-84821-838-3.