AMiner (base de datos)


AMiner (anteriormente ArnetMiner ) es un servicio en línea gratuito que se utiliza para indexar, buscar y extraer grandes datos científicos .

AMiner (ArnetMiner) está diseñado para buscar y realizar operaciones de minería de datos contra publicaciones académicas en Internet , utilizando el análisis de redes sociales para identificar conexiones entre investigadores, congresos y publicaciones. [1] Esto le permite brindar servicios como búsqueda de expertos, búsqueda geográfica, análisis de tendencias, recomendación de revisores, búsqueda de asociaciones, búsqueda de cursos, evaluación del desempeño académico y modelado de temas.

AMiner se creó como un proyecto de investigación en análisis de influencia social, clasificación de redes sociales y extracción de redes sociales. Se han publicado varios artículos revisados ​​por pares que surgen del desarrollo del sistema. Lleva más de tres años en funcionamiento y ha indexado 130.000.000 de investigadores y más de 265 millones de publicaciones. [2] La investigación fue financiada por el Programa Nacional Chino de Investigación y Desarrollo de Alta Tecnología y la Fundación Nacional de Ciencias de China .

AMiner se usa comúnmente en la academia para identificar relaciones y dibujar correlaciones estadísticas sobre investigaciones e investigadores. Ha atraído más de 10 millones de accesos IP independientes de 220 países y regiones. El producto se ha utilizado en la plataforma SciVerse de Elsevier , [3] y conferencias académicas como SIGKDD, ICDM, PKDD, WSDM.

AMiner extrae automáticamente el perfil del investigador de la web. Recopila e identifica las páginas relevantes, luego utiliza un enfoque unificado para extraer datos de los documentos identificados. También extrae publicaciones de bibliotecas digitales en línea utilizando reglas heurísticas.

Integra los perfiles de los investigadores extraídos y las publicaciones extraídas. Emplea el nombre del investigador como identificador. Se ha propuesto un marco probabilístico para tratar el problema de la ambigüedad del nombre en la integración. Los datos integrados se almacenan en una base de conocimiento de red de investigadores (RNKB).