KNIME ( / n aɪ m / ), Konstanz Information Miner , [2] es una plataforma de análisis, generación de informes e integración de datos de código abierto y gratuita . KNIME integra varios componentes para el aprendizaje automático y la minería de datos a través de su concepto de canalización de datos modular "Lego of Analytics". Una interfaz gráfica de usuario y el uso de JDBC permiten el ensamblaje de nodos que combinan diferentes fuentes de datos, incluido el preprocesamiento ( ETL: extracción, transformación, carga ), para modelado, análisis de datos y visualización sin, o con una programación mínima.
Desarrollador (es) | KNIME |
---|---|
Lanzamiento estable | 4.3.3 / 24 de mayo de 2021 [1] |
Repositorio | |
Sistema operativo | Linux , OS X , Windows |
Disponible en | inglés |
Tipo | Análisis guiado / Informes empresariales / Inteligencia empresarial / Minería de datos / Aprendizaje profundo / Análisis de datos / Minería de texto / Big Data |
Licencia | Licencia pública general GNU |
Sitio web | www |
Desde 2006, KNIME se ha utilizado en la investigación farmacéutica, [3] también se ha utilizado en otras áreas como el análisis de datos de clientes de CRM , inteligencia empresarial , minería de textos y análisis de datos financieros. Recientemente hubo intentos de utilizar KNIME como herramienta de automatización de procesos robóticos (RPA). [4]
La sede de KNIME tiene su sede en Zúrich, con oficinas adicionales en Konstanz, Berlín y Austin (EE. UU.).
Historia
El desarrollo de KNIME se inició en enero de 2004 por un equipo de ingenieros de software de la Universidad de Konstanz como producto patentado. El equipo de desarrolladores original encabezado por Michael Berthold procedía de una empresa de Silicon Valley que proporcionaba software para la industria farmacéutica. El objetivo inicial era crear una plataforma de procesamiento de datos modular, altamente escalable y abierta que permitiera la fácil integración de diferentes módulos de carga, procesamiento, transformación, análisis y exploración visual de datos sin enfocarse en ningún área de aplicación en particular. La plataforma estaba destinada a ser una plataforma de colaboración e investigación y también debería servir como una plataforma de integración para varios otros proyectos de análisis de datos. [5]
En 2006 se lanzó la primera versión de KNIME y varias compañías farmacéuticas comenzaron a utilizar KNIME y varios proveedores de software de ciencias biológicas comenzaron a integrar sus herramientas en KNIME. [6] [7] [8] [9] [10] Más tarde ese mismo año, después de un artículo en la revista alemana c't , [11] usuarios de otras áreas [12] [13] se unieron al barco. A partir de 2012, KNIME está siendo utilizado por más de 15.000 usuarios reales (es decir, sin contar las descargas, sino que los usuarios recuperan regularmente las actualizaciones cuando están disponibles) no solo en las ciencias de la vida y también en bancos, editoriales, fabricantes de automóviles, empresas de telecomunicaciones, consultoras y varias otras industrias, así como en un gran número de grupos de investigación en todo el mundo. Las últimas actualizaciones de KNIME Server y KNIME Big Data Extensions brindan soporte para Apache Spark 2.3, Parquet y almacenamiento de tipo HDFS.
Por sexto año consecutivo, KNIME se ha posicionado como líder en plataformas de ciencia de datos y aprendizaje automático en el Cuadrante Mágico de Gartner .
Internos
KNIME permite a los usuarios crear visualmente flujos de datos (o canalizaciones), ejecutar selectivamente algunos o todos los pasos de análisis, y luego inspeccionar los resultados, modelos, utilizando widgets y vistas interactivas. KNIME está escrito en Java y basado en Eclipse . Hace uso de un mecanismo de extensión para agregar complementos que brindan funcionalidad adicional. La versión principal ya incluye cientos de módulos para la integración de datos (E / S de archivos, nodos de base de datos que admiten todos los sistemas de administración de bases de datos comunes a través de JDBC o conectores nativos: SQLite, MS-Access, SQL Server, MySQL, Oracle, PostgreSQL, Vertica y H2) , transformación de datos (filtro, convertidor, divisor, combinador, ensamblador), así como los métodos de estadística, minería de datos, análisis y análisis de texto más utilizados. La visualización es compatible con la extensión gratuita Report Designer. Los flujos de trabajo de KNIME se pueden utilizar como conjuntos de datos para crear plantillas de informes que se pueden exportar a formatos de documentos como doc, ppt, xls, pdf y otros. Otras capacidades de KNIME son:
- La arquitectura central de KNIME permite el procesamiento de grandes volúmenes de datos que solo están limitados por el espacio disponible en el disco duro (no limitado a la RAM disponible). Por ejemplo, KNIME permite el análisis de 300 millones de direcciones de clientes, 20 millones de imágenes de células y 10 millones de estructuras moleculares.
- Los complementos adicionales permiten la integración de métodos para minería de texto , minería de imágenes, así como análisis de series de tiempo y redes.
- KNIME integra varios otros proyectos de código abierto, por ejemplo, algoritmos de aprendizaje automático de Weka , H2O.ai , Keras , Spark , el proyecto R y LIBSVM ; además de plotly , JFreeChart , ImageJ y el kit de desarrollo químico . [14]
KNIME está implementado en Java, sin embargo, permite que los envoltorios llamen a otro código, además de proporcionar nodos que permiten ejecutar Java , Python , R , Ruby y otros fragmentos de código.
Licencia
A partir de la versión 2.1, KNIME se publica bajo GPLv3 con una excepción que permite a otros usar la API de nodo bien definida para agregar extensiones propietarias. [15] Esto también permite a los proveedores comerciales de software agregar envoltorios llamando a sus herramientas desde KNIME.
Cursos KNIME
KNIME ofrece dos líneas de cursos en línea basados en las líneas Data Wrangling y Data Science. [dieciséis]
Ver también
- Weka : algoritmos de aprendizaje automático que se pueden integrar en KNIME
- ELKI : marco de minería de datos con muchos algoritmos de agrupación
- Keras - biblioteca de redes neuronales
- Orange : un kit de herramientas de visualización de datos de código abierto, aprendizaje automático y minería de datos con una interfaz de programación visual similar
- Lista de paquetes de software gratuitos y de código abierto
Referencias
- ^ "Novedades de KNIME Analytics Platform 4.0 y KNIME Server 4.9" . knime.com .
- ^ Berthold, Michael R .; Cebron, Nicolas; Eneldo, Fabián; Gabriel, Thomas R .; Kötter, Tobias; Meinl, Thorsten; Oh, Peter; Thiel, Kilian; Wiswedel, Bernd (16 de noviembre de 2009). "KNIME - el minero de información de Konstanz" (PDF) . Boletín de exploración de ACM SIGKDD . 11 (1): 26. doi : 10.1145 / 1656274.1656280 . S2CID 408188 .
- ^ Tiwari, Abhishek; Sekhar, Arvind KT (octubre de 2007). "Marco basado en flujo de trabajo para informática de ciencias de la vida". Biología y Química Computacional . 31 (5–6): 305–319. doi : 10.1016 / j.compbiolchem.2007.08.009 . PMID 17931570 .
- ^ "Bot de plataforma KNIME Analytics" .,
- ^ "Abierto a la Innovación" . KNIME.com .
- ^ Tripos, Inc. Archivado el 17 de julio de 2011 en la Wayback Machine.
- ^ Schrödinger Archivado el 25 de septiembre de 2009 en la Wayback Machine.
- ^ ChemAxon Archivado el 17 de julio de 2011 en la Wayback Machine.
- ^ NovaMechanics Ltd.
- ^ Consultores Treweren
- ^ Minería de datos Datenbank-Mosaik oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
- ^ Forum auf der KNIME Webseite
- ^ "Omnipresente" . Archivado desde el original el 29 de agosto de 2010 . Consultado el 7 de diciembre de 2010 .
- ^ Beisken, S .; Meinl, T .; Wiswedel, B .; De Figueiredo, LF; Berthold, M .; Steinbeck, C. (2013). "KNIME-CDK: Quiminformática impulsada por el flujo de trabajo" . BMC Bioinformática . 14 : 257. doi : 10.1186 / 1471-2105-14-257 . PMC 3765822 . PMID 24103053 .
- ^ KNIME 2.1.0 lanzado Archivado el 17 de abril de 2010 en la Wayback Machine.
- ^ la nueva ruta de aprendizaje
enlaces externos
- Página de inicio de KNIME
- Nodepit : colección de nodos KNIME que admite el control de versiones y la instalación de nodos