Scikit-learn (anteriormente scikits.learn y también conocido como sklearn ) es una biblioteca de aprendizaje automático de software gratuito para el lenguaje de programación Python . [3] Cuenta con varias clasificación , regresión y clustering algoritmos incluyendo máquinas de vectores soporte , bosques aleatorios , gradiente de impulsar , k -means y DBSCAN , y está diseñado para interoperar con el numérico Python y bibliotecas científicas NumPy y SciPy .
Autor (es) original (es) | David Cournapeau |
---|---|
Versión inicial | Junio de 2007 |
Lanzamiento estable | 0.24.2 [1] / 28 de abril de 2021 |
Repositorio | |
Escrito en | Python , Cython , C y C ++ [2] |
Sistema operativo | Linux , macOS , Windows |
Tipo | Biblioteca para aprendizaje automático |
Licencia | Nueva licencia BSD |
Sitio web | scikit-learn |
Descripción general
El proyecto scikit-learn comenzó como scikits.learn, un proyecto de Google Summer of Code de David Cournapeau . Su nombre proviene de la noción de que es un "SciKit" (SciPy Toolkit), una extensión de terceros desarrollada y distribuida por separado para SciPy . [4] El código base original fue posteriormente reescrito por otros desarrolladores. En 2010, Fabian Pedregosa, Gael Varoquaux, Alexandre Gramfort y Vincent Michel, todos del Instituto Francés de Investigación en Ciencias de la Computación y Automatización en Rocquencourt , Francia , asumieron el liderazgo del proyecto e hicieron el primer lanzamiento público el 1 de febrero de 2010. [5 ] De los diversos scikits, tanto scikit-learn como scikit-image se describieron como "bien mantenidos y populares" en noviembre de 2012.[actualizar]. [6] Scikit-learn es una de las bibliotecas de aprendizaje automático más populares en GitHub . [7]
Implementación
Scikit-learn está escrito en gran parte en Python y utiliza NumPy ampliamente para operaciones de matriz y álgebra lineal de alto rendimiento. Además, algunos algoritmos centrales están escritos en Cython para mejorar el rendimiento. Las máquinas de vectores de soporte se implementan mediante un contenedor Cython alrededor de LIBSVM ; Regresión logística y máquinas vectoriales de soporte lineal mediante una envoltura similar alrededor de LIBLINEAR . En tales casos, es posible que no sea posible extender estos métodos con Python.
Scikit-learn se integra bien con muchas otras bibliotecas de Python, como Matplotlib y plotly para trazar, NumPy para vectorización de matrices, marcos de datos Pandas , SciPy y muchas más.
Historial de versiones
Scikit-learn fue desarrollado inicialmente por David Cournapeau como un proyecto de verano de código de Google en 2007. Más tarde, Matthieu Brucher se unió al proyecto y comenzó a utilizarlo como parte de su trabajo de tesis. En 2010 , INRIA , el Instituto Francés de Investigación en Ciencias de la Computación y Automatización , se involucró y el primer lanzamiento público (v0.1 beta) se publicó a fines de enero de 2010.
- Enero de 2021. scikit-learn 0.24 [8]
- Mayo de 2020. scikit-learn 0.23.0 [9]
- Diciembre de 2019. scikit-learn 0.22.0 [10]
- Mayo de 2019. scikit-learn 0.21.0 [11]
- Septiembre de 2018. scikit-learn 0.20.0 [12]
- Julio de 2017. scikit-learn 0.19.0
- Septiembre de 2016. scikit-learn 0.18.0
- Noviembre de 2015. scikit-learn 0.17.0 [13]
- Marzo de 2015. scikit-learn 0.16.0 [13]
- Julio de 2014. scikit-learn 0.15.0 [13]
- Agosto de 2013. scikit-learn 0.14 [13]
El cronograma de lanzamientos se muestra en el siguiente cuadro.
Ver también
- mlpy
- ESPACIO
- NLTK
- naranja
- PyTorch
- TensorFlow
- Infer.NET
- Lista de software de análisis numérico
Referencias
- ^ "Lanzamiento 0.24.2" . 28 de abril de 2021 . Consultado el 16 de mayo de 2021 .
- ^ "El proyecto de código abierto scikit-learn en Open Hub: página de idiomas" . Abrir Hub . Consultado el 14 de julio de 2018 .
- ^ Fabián Pedregosa; Gaël Varoquaux; Alexandre Gramfort; Vincent Michel; Bertrand Thirion; Olivier Grisel; Mathieu Blondel; Peter Prettenhofer; Ron Weiss; Vincent Dubourg; Jake Vanderplas; Alexandre Passos; David Cournapeau; Matthieu Perrot; Édouard Duchesnay (2011). "Scikit-learn: Machine Learning en Python" . Revista de investigación sobre aprendizaje automático . 12 : 2825-2830.
- ^ Dreijer, Janto. "scikit-learn" .
- ^ "Sobre nosotros - documentación de scikit-learn 0.20.1" . scikit-learn.org .
- ^ Eli Bressert (2012). SciPy y NumPy: una descripción general para desarrolladores . O'Reilly. pag. 43.
- ^ "El estado del Octoverso: aprendizaje automático" . El blog de GitHub . GitHub . 2019-01-24 . Consultado el 17 de octubre de 2019 .
- ^ scikit-learn: un conjunto de módulos de Python para el aprendizaje automático y la minería de datos , recuperado el 8 de febrero de 2021
- ^ "Historial de versiones - documentación 0.23.0" . scikit-learn . Consultado el 7 de junio de 2020 .
- ^ "Historial de versiones - documentación 0.22.0" . scikit-learn . Consultado el 7 de junio de 2020 .
- ^ "Historial de versiones - documentación 0.21.0" . scikit-learn . Consultado el 5 de mayo de 2019 .
- ^ "Historial de versiones - documentación 0.20.0" . scikit-learn . Consultado el 6 de noviembre de 2018 .
- ^ a b c d "Historial de versiones - documentación de scikit-learn 0.19.dev0" . scikit-learn.org . Consultado el 27 de febrero de 2017 .
enlaces externos
- Página web oficial