pandas es una biblioteca de software escrita para el lenguaje de programación Python para la manipulación y el análisis de datos. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series de tiempo . Es un software gratuito publicado bajo la licencia BSD de tres cláusulas . [2] El nombre se deriva del término " datos de panel ", un término econométrico para conjuntos de datos que incluyen observaciones durante múltiples períodos de tiempo para las mismas personas. [3] Su nombre es un juego de palabras con la frase "análisis de datos de Python". [4] Wes McKinneycomenzó a construir lo que se convertirían en pandas en AQR Capital mientras era investigador allí de 2007 a 2010. [5]
Autor (es) original (es) | Wes McKinney |
---|---|
Desarrollador (es) | Comunidad |
Versión inicial | 11 de enero de 2008 cita requerida ] | [
Lanzamiento estable | 1.2.4 [1] / 12 de abril de 2021 |
Repositorio | |
Escrito en | Python , Cython , C |
Sistema operativo | Multiplataforma |
Tipo | Computación técnica |
Licencia | Nueva licencia BSD |
Sitio web | pandas |
Funciones de la biblioteca
- Objeto DataFrame para manipulación de datos con indexación integrada.
- Herramientas para leer y escribir datos entre estructuras de datos en memoria y diferentes formatos de archivo.
- Alineación de datos y manejo integrado de datos faltantes.
- Remodelación y pivotación de conjuntos de datos.
- Segmentación basada en etiquetas, indexación elegante y subconjunto de grandes conjuntos de datos.
- Inserción y eliminación de columnas de estructura de datos.
- Agrupar por motor que permite operaciones dividir-aplicar-combinar en conjuntos de datos.
- Combinación y unión de conjuntos de datos.
- Indexación de ejes jerárquicos para trabajar con datos de alta dimensión en una estructura de datos de menor dimensión.
- Funcionalidad de series de tiempo: generación de rango de fechas [6] y conversión de frecuencia, estadísticas de ventana móvil, regresiones lineales de ventana móvil, cambio de fecha y retraso.
- Proporciona filtración de datos.
La biblioteca está muy optimizado para el rendimiento, con rutas de código críticos escritos en Cython o C . [7]
Marcos de datos
Pandas se utiliza principalmente para el análisis de datos . Pandas permite importar datos de varios formatos de archivo, como valores separados por comas , JSON , SQL , Microsoft Excel . [8] Pandas permite varias operaciones de manipulación de datos, como la fusión, [9] remodelación, [10] selección, [11] así como la limpieza de datos y funciones de disputa de datos .
Historia
El desarrollador Wes McKinney comenzó a trabajar en pandas en 2008 mientras trabajaba en AQR Capital Management debido a la necesidad de una herramienta flexible y de alto rendimiento para realizar análisis cuantitativos de datos financieros. Antes de dejar AQR, pudo convencer a la gerencia para que le permitiera abrir la biblioteca con código abierto .
Otro empleado de AQR, Chang She, se unió al esfuerzo en 2012 como el segundo contribuyente importante a la biblioteca.
En 2015, los pandas firmaron como un proyecto patrocinado fiscalmente de NumFOCUS , una organización benéfica sin fines de lucro 501 (c) (3) en los Estados Unidos. [12]
Ver también
- matplotlib
- NumPy
- Ciencia
- R (lenguaje de programación)
- Scikit-aprender
- statsmodels
- Lista de software de análisis numérico
Referencias
- ^ "Versión 1.2.4" . 12 de abril de 2021 . Consultado el 13 de abril de 2021 .
- ^ "Licencia - Descripción general del paquete - documentación de pandas 1.0.0" . pandas . 28 de enero de 2020 . Consultado el 30 de enero de 2020 .
- ^ Wes McKinney (2011). "pandas: una biblioteca de Python fundamental para el análisis de datos y estadísticas" (PDF) . Consultado el 2 de agosto de 2018 .
- ^ McKinney, Wes (2017). Python para análisis de datos, segunda edición . O'Reilly Media. pag. 5. ISBN 9781491957660.
- ^ Kopf, Dan. "Conozca al hombre detrás de la herramienta más importante en ciencia de datos" . Cuarzo . Consultado el 17 de noviembre de 2020 .
- ^ "pandas.date_range - documentación de pandas 1.0.0" . pandas . 29 de enero de 2020 . Consultado el 30 de enero de 2020 .
- ^ "Biblioteca de análisis de datos de Python - pandas: Biblioteca de análisis de datos de Python" . pandas . Consultado el 13 de noviembre de 2017 .
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
- ^ "NumFOCUS - pandas: un proyecto patrocinado fiscalmente" . NumFOCUS . Consultado el 3 de abril de 2018 .
Otras lecturas
- Chen, Daniel Y. (2018). Pandas para todos: análisis de datos de Python . Boston: Addison-Wesley. ISBN 978-0-13-454693-3.
- McKinney, Wes (2017). Python para el análisis de datos: lucha de datos con Pandas, NumPy e IPython (2ª ed.). Sebastopol: O'Reilly. ISBN 978-1-4919-5766-0.
- VanderPlas, Jake (2016). "Manipulaciones de datos con pandas". Manual de ciencia de datos de Python: herramientas esenciales para trabajar con datos . O'Reilly. págs. 97–216. ISBN 978-1-4919-1205-8.
- Pathak, Chankey (2018). "Libro de cocina de Pandas". Libro de cocina de Pandas . págs. 1–8.
enlaces externos
- Página web oficial