Beautiful Soup (analizador HTML)


Beautiful Soup es un paquete de Python para analizar documentos HTML y XML (incluido el marcado con formato incorrecto, es decir, etiquetas no cerradas, llamadas así por la sopa de etiquetas ). Crea un árbol de análisis para las páginas analizadas que se puede utilizar para extraer datos de HTML, [2] que es útil para web scraping . [1]

Beautiful Soup fue iniciado por Leonard Richardson, quien continúa contribuyendo al proyecto, [3] y además cuenta con el apoyo de Tidelift, una suscripción paga al mantenimiento de código abierto. [4]

Beautiful Soup 3 fue la línea de lanzamiento oficial de Beautiful Soup desde mayo de 2006 hasta marzo de 2012. El lanzamiento actual es Beautiful Soup 4.9.1 (17 de mayo de 2020).
Puede instalar Beautiful Soup 4 con pip install beautifulsoup4.