jsoup es una biblioteca Java de código abierto diseñada para analizar, extraer y manipular datos almacenados en documentos HTML.
jsoup fue creado en 2009 por Jonathan Hedley. Lo ha distribuido bajo la Licencia MIT , una licencia permisiva de software libre similar a la licencia de atribución Creative Commons .
La intención declarada de Hedley al escribir jsoup era "tratar con todas las variedades de HTML que se encuentran en la naturaleza; desde prístino y validador hasta sopa de etiquetas inválida ".
jsoup se utiliza en una serie de proyectos actuales, [2] incluida la herramienta de gestión de datos OpenRefine de Google.