De Wikipedia, la enciclopedia libre
Ir a navegaciónSaltar a buscar

Diffbot es un desarrollador de algoritmos de aprendizaje automático y visión por computadora y API públicas para extraer datos de páginas web / web scraping para crear una base de conocimientos . La empresa se fundó en 2008 en la Universidad de Stanford y fue la primera empresa financiada por StartX (entonces Stanford Student Enterprises), el fondo de capital de riesgo en el campus de Stanford. [1]

La empresa ha ganado interés por la aplicación de la tecnología de visión por computadora a las páginas web, en las que analiza visualmente una página web en busca de elementos importantes y los devuelve en un formato estructurado . [2] En 2015, Diffbot anunció que estaba trabajando en su versión de un " Gráfico de conocimiento " automatizado rastreando la web y utilizando su extracción automática de páginas web para construir una gran base de datos de datos web estructurados. [3] En 2019, Diffbot lanzó su Gráfico de conocimiento, que desde entonces ha crecido hasta incluir más de 2 mil millones de entidades (corporaciones, personas, artículos, productos, discusiones y más) y 10 billones de "hechos".

Los productos de la compañía permiten a los desarrolladores de software analizar las páginas de inicio de la web y las páginas de artículos, [4] y extraer la "información importante" mientras ignoran los elementos que se consideran no esenciales para el contenido principal. [5]

En agosto de 2012, la empresa lanzó su API Page Classifier, que clasifica automáticamente las páginas web en "tipos de página" específicos. [6] Como parte de esto, Diffbot analizó 750.000 páginas web compartidas en el servicio de redes sociales Twitter y reveló que las fotos, seguidas de artículos y videos, son los medios web predominantes compartidos en la red social. [7]

La compañía recaudó $ 2 millones en fondos en mayo de 2012 de inversionistas como Andy Bechtolsheim y Sky Dayton . [8]

Los clientes de Diffbot incluyen Adobe , AOL , Cisco , DuckDuckGo , eBay , Instapaper , Microsoft , Onswipe y Springpad . [5] [6] [9]

Ver también

Referencias

  1. ^ "Diffbot de fondos de empresas de SSE de Stanford" . TechCrunch. 27 de octubre de 2008 . Consultado el 14 de marzo de 2013 .
  2. ^ "Diffbot permite a los desarrolladores navegar por el código de la forma en que nuestros ojos ven el mundo" . TheNextWeb. 25 de agosto de 2011 . Consultado el 21 de abril de 2013 .
  3. ^ "Startup desata su clon de 'Knowledge Graph ' de Google " . Cableado. 4 de junio de 2015 . Consultado el 15 de junio de 2015 .
  4. ^ "Diffbot ayuda a las aplicaciones a leer la Web como los humanos" . GigaOm. 25 de agosto de 2011 . Consultado el 14 de marzo de 2013 .
  5. ^ a b "Robot de aprendizaje visual de Diffbot de espalda de inversores para contenido web" . El periodico de Wall Street. 31 de mayo de 2012 . Consultado el 14 de marzo de 2013 .
  6. ^ a b "La nueva API de DiffBot revela brillantemente lo que se esconde detrás de cualquier enlace" . 16 de agosto de 2012 . Consultado el 14 de marzo de 2013 .
  7. ^ "Twitter: un día en la vida" . 16 de agosto de 2012 . Consultado el 14 de marzo de 2013 .
  8. ^ "Diffbot recauda $ 2 millones para ayudar a las aplicaciones a comprender la web abierta y no estructurada" . TheVerge. 31 de mayo de 2012 . Consultado el 14 de marzo de 2013 .
  9. ^ "Diffbot supera el gráfico de conocimiento de Google para alimentar la necesidad de datos estructurados" . Forbes . 4 de junio de 2015 . Consultado el 15 de junio de 2015 .

Enlaces externos

  • Sitio web oficial