Kaggle , una subsidiaria de Google LLC , es una comunidad en línea de científicos de datos y profesionales del aprendizaje automático . Kaggle permite a los usuarios encontrar y publicar conjuntos de datos, explorar y construir modelos en un entorno de ciencia de datos basado en la web, trabajar con otros científicos de datos e ingenieros de aprendizaje automático y participar en concursos para resolver los desafíos de la ciencia de datos.
Tipo | Subsidiario |
---|---|
Industria | Ciencia de los datos |
Fundado | Abril de 2010 |
Fundador | Anthony Goldbloom , Ben Hamner |
Sede | San Francisco, Estados Unidos |
Gente clave | Anthony Goldbloom (CEO) Ben Hamner (CTO) Jeff Moser (Arquitecto jefe) |
Productos | Competiciones, Kaggle Kernels, Kaggle Datasets, Kaggle Learn |
Dueño | Alphabet Inc. (2017-presente) |
Padre | Google (2017-presente) |
Sitio web | kaggle |
Kaggle comenzó en 2010 ofreciendo competencias de aprendizaje automático y ahora también ofrece una plataforma de datos pública, un banco de trabajo basado en la nube para ciencia de datos y educación en inteligencia artificial. Su personal clave fueron Anthony Goldbloom y Jeremy Howard . Nicholas Gruen fue presidente fundador sucedido por Max Levchin . El capital social se recaudó en 2011 valorando la empresa en $ 25 millones. El 8 de marzo de 2017, Google anunció que estaban adquiriendo Kaggle. [1] [2]
Comunidad de Kaggle
En junio de 2017, Kaggle anunció que superó el millón de usuarios registrados, o Kagglers. [3] La comunidad se extiende por 194 países. Es una comunidad diversa, que va desde aquellos que recién comienzan hasta muchos de los investigadores más conocidos del mundo. [4]
Las competiciones de Kaggle atraen regularmente a más de mil equipos e individuos. La comunidad de Kaggle tiene miles de conjuntos de datos públicos y fragmentos de código (llamados "núcleos" en Kaggle). Muchos de estos investigadores publican artículos en revistas revisadas por pares en función de su desempeño en las competencias de Kaggle. [5]
En marzo de 2017, el fondo Two Sigma Investments estaba realizando una competencia en Kaggle para codificar un algoritmo comercial. [6]
Servicios de Kaggle
- Concursos de aprendizaje automático : este fue el primer producto de Kaggle. Las empresas publican problemas y los aprendices de máquinas compiten para construir el mejor algoritmo, generalmente con premios en efectivo.
- Kaggle Kernels : un banco de trabajo basado en la nube para ciencia de datos y aprendizaje automático. Permite a los científicos de datos compartir código y análisis en Python, R y R Markdown. Se han compartido más de 150.000 "núcleos" (fragmentos de código) en Kaggle que cubren todo, desde el análisis de sentimientos hasta la detección de objetos.
- Plataforma de conjuntos de datos públicos : los miembros de la comunidad comparten conjuntos de datos entre sí. Tiene conjuntos de datos sobre todo, desde radiografías de huesos hasta resultados de peleas de boxeo.
- Kaggle Learn : una plataforma para la educación de IA en partes manejables.
Cómo funcionan las competiciones de Kaggle
- El anfitrión de la competencia prepara los datos y una descripción del problema.
- Los participantes experimentan con diferentes técnicas y compiten entre sí para producir los mejores modelos. El trabajo se comparte públicamente a través de Kaggle Kernels para lograr un mejor punto de referencia e inspirar nuevas ideas. Los envíos se pueden realizar a través de Kaggle Kernels, mediante la carga manual o utilizando la API de Kaggle . Para la mayoría de las competiciones, las presentaciones se califican de inmediato (según su precisión predictiva en relación con un archivo de solución oculto) y se resumen en una tabla de clasificación en vivo.
- Una vez transcurrido el plazo, el anfitrión del concurso paga el dinero del premio a cambio de "una licencia mundial, perpetua, irrevocable y libre de regalías [...] para utilizar la Participación ganadora", es decir, el algoritmo, el software y la propiedad intelectual relacionada desarrollados. que es "no exclusivo a menos que se especifique lo contrario". [7]
Además de sus competencias públicas, Kaggle también ofrece competencias privadas limitadas a los mejores participantes de Kaggle. Kaggle ofrece una herramienta gratuita para que los profesores de ciencia de datos realicen competencias académicas de aprendizaje automático, Kaggle In Class . [8] Kaggle también organiza concursos de reclutamiento en los que los científicos de datos compiten por la oportunidad de entrevistarse en empresas líderes en ciencia de datos como Facebook , Winton Capital y Walmart .
Impacto de las competiciones de Kaggle
Kaggle ha realizado cientos de concursos de aprendizaje automático desde que se fundó la empresa. Las competiciones van desde mejorar el reconocimiento de gestos para Microsoft Kinect [9] hasta hacer una IA de fútbol para el Manchester City o mejorar la búsqueda del bosón de Higgs en el CERN . [10]
Las competiciones han dado lugar a muchos proyectos exitosos que incluyen la promoción del estado del arte en la investigación del VIH, [11] calificaciones de ajedrez [12] y pronósticos de tráfico. [13] El más famoso es que Geoffrey Hinton y George Dahl usaron redes neuronales profundas para ganar una competencia organizada por Merck . Y Vlad Mnih (uno de los estudiantes de Hinton) usó redes neuronales profundas para ganar una competencia organizada por Adzuna. Esto ayudó a mostrar el poder de las redes neuronales profundas y dio como resultado que otros miembros de la comunidad de Kaggle adoptaran la técnica. Tianqi Chen de la Universidad de Washington también usó Kaggle para mostrar el poder de XGBoost , que desde entonces ha reemplazado a Random Forest como uno de los principales métodos utilizados para ganar competencias de Kaggle.
Se han publicado varios artículos académicos sobre la base de los hallazgos realizados en los concursos de Kaggle. [14] Una clave para esto es el efecto de la tabla de clasificación en vivo, que anima a los participantes a seguir innovando más allá de las mejores prácticas existentes. [15] Los métodos ganadores se escriben con frecuencia en el blog de Kaggle , Kaggle Winner's Blog .
Finanzas
En marzo de 2017, Fei-Fei Li , directora científica de Google, anunció que Google iba a adquirir Kaggle durante su discurso de apertura en Google Next. [dieciséis]
Ver también
- Plataforma de competencia de ciencia de datos
- Anthony Goldbloom
Referencias
- ^ Lardinois, Frederic; Mannes, John; Lynley, Matthew (8 de marzo de 2017). "Google está adquiriendo la comunidad de ciencia de datos Kaggle" . Techcrunch . Archivado desde el original el 9 de marzo de 2017 . Consultado el 9 de marzo de 2017 .
Las fuentes nos dicen que Google está adquiriendo Kaggle [...] y el anuncio oficial podría llegar mañana.
- ^ "Google compra Kaggle y su pandilla de geeks de IA" . CNET . 2017-03-08 . Consultado el 1 de junio de 2018 .
- ^ "Hemos superado el millón de miembros" . Blog del ganador de Kaggle . 2017-06-06 . Consultado el 19 de agosto de 2018 .
- ^ Markoff, John. "Los científicos ven avances en el aprendizaje profundo, una parte de la inteligencia artificial" . Consultado el 19 de agosto de 2018 .
- ^ "Google Académico" . scholar.google.com . Consultado el 19 de agosto de 2018 .
- ^ Wigglesworth, Robin (8 de marzo de 2017). "Los fondos de cobertura adoptan métodos novedosos para cazar nuevos talentos tecnológicos" . The Financial Times . Reino Unido . Consultado el 29 de octubre de 2017 .
- ^ Kaggle. "Términos y condiciones - Kaggle" .
- ^ Kaggle. "Kaggle en clase" . Archivado desde el original el 16 de junio de 2011 . Consultado el 12 de agosto de 2011 .
- ^ Byrne, Ciara (12 de diciembre de 2011). "Kaggle lanza un concurso para ayudar a Microsoft Kinect a aprender nuevos gestos" . VentureBeat . Consultado el 13 de diciembre de 2011 .
- ^ "La comunidad de aprendizaje automático se enfrenta al Higgs" . Revista Symmetry . 15 de julio de 2014 . Consultado el 14 de enero de 2015 .
- ^ Carpenter, Jennifer (febrero de 2011). "Que gane el mejor analista" . Revista de ciencia . Consultado el 1 de abril de 2011 .
- ^ Sonas, Jeff (20 de febrero de 2011). "The Deloitte / FIDE Chess Rating Challenge" . Chessbase . Consultado el 3 de mayo de 2011 .
- ^ Foo, Fran (6 de abril de 2011). "¿Teléfonos inteligentes para predecir los tiempos de viaje a Nueva Gales del Sur?" . El australiano . Consultado el 3 de mayo de 2011 .
- ^ "Taller NIPS 2014 sobre Física de Altas Energías y Aprendizaje Automático" . JMLR W&CP . 42 .
- ^ Athanasopoulos, George; Hyndman, Rob (2011). "El valor de la retroalimentación en la previsión de competencias" (PDF) . Revista Internacional de Pronósticos . 27 . págs. 845–849.
- ^ "Bienvenido Kaggle a Google Cloud" . Blog de Google Cloud Platform . Consultado el 19 de agosto de 2018 .
Otras lecturas
- "La competencia arroja luz sobre la materia oscura", Oficina de Política Científica y Tecnológica, sitio web de Whitehouse, junio de 2011
- "Que gane el mejor algoritmo ...", The Wall Street Journal , marzo de 2011
- "El concurso de Kaggle tiene como objetivo impulsar a los editores de Wikipedia", New Scientist , julio de 2011
- "Verificación de la investigación en biología de sistemas en la era de la competencia colaborativa", Nature Nanotechnology , septiembre de 2011
enlaces externos
- Página web oficial
- Blog de Kaggle Winner , el blog de Kaggle