Douglass Read Cutting es un diseñador de software y defensor y creador de la tecnología de búsqueda de código abierto . Fundó Lucene y, con Mike Cafarella , Nutch , ambos proyectos de tecnología de búsqueda de código abierto que ahora se gestionan a través de Apache Software Foundation . Cutting y Cafarella también son los cofundadores de Apache Hadoop . [1]
Educación y carrera temprana
Cutting tiene una licenciatura de la Universidad de Stanford . [2]
Antes de desarrollar Lucene, Cutting ocupó puestos de tecnología de búsqueda en Xerox PARC, donde trabajó en el algoritmo Scatter / Gather [3] [4] y en estilística computacional . [5] También trabajó en Excite , donde fue uno de los principales diseñadores del motor de búsqueda , y Apple Inc. , donde fue el autor principal del marco de búsqueda de texto V-Twin . [6]
Proyectos de código abierto
Lucene , un indexador de búsqueda, y Nutch , una araña o rastreador, son los dos componentes clave de una plataforma de búsqueda general de código abierto, que primero rastrea la Web en busca de contenido y luego lo estructura en un índice de búsqueda. El liderazgo de Cutting en estos dos proyectos extendió los conceptos y capacidades de proyectos generales de software de código abierto como Linux y MySQL al dominio vertical de la búsqueda. [7] En un artículo de 2017, Cutting fue citado con la declaración, "el código abierto es un requisito para las empresas". [8]
Uso del paradigma MapReduce
En diciembre de 2004, Google Research publicó un artículo sobre el algoritmo MapReduce , que permite paralelizar trivialmente cálculos a gran escala en grandes grupos de servidores. Cutting y Mike Cafarella , al darse cuenta de la importancia de este documento para extender Lucene al ámbito de los problemas de búsqueda extremadamente grandes, crearon el marco de trabajo Hadoop de código abierto que permite que las aplicaciones basadas en el paradigma MapReduce se ejecuten en grandes grupos de hardware básico. Cutting era un empleado de Yahoo! , donde dirigió el proyecto Hadoop a tiempo completo. Más tarde pasó a trabajar para Cloudera . [9]
Fundaciones y premios de código abierto
En julio de 2009, Cutting fue elegido miembro de la junta directiva de Apache Software Foundation y, en septiembre de 2010, fue elegido su presidente.
En 2015, O'Reilly otorgó un premio de código abierto a Cutting. [10]
Referencias
- ^ Corte, Mike Cafarella, Ben Lorica, Doug (31 de marzo de 2016). "Los próximos 10 años de Apache Hadoop" . O'Reilly Media . Consultado el 16 de abril de 2018 .
- ^ "Equipo directivo de Cloudera" . Cloudera . Consultado el 17 de agosto de 2016 .
- ^ Corte, Douglass R., David R. Karger, Jan O. Pedersen y John W. Tukey. "Dispersión / recopilación: un enfoque basado en clústeres para examinar grandes colecciones de documentos". SIGIR '92 Actas de la 15ª conferencia internacional anual ACM SIGIR sobre investigación y desarrollo en la recuperación de información. (Reimpreso en ACM SIGIR Forum, vol. 51, no. 2, págs. 148-159. ACM, 2017.)
- ^ Pedersen, Jan O., David Karger, Douglass R. Cutting y John W. Tukey. "Scatter-collect: un método y un aparato basados en clústeres para examinar grandes colecciones de documentos". Patente de Estados Unidos 5.442.778, expedida el 15 de agosto de 1995.
- ^ Karlgren, Jussi ; Cortando, Douglass. "Reconocer géneros de texto con métricas simples mediante análisis discriminante". . Actas de la 15ª conferencia sobre Lingüística Computacional-Volumen 2. Asociación de Lingüística Computacional, 1994.
- ^ "El motor de búsqueda de Lucene: potente, flexible y gratuito" . JavaWorld. 2000-09-15 . Consultado el 25 de enero de 2017 .
Cutting es el autor principal del motor de búsqueda V-Twin (parte del esfuerzo del sistema operativo Copland de Apple) ...
- ^ "Wikipedia: Desarrollado por Lucene" . Lucene . Consultado el 5 de septiembre de 2007 .
- ^ "Doug Cutting, 'padre' de Hadoop, habla sobre la evolución de la tecnología de big data" . ComputerWeekly.com . Consultado el 26 de junio de 2018 .
- ^ Handy, Alex (10 de agosto de 2009). "El creador de Hadoop va a Cloudera" . Tiempos de desarrollo de software. Archivado desde el original el 13 de marzo de 2012 . Consultado el 22 de marzo de 2011 .
- ^ "Premios de código abierto O'Reilly - OSCON 2015" . YouTube . O'Reilly . Consultado el 27 de julio de 2015 .
enlaces externos
- "Blog de Doug Cutting" .
- Una entrevista con Doug Cutting
- Entrevista en video de Doug Cutting
- Entrevista de audio con Doug Cutting
- Publicaciones y patentes de Doug Cutting
- Doug Cutting se une a Yahoo!
- Publicación de blog de Tom White sobre Doug Cutting creando Hadoop Tenga en cuenta que esta publicación fue escrita mientras Hadoop todavía era una escisión sin nombre de Nutch . Tom actualiza su publicación anterior con el nombre de Hadoop aquí .
- Artículo escrito en coautoría por Doug Cutting en ACM Queue, 'Building Nutch: Open Source Search'