operaciones de datos


DataOps es una metodología automatizada y orientada a procesos, utilizada por equipos analíticos y de datos, para mejorar la calidad y reducir el tiempo de ciclo del análisis de datos . Si bien DataOps comenzó como un conjunto de mejores prácticas, ahora ha madurado para convertirse en un enfoque nuevo e independiente para el análisis de datos. [1] DataOps se aplica a todo el ciclo de vida de los datos [2] desde la preparación de los datos hasta la generación de informes, y reconoce la naturaleza interconectada del equipo de análisis de datos y las operaciones de tecnología de la información. [3]

DataOps incorpora la metodología Agile para acortar el tiempo del ciclo de desarrollo analítico en consonancia con los objetivos comerciales. [2]

DevOps se centra en la entrega continua aprovechando los recursos de TI bajo demanda y automatizando las pruebas y la implementación de software. Esta fusión del desarrollo de software y las operaciones de TI ha mejorado la velocidad, la calidad, la previsibilidad y la escala de la ingeniería y el despliegue de software. Tomando prestados métodos de DevOps, DataOps busca traer estas mismas mejoras al análisis de datos. [3]

DataOps utiliza el control de procesos estadísticos (SPC) para monitorear y controlar la canalización de análisis de datos. Con SPC implementado, los datos que fluyen a través de un sistema operativo se monitorean y verifican constantemente para que funcionen. Si ocurre una anomalía, el equipo de análisis de datos puede ser notificado a través de una alerta automática. [4]

DataOps no está vinculado a una tecnología, arquitectura, herramienta, lenguaje o marco en particular. Las herramientas que admiten DataOps promueven la colaboración, la orquestación, la calidad, la seguridad, el acceso y la facilidad de uso. [5]

DataOps fue presentado por primera vez por Lenny Liebmann, editor colaborador de InformationWeek, en una publicación de blog en IBM Big Data & Analytics Hub titulada "3 razones por las que DataOps es esencial para el éxito de big data " el 19 de junio de 2014. [6] El término DataOps más tarde fue popularizado por Andy Palmer de Tamr y Steph Locke. [7] [3] DataOps es un apodo para "Operaciones de datos". [2] 2017 fue un año importante para DataOps con un desarrollo significativo del ecosistema, cobertura de analistas, búsquedas de palabras clave aumentadas, encuestas, publicaciones y proyectos de código abierto. [8] Gartner nombró a DataOps en el Hype Cycle para la gestión de datos en 2018. [9]


Herencia de DataOps de DevOps, Agile y fabricación