Códice OpenAI

OpenAI Codex es un modelo de inteligencia artificial desarrollado por OpenAI . Analiza el lenguaje natural y genera código en respuesta. Se utiliza para impulsar GitHub Copilot , una herramienta de autocompletado de programación desarrollada para Visual Studio Code . ^[1] Codex es un descendiente del modelo GPT-3 de OpenAI , ajustado para su uso en aplicaciones de programación.

Basado en GPT-3, una red neuronal entrenada en texto, Codex también ha sido entrenado en 159 gigabytes de código Python de 54 millones de repositorios de GitHub . ^[2]^[3] Un caso de uso típico de Codex es escribir un comentario, como " //compute the moving average of an array for a given window size", y luego usar la IA para sugerir un bloque de código que satisfaga ese aviso. ^[4] OpenAI ha declarado que Codex puede completar aproximadamente el 37% de las solicitudes y está destinado a hacer que la programación humana sea más rápida en lugar de reemplazarla; según el blog de OpenAI, Codex se destaca más en "mapear [...] problemas simples con el código existente", que describen como "probablemente la parte menos divertida de la programación". ^[5]^[6] Jeremy Howard ,Fast.ai , afirmó que "[Codex] es una forma de escribir código sin tener que escribir tanto código" y que "no siempre es correcto, pero se acerca lo suficiente". ^[7] Según un artículo escrito por investigadores de OpenAI, al intentar cada caso de prueba 100 veces, el 70,2 % de las indicaciones tenían soluciones que funcionaban. ^[8]

OpenAI afirma que Codex puede funcionar en más de una docena de lenguajes de programación, incluidos Go , JavaScript , Perl , PHP , Ruby , Shell , Swift y TypeScript , aunque es más efectivo en Python. ^[1] Según VentureBeat , las demostraciones cargadas por OpenAI mostraron impresionantes capacidades de resolución de correferencia . Los manifestantes pudieron crear un juego de navegador en JavaScript y generar gráficos de ciencia de datos usando matplotlib . ^[6]

OpenAI ha demostrado que Codex puede interactuar con servicios y aplicaciones como Mailchimp , Microsoft Word , Spotify y Google Calendar . ^[6]^[9] Según se informa, Microsoft está interesado en explorar las capacidades de Codex. ^[9]

Las demostraciones de OpenAI mostraron fallas como código ineficiente y peculiaridades únicas en las muestras de código. ^[6] En una entrevista con The Verge , el director de tecnología de OpenAI , Greg Brockman, dijo que "a veces [Codex] no sabe exactamente lo que estás preguntando" y que puede requerir algo de prueba y error. ^[9] Los investigadores de OpenAI descubrieron que Codex tiene dificultades con las indicaciones de varios pasos y de nivel superior, a menudo fallando o produciendo un comportamiento contrario a la intuición. Además, mencionaron varios problemas de seguridad, como el exceso de confianza de los programadores novatos, los sesgos basados en los datos de entrenamiento y los impactos en la seguridad debido a un código vulnerable. ^[8]

VentureBeat ha declarado que debido a que Codex está entrenado en datos públicos, podría ser vulnerable al "envenenamiento de datos" a través de cargas intencionales de código malicioso. ^[6] Según un estudio realizado por investigadores de la Universidad de Nueva York , aproximadamente el 40 % del código generado por GitHub Copilot (que usa Codex) incluía fallas u otros defectos de diseño explotables. ^[10]