R (lenguaje de programación)


R es un lenguaje de programación para computación estadística y gráficos compatible con R Core Team y R Foundation for Statistical Computing. Creado por los estadísticos Ross Ihaka y Robert Gentleman , R se utiliza entre los mineros de datos y los estadísticos para desarrollar software estadístico y análisis de datos . Las encuestas, las encuestas de minería de datos y los estudios de bases de datos de literatura académica muestran que R es muy popular; [6] desde diciembre de 2021, R ocupa el puesto 11 en el índice TIOBE , una medida de la popularidad del lenguaje de programación. [7]

El entorno de software oficial de R es un entorno de software libre de código abierto dentro del paquete GNU , disponible bajo la Licencia Pública General GNU . Está escrito principalmente en C , Fortran y R (parcialmente autohospedado ). Se proporcionan ejecutables precompilados para varios sistemas operativos . R tiene una interfaz de línea de comandos . También están disponibles varias interfaces gráficas de usuario de terceros , como RStudio , un entorno de desarrollo integrado , y Jupyter , una interfaz de portátil..

R es una implementación de código abierto del lenguaje de programación S combinado con la semántica de alcance léxico de Scheme , que permite que los objetos se definan en bloques predeterminados en lugar de la totalidad del código. [1] S fue creado por Rick Becker, John Chambers , Doug Dunn, Jean McRae y Judy Schilling en Bell Labs alrededor de 1976. [8] Muchos códigos escritos para S se ejecutan sin alteraciones en R. [9] Scheme fue creado por científicos informáticos Gerald J. Sussman y Guy L. Steele Jr. en el MIT alrededor de 1975. [10]

En 1991, los estadísticos Ross Ihaka y Robert Gentleman de la Universidad de Auckland , Nueva Zelanda, se embarcaron en una implementación S. [11] Fue nombrado en parte por los nombres de los dos primeros autores R y en parte como un juego con el nombre de S. [9] Comenzaron a publicarlo en el archivo de datos StatLib y la lista de correo de s-news en agosto de 1993 . [12] En 1995, estadístico Martin Mächler convencido Ihaka y caballero para hacer Ra software libre y de código abierto bajo la Licencia Pública general de GNU . [12] [13] [14] La primera publicación oficial se produjo en junio de 1995. [12]La Red Integral de Archivos R (CRAN) se anunció oficialmente el 23 de abril de 1997 con 3 réplicas y 12 paquetes contribuidos. [15]

El R Core Team se formó en 1997 para desarrollar aún más el idioma. [9] A partir de 2021 , consta de Chambers, Gentleman, Ihaka y Mächler, además de los estadísticos Douglas Bates, Peter Dalgaard , Kurt Hornik , Michael Lawrence, Friedrich Leisch, Uwe Ligges, Thomas Lumley , Sebastian Meyer, Paul Murrell, Martyn Plummer. , Brian Ripley , Deepayan Sarkar, Duncan Temple Lang, Luke Tierney y Simon Urbanek, así como el científico informático Tomas Kalibera. Stefano Iacus, Guido Masarotto, Heiner Schwarte, Seth Falcon, Martin Morgan y Duncan Murdoch eran miembros. [16] La primera "beta estable" oficialla versión (v1.0) se publicó el 29 de febrero de 2000. [17] [18] En abril de 2003, [19] se fundó la Fundación R como una organización sin fines de lucro para brindar más apoyo al proyecto R. [9]

R y sus bibliotecas implementan varias técnicas estadísticas y gráficas , que incluyen modelado lineal y no lineal , pruebas estadísticas clásicas, análisis espacial y de series de tiempo , clasificación, agrupamiento y otros. R es fácilmente extensible a través de funciones y extensiones, y su comunidad se destaca por contribuir con paquetes. Muchas de las funciones estándar de R están escritas en R, [ cita requerida ] lo que facilita a los usuarios seguir las elecciones algorítmicas realizadas. Para tareas computacionalmente intensivas, se puede vincular código C , C ++ y Fortrany llamado en tiempo de ejecución. Los usuarios avanzados pueden escribir código C, C ++, [20] Java , [21] .NET [22] o Python para manipular objetos R directamente. [23] R es altamente extensible mediante el uso de paquetes para funciones específicas y aplicaciones específicas. Debido a su herencia S , R tiene instalaciones de programación orientada a objetos más sólidas que la mayoría de los lenguajes de computación estadística. [ cita requerida ] Su extensión es facilitada por sus reglas de alcance léxico . [24]


Gráficos de diagnóstico a partir del trazado del “modelo” (función qv “plot.lm ()”). Observe la notación matemática permitida en las etiquetas (gráfico inferior izquierdo).
"Mandelbrot.gif": gráficos creados en R con 14 líneas de código en el Ejemplo 2