De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Stata es un paquete de software estadístico de propósito general desarrollado por StataCorp para la manipulación de datos, visualización, estadísticas e informes automatizados. Es utilizado por investigadores en muchos campos, incluidos la economía , la sociología , las ciencias políticas , la biomedicina y la epidemiología . [2] personal StataCorp pronuncian Stata / s t t ə / . [3]

Stata fue desarrollada inicialmente por Computing Resource Center en California y la primera versión fue lanzada en 1985. [4] En 1993, la compañía se mudó a College Station, TX y pasó a llamarse Stata Corporation, ahora conocida como StataCorp. [1] Un lanzamiento importante en 2003 incluyó un nuevo sistema de gráficos y cuadros de diálogo para todos los comandos. [4] Desde entonces, se ha lanzado una nueva versión una vez cada dos años. [5] La versión actual es Stata 17, lanzada en abril de 2021. [6]

Descripción general técnica y terminología [ editar ]

Interfaz de usuario [ editar ]

Stata siempre ha enfatizado una interfaz de línea de comandos, que facilita análisis replicables. Sin embargo, a partir de la versión 8.0, Stata ha incluido una interfaz gráfica de usuario basada en el marco Qt que utiliza menús y cuadros de diálogo para dar acceso a casi todos los comandos integrados. Esto genera código que siempre se muestra, lo que facilita la transición a la interfaz de línea de comandos y un lenguaje de programación más flexible . El conjunto de datos se puede ver o editar en formato de hoja de cálculo. A partir de la versión 11, se pueden ejecutar otros comandos mientras se abre el navegador o el editor de datos.

Estructura y almacenamiento de datos [ editar ]

Hasta el lanzamiento de la versión 16, [7] Stata solo podía abrir un único conjunto de datos a la vez. Stata guarda conjuntos de datos en la memoria ( de acceso aleatorio o virtual ), lo que limita su uso con conjuntos de datos extremadamente grandes. Esto se mitiga en cierta medida mediante un almacenamiento interno eficiente, ya que hay tipos de almacenamiento de enteros que ocupan solo uno o dos bytes en lugar de cuatro, y la precisión simple (4 bytes) en lugar de la precisión doble (8 bytes) es la predeterminada para la flotación. -números de puntos .

El conjunto de datos siempre tiene un formato rectangular, es decir, todas las variables contienen el mismo número de observaciones (en términos más matemáticos, todos los vectores tienen la misma longitud, aunque algunas entradas pueden tener valores perdidos ).

Compatibilidad de formato de datos [ editar ]

Stata puede importar datos en una variedad de formatos. Esto incluye formatos de datos ASCII (como CSV o formatos de banco de datos ) y formatos de hojas de cálculo (incluidos varios formatos de Excel ).

Los formatos de archivo patentados de Stata han cambiado con el tiempo, aunque no todas las versiones de Stata incluyen un nuevo formato de conjunto de datos. Cada versión de Stata puede leer todos los formatos de conjuntos de datos más antiguos y puede escribir tanto el formato de conjunto de datos actual como el más reciente, usando el comando saveold . [8] Por lo tanto, la versión actual de Stata siempre puede abrir conjuntos de datos que se crearon con versiones anteriores, pero las versiones anteriores no pueden leer conjuntos de datos de formato más nuevo.

Stata puede leer y escribir conjuntos de datos en formato SAS XPORT de forma nativa, utilizando los comandos fdause y fdasave .

Algunas otras aplicaciones econométricas , incluido gretl , pueden importar directamente formatos de archivo Stata.

Extensibilidad [ editar ]

Stata permite que los comandos escritos por el usuario, distribuidos como los llamados archivos ado, se descarguen directamente de Internet y que el usuario no pueda distinguirlos de los comandos integrados. En este sentido, Stata combina la extensibilidad asociada más a menudo con los paquetes de código abierto con características generalmente asociadas con paquetes comerciales, como verificación de software , soporte técnico y documentación profesional. StataCorp adoptó posteriormente algunos comandos escritos por el usuario para que se conviertan en parte de un lanzamiento oficial posterior después de la verificación, certificación y documentación adecuadas.

Historia [ editar ]

Orígenes [ editar ]

El desarrollo de Stata comenzó en 1984, inicialmente por William (Bill) Gould y luego por Sean Becketti. Originalmente, el software estaba destinado a competir con programas estadísticos para computadoras personales como SYSTAT y MicroTSP . [4] Stata se escribió, entonces como ahora, en el lenguaje de programación C , inicialmente para PC que ejecutan el sistema operativo DOS . La primera versión fue lanzada en 1985 con 44 comandos. [4]

Desarrollo [ editar ]

Ha habido 17 versiones principales de Stata entre 1985 y 2021, y actualizaciones adicionales de código y documentación entre las versiones principales. [5] En sus primeros años, a veces se vendían conjuntos adicionales de programas Stata como "kits" o se distribuían como discos de soporte. Con el lanzamiento de Stata 6 en 1999, updatelos correos electrónicos comenzaron a entregarse a los usuarios a través de la web. [4]

Se han agregado cientos de comandos a Stata en sus 36 años de historia. [9] [10] Ciertos desarrollos han demostrado ser particularmente importantes y continúan dando forma a la experiencia del usuario en la actualidad, incluida la extensibilidad , la independencia de la plataforma y la comunidad de usuarios activa . [4]

Extensibilidad
El programcomando se implementó en Stata 1.2, lo que brinda a los usuarios la posibilidad de agregar sus propios comandos. [4] [11] ado-files seguidos en Stata 2.1, permitiendo que un programa escrito por el usuario se cargue automáticamente en la memoria. Muchos archivos ado-escritos por el usuario se envían al archivo de componentes de software estadístico (SSC) mantenido por Christopher (Kit) Baum y alojado por Boston College. StataCorp agregó un ssccomando para permitir que los programas contribuidos por la comunidad se agreguen directamente dentro de Stata. [12]
Independencia de plataforma
La versión inicial de Stata fue para el sistema operativo DOS . Desde entonces, se han lanzado versiones de Stata para sistemas que ejecutan variantes de Unix (incluido Linux ), Windows y Macintosh . [4] Los archivos Stata, incluidos los archivos do y los conjuntos de datos guardados, son independientes de la plataforma.
Comunidad de usuarios
La comunidad activa de usuarios de Stata inició una serie de desarrollos importantes. [4] El Boletín Técnico de Stata se introdujo en 1991 y se publicó seis veces al año, lo que ayuda a compartir los comandos aportados por la comunidad. Fue relanzado en 2001 como el Stata Journal revisado por pares , una publicación trimestral que contiene descripciones de comandos contribuidos por la comunidad y consejos para el uso efectivo de Stata. El servidor de listas Statalist comenzó en 1994 y pasó a un formato de foro web en 2014. Las reuniones del Grupo de Usuarios de Stata comenzaron en 1995. El Archivo SSC antes mencionado se lanzó en 1997.

Productos de software [ editar ]

Hay cuatro versiones de Stata: [13]

  • Stata / MP: la edición más rápida de Stata que puede analizar los conjuntos de datos más grandes, para computadoras de cuatro núcleos, dos núcleos y varios núcleos / multiprocesador
  • Stata / SE: edición estándar, para conjuntos de datos más grandes
  • Stata / BE: edición básica, para conjuntos de datos de tamaño medio (anteriormente llamado Stata / IC)
  • Numéricos de Stata: Stata para aplicaciones integradas y web

Stata / MP puede almacenar de 10 a 20 mil millones de observaciones y hasta 120,000 variables. Stata / SE y Stata / BE pueden almacenar cada uno hasta 2,14 mil millones de observaciones y manejar 32,767 variables y 2,048 variables respectivamente. El número máximo de variables independientes en un modelo es 65.532 variables en Stata / MP, 10.998 variables en Stata / SE y 798 variables en Stata / BE. [13]

Los precios y las licencias de Stata dependen del uso previsto: empresarial, gubernamental / sin fines de lucro, educación o estudiante. Las licencias de usuario único son renovables anualmente o perpetuas. Otros tipos de licencias incluyen una licencia única para uso por usuarios concurrentes, una licencia de sitio, un solo usuario por volumen para precios masivos o un laboratorio para estudiantes. [14]

Comunidad de usuarios [ editar ]

Las reuniones de grupos de usuarios se llevan a cabo anualmente en los Estados Unidos (la Conferencia de Stata), el Reino Unido, Alemania e Italia, y con menos frecuencia en varios otros países. StataCorp LP sólo organiza la Conferencia anual de Stata que se lleva a cabo en los Estados Unidos. Los distribuidores locales de Stata organizan reuniones de grupos de usuarios en sus propios países, sin embargo, los desarrolladores de Stata viajan con frecuencia y hacen presentaciones en estas reuniones. Establecido bajo la Ley de Sociedades el 10 de mayo de 2008, el Grupo de Usuarios de Stata de Singapur es el primer grupo de usuarios aprobado por el gobierno del mundo (número de registro: 2048/2008; número de entidad única: T08SS0091A). Su lema es "Dar forma significativa a los datos". Como organización sin fines de lucro, StataUGS no organiza reuniones periódicas, pero proporciona programación y asesoramiento estadístico a los usuarios en Singapur a través de medios informales.Los miembros activos de StataUGS se dedican principalmente a la investigación biomédica.

Código de ejemplo [ editar ]

El siguiente conjunto de comandos gira en torno a la gestión de datos simple. [15]

sysuse automática // Abrir el conjunto de datos incluidos automático de exploración  // Examinar el conjunto de datos (se abre la ventana Editor de datos)describe  // Describe el conjunto de datos y las variables asociadas resume  // Información resumida sobre variables numéricaslibro de códigos make Foreign // Información resumida sobre las variables make (cadena) y foráneas (numéricas)buscar si  faltan (rep78) // Buscar solo observaciones con datos faltantes para la variable rep78 lista hacer si  faltan (rep78) // Listar las marcas de los autos con datos faltantes para la variable rep78

El siguiente conjunto de comandos pasa a la estadística descriptiva.

resumen de precio, detalle // Resumen de estadísticas detalladas para precio variabletabular foráneo // Tabla de frecuencia unidireccional para variable foránea tabular rep78 foráneo, fila // Tabla de frecuencia bidireccional para variables rep78 y foráneoresumir mpg si es extranjero ==  1  // Información resumida sobre mpg si el coche es extranjero (el signo "==" prueba la igualdad) por extranjero, ordenar : resumir mpg // Como arriba, pero usando el prefijo "por". tabular extranjero, resumen (mpg) // Como arriba, pero usando el comando tabular.

Una simple prueba de hipótesis:

tprueba de mpg, por (extranjero) // Prueba T para la diferencia de medias entre automóviles nacionales y extranjeros

Graficar datos:

bidireccional (peso de mpg de dispersión) // Gráfico de dispersión que muestra la relación entre mpg y peso de dos vías (peso de mpg de dispersión), por (extranjero, total ) // Tres gráficos para automóviles nacionales, extranjeros y todos

Regresión lineal:

generar wtsq = peso ^ 2  // Crear una nueva variable para el peso al cuadrado retroceder mpg peso wtsq foráneo, vce (robusto) // Regresión lineal de mpg sobre peso, wtsq y foráneo predecir mpghat // Crear una nueva variable que contenga los valores predichos de mpg bidireccional (peso de mpg de dispersión) (peso de mpg de línea, clasificación ), por (extranjero) // Datos de gráfico y línea ajustada
Gráficos de regresión del conjunto de datos automático en Stata 17

Ver también [ editar ]

  • Lista de paquetes estadísticos
  • Comparación de paquetes estadísticos
  • Análisis de los datos

Referencias [ editar ]

  1. ↑ a b Newton, H. Joseph (2005). "Una conversación con William Gould" . El diario de Stata . 5 (1): 19–31.
  2. ^ "Disciplinas" . Stata: software para estadística y ciencia de datos . Consultado el 21 de abril de 2021 .
  3. ^ Cox, Nicholas J. "Preguntas frecuentes sobre estatistas" . Estatalista: El Foro de Stata . Consultado el 24 de abril de 2021 .
  4. ↑ a b c d e f g h i Cox, Nicholas J. (2005). "Una breve historia de Stata en su 20 aniversario" . El diario de Stata . 5 (1): 2-18 . Consultado el 22 de abril de 2021 .
  5. ^ a b Gould, William W .; Cox, Nicholas J. "¿Cuándo se lanzó Stata por primera vez? ¿Cuándo se lanzaron las versiones posteriores?" . Stata: software para estadística y ciencia de datos . Consultado el 22 de abril de 2021 .
  6. ^ "¿Qué hay de nuevo en Stata?" . Stata: software para estadística y ciencia de datos . StataCorp . Consultado el 22 de abril de 2021 .
  7. ^ "Marcos de datos: múltiples conjuntos de datos en la memoria" . www.stata.com . Consultado el 13 de agosto de 2020 .
  8. ^ "Ayuda de Stata 16 para guardar" . www.stata.com .
  9. ^ Glosario e índice de Stata: versión 17 (PDF) . College Station, TX: Stata Press. págs. 1-50. ISBN  1-59718-283-4.
  10. ^ "Características de Stata" . Stata: software para estadística y ciencia de datos . StataCorp . Consultado el 24 de abril de 2021 .
  11. ^ "programa - Definir y manipular programas" (PDF) . Stata: software para estadística y ciencia de datos . Stata Press . Consultado el 24 de abril de 2021 .
  12. ^ "ssc - Instalar y desinstalar paquetes de SSC" (PDF) . Stata: software para estadística y ciencia de datos . Stata Press . Consultado el 24 de abril de 2021 .
  13. ^ a b "¿Qué Stata es el adecuado para mí?" . Stata: software para estadística y ciencia de datos . Consultado el 23 de abril de 2021 .
  14. ^ "Solicite el software Stata" . Stata: software para estadística y ciencia de datos . StataCorp . Consultado el 25 de abril de 2021 .
  15. ^ Introducción a Stata para Windows (PDF) (Versión 17 ed.). College Station, TX: Stata Press. págs. 1–19. ISBN  1-59718-334-2. Consultado el 25 de abril de 2021 .

Lectura adicional [ editar ]

  • Bittmann, Felix (2019). Stata: una introducción realmente breve . Boston: DeGruyter Oldenbourg. ISBN 978-3-11061-729-0.
  • Pinzón, Enrique, ed. (2015). Treinta años con Stata: una retrospectiva . College Station, Texas: Stata Press. ISBN 978-1-59718-172-3.
  • Hamilton, Lawrence C. (2013). Estadísticas con STATA . Boston: Cengage. ISBN 978-0-84006-463-9.

Enlaces externos [ editar ]

  • Página web oficial
  • Diario de Stata
  • Prensa de Stata