De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La determinación del tamaño de la muestra es el acto de elegir el número de observaciones o réplicas para incluir en una muestra estadística . El tamaño de la muestra es una característica importante de cualquier estudio empírico en el que el objetivo es hacer inferencias sobre una población a partir de una muestra. En la práctica, el tamaño de la muestra que se utiliza en un estudio generalmente se determina en función del costo, el tiempo o la conveniencia de recopilar los datos y la necesidad de que ofrezcan suficiente poder estadístico . En estudios complicados puede haber varios tamaños de muestra diferentes: por ejemplo, en una encuesta estratificada habría diferentes tamaños para cada estrato. En un censo, se buscan datos para toda una población, por lo que el tamaño de muestra previsto es igual al de la población. En el diseño experimental , donde un estudio puede dividirse en diferentes grupos de tratamiento , puede haber diferentes tamaños de muestra para cada grupo.

Los tamaños de muestra se pueden elegir de varias formas:

  • Uso de la experiencia: las muestras pequeñas, aunque a veces inevitables, pueden generar amplios intervalos de confianza y riesgo de errores en la prueba de hipótesis estadísticas .
  • utilizar una varianza objetivo para obtener una estimación a partir de la muestra finalmente obtenida, es decir, si se requiere una alta precisión (intervalo de confianza estrecho), esto se traduce en una baja varianza objetivo del estimador.
  • usando un objetivo para el poder de una prueba estadística que se aplicará una vez que se recolecte la muestra.
  • utilizando un nivel de confianza, es decir, cuanto mayor sea el nivel de confianza requerido, mayor será el tamaño de la muestra (dado un requisito de precisión constante).

Introducción [ editar ]

Los tamaños de muestra más grandes generalmente conducen a una mayor precisión al estimar parámetros desconocidos. Por ejemplo, si deseamos conocer la proporción de una determinada especie de pez que está infectada con un patógeno, por lo general tendríamos una estimación más precisa de esta proporción si muestreamos y examinamos 200 en lugar de 100 peces. Varios hechos fundamentales de la estadística matemática describen este fenómeno, incluida la ley de los grandes números y el teorema del límite central .

En algunas situaciones, el aumento de precisión para tamaños de muestra más grandes es mínimo o incluso inexistente. Esto puede resultar de la presencia de errores sistemáticos o de una fuerte dependencia en los datos, o si los datos siguen una distribución de cola gruesa.

Los tamaños de las muestras pueden evaluarse por la calidad de las estimaciones resultantes. Por ejemplo, si se está estimando una proporción, se puede desear que el intervalo de confianza del 95% tenga menos de 0,06 unidades de ancho. Alternativamente, el tamaño de la muestra puede evaluarse según el poder de una prueba de hipótesis. Por ejemplo, si comparamos el apoyo a un determinado candidato político entre las mujeres con el apoyo a ese candidato entre los hombres, es posible que deseemos tener un poder del 80% para detectar una diferencia en los niveles de apoyo de 0,04 unidades.

Estimación [ editar ]

Estimación de una proporción [ editar ]

Una situación relativamente simple es la estimación de una proporción . Por ejemplo, es posible que deseemos estimar la proporción de residentes en una comunidad que tienen al menos 65 años.

El estimador de una proporción es , donde X es el número de observaciones "positivas" (por ejemplo, el número de personas de las n personas de la muestra que tienen al menos 65 años de edad). Cuando las observaciones son independientes , este estimador tiene una distribución binomial (escalada) (y también es la media muestral de los datos de una distribución de Bernoulli ). La varianza máxima de esta distribución es 0.25 n , que ocurre cuando el parámetro verdadero es p = 0.5. En la práctica, desde p se desconoce, la varianza máxima se utiliza a menudo para evaluaciones del tamaño de la muestra. Si se conoce una estimación razonable de p, se puede utilizar la cantidad en lugar de 0,25.

Para n suficientemente grande , la distribución de se aproximará mucho a una distribución normal . [1] Utilizando este y el método de Wald para la distribución binomial , se obtiene un intervalo de confianza de la forma

,
donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).

Si deseamos tener un intervalo de confianza con un ancho total de W unidades (W / 2 en cada lado de la media muestral), resolveríamos

para n , obteniendo el tamaño de la muestra

, en el caso de utilizar 0,5 como la estimación más conservadora de la proporción. (Nota: W / 2 = margen de error ).

De lo contrario, la fórmula sería , que cede .

Por ejemplo, si estamos interesados ​​en estimar la proporción de la población estadounidense que apoya a un candidato presidencial en particular, y queremos que el intervalo de confianza del 95% sea como máximo 2 puntos porcentuales (0.02), entonces necesitaríamos un tamaño de muestra de (1,96 2 ) / (0,02 2 ) = 9604. Es razonable utilizar la estimación de 0,5 para p en este caso porque las carreras presidenciales suelen estar cerca de 50/50, y también es prudente utilizar una estimación conservadora. El margen de error en este caso es de 1 punto porcentual (la mitad de 0,02).

Lo anterior comúnmente se simplifica ...

formará un intervalo de confianza del 95% para la proporción verdadera. Si este intervalo no debe tener más de W unidades de ancho, la ecuación

puede ser resuelto para n , produciendo [2] [3] n  = 4 / W 2  = 1 / B 2 donde B es la cota de error en la estimación, es decir, la estimación se da generalmente como dentro de ± B . Entonces, para B = 10% se requiere n = 100, para B = 5% se necesita n = 400, para B = 3% el requisito se aproxima an = 1000, mientras que para B = 1% un tamaño de muestra de n = 10000 se requiere. Estos números se citan a menudo en informes de noticias de encuestas de opinión y otrosencuestas por muestreo . Sin embargo, recuerde siempre que los resultados informados pueden no ser el valor exacto, ya que los números se redondean preferiblemente. Sabiendo que el valor de n es el número mínimo de puntos muestrales necesarios para adquirir el resultado deseado, el número de encuestados debe estar por encima del mínimo.

Estimación de una media [ editar ]

Una proporción es un caso especial de media. Al estimar la media poblacional usando una muestra independiente e idénticamente distribuida (iid) de tamaño n , donde cada valor de datos tiene una varianza σ 2 , el error estándar de la media muestral es:

Esta expresión describe cuantitativamente cómo la estimación se vuelve más precisa a medida que aumenta el tamaño de la muestra. El uso del teorema del límite central para justificar la aproximación de la media muestral con una distribución normal produce un intervalo de confianza de la forma

,
donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).

Si deseamos tener un intervalo de confianza con un ancho total de W unidades (W / 2 en cada lado de la media muestral), resolveríamos

para n , obteniendo el tamaño de la muestra

. (Nota: W / 2 = margen de error ).

Por ejemplo, si estamos interesados ​​en estimar la cantidad en que un fármaco reduce la presión arterial de un sujeto con un intervalo de confianza del 95% que es de seis unidades de ancho, y sabemos que la desviación estándar de la presión arterial en la población es 15, entonces la El tamaño de muestra requerido es , que se redondearía a 97, porque el valor obtenido es el tamaño de muestra mínimo , y los tamaños de muestra deben ser números enteros y deben estar por encima del mínimo calculado.

Tamaños de muestra requeridos para pruebas de hipótesis [ editar ]

Un problema común al que se enfrentan los estadísticos es calcular el tamaño de muestra requerido para producir una determinada potencia para una prueba, dada una tasa de error de tipo I predeterminada α. De la siguiente manera, esto se puede estimar mediante tablas predeterminadas para ciertos valores, mediante la ecuación de recursos de Mead o, más generalmente, mediante la función de distribución acumulativa :

Tablas [ editar ]

La tabla que se muestra a la derecha se puede usar en una prueba t de dos muestras para estimar los tamaños de muestra de un grupo experimental y un grupo de control que son del mismo tamaño, es decir, el número total de individuos en el ensayo es el doble que del número dado, y el nivel de significancia deseado es 0.05. [4] Los parámetros utilizados son:

  • El poder estadístico deseado del ensayo, que se muestra en la columna de la izquierda.
  • D de Cohen (= tamaño del efecto), que es la diferencia esperada entre las medias de los valores objetivo entre el grupo experimental y el grupo de control , dividida por la desviación estándar esperada .

Ecuación de recursos de Mead [ editar ]

La ecuación de recursos de Mead se usa a menudo para estimar tamaños de muestra de animales de laboratorio , así como en muchos otros experimentos de laboratorio. Puede que no sea tan preciso como el uso de otros métodos para estimar el tamaño de la muestra, pero da una idea de cuál es el tamaño de muestra apropiado cuando los parámetros como las desviaciones estándar esperadas o las diferencias esperadas en los valores entre los grupos son desconocidos o muy difíciles de estimar. [5]

Todos los parámetros de la ecuación son de hecho los grados de libertad del número de sus conceptos y, por lo tanto, sus números se restan de 1 antes de insertarlos en la ecuación.

La ecuación es: [5]

dónde:

  • N es el número total de individuos o unidades en el estudio (menos 1)
  • B es el componente de bloqueo , que representa los efectos ambientales permitidos en el diseño (menos 1)
  • T es el componente de tratamiento , que corresponde al número de grupos de tratamiento (incluido el grupo de control ) que se utilizan o al número de preguntas que se hacen (menos 1)
  • E son los grados de libertad del componente de error y debe estar entre 10 y 20.

Por ejemplo, si se planifica un estudio con animales de laboratorio con cuatro grupos de tratamiento ( T = 3), con ocho animales por grupo, lo que hace un total de 32 animales ( N = 31), sin ninguna estratificación adicional ( B = 0), entonces E sería igual a 28, que está por encima del límite de 20, lo que indica que el tamaño de la muestra puede ser un poco demasiado grande y que seis animales por grupo podrían ser más apropiados. [6]

Función de distribución acumulativa [ editar ]

Sean X i , i = 1, 2, ..., n observaciones independientes tomadas de una distribución normal con media desconocida μ y varianza conocida σ 2 . Considere dos hipótesis, una hipótesis nula :

y una hipótesis alternativa:

para alguna 'diferencia significativa más pequeña' μ *  > 0. Este es el valor más pequeño para el que nos preocupamos por observar una diferencia. Ahora, si deseamos (1) rechazar H 0 con una probabilidad de al menos 1 -  β cuando H a es verdadera (es decir, una potencia de 1 -  β ), y (2) rechazar H 0 con probabilidad α cuando H 0 es cierto, entonces necesitamos lo siguiente:

Si z α es el punto porcentual α superior de la distribución normal estándar, entonces

y entonces

'Rechace H 0 si nuestro promedio muestral ( ) es mayor que '

es una regla de decisión que satisface (2). (Esta es una prueba de una cola).

Ahora deseamos que esto suceda con una probabilidad de al menos 1 -  β cuando H a es verdadera. En este caso, nuestro promedio de muestra provendrá de una distribución Normal con media μ * . Por lo tanto, requerimos

A través de una manipulación cuidadosa, se puede demostrar (ver Ejemplo de potencia estadística ) que sucede cuando

donde es la función de distribución acumulativa normal .

Tamaño de muestra estratificado [ editar ]

Con técnicas de muestreo más complicadas, como el muestreo estratificado , la muestra a menudo se puede dividir en submuestras. Típicamente, si hay H dichos sub-muestras (de H diferentes estratos) a continuación, cada uno de ellos tendrá un tamaño de la muestra n h , h = 1, 2, ..., H . Estos n h deben ajustarse a la regla de que n 1 + n 2 + ... + n H = n (es decir, que el tamaño total de la muestra viene dado por la suma de los tamaños de las submuestras). Seleccionar estos n h óptimamente se puede hacer de varias maneras, utilizando (por ejemplo) la asignación óptima de Neyman.

Hay muchas razones para utilizar el muestreo estratificado: [7] para reducir las variaciones de las estimaciones de la muestra, utilizar métodos parcialmente no aleatorios o estudiar los estratos individualmente. Un método útil, en parte no aleatorio, sería tomar muestras de individuos donde sea de fácil acceso, pero, cuando no, muestrear grupos para ahorrar costos de viaje. [8]

En general, para los estratos H , una media muestral ponderada es

con

[9]

Los pesos, frecuentemente, pero no siempre, representan las proporciones de los elementos de la población en los estratos, y . Para un tamaño de muestra fijo, es decir ,

[10]

que se puede hacer como mínimo si la tasa de muestreo dentro de cada estrato se hace proporcional a la desviación estándar dentro de cada estrato:, donde y es una constante tal que .

Se alcanza una "asignación óptima" cuando las tasas de muestreo dentro de los estratos se hacen directamente proporcionales a las desviaciones estándar dentro de los estratos e inversamente proporcionales a la raíz cuadrada del costo de muestreo por elemento dentro de los estratos :

[11]

donde es una constante tal que , o, más generalmente, cuando

[12]

Investigación cualitativa [ editar ]

La determinación del tamaño de la muestra en estudios cualitativos tiene un enfoque diferente. Generalmente es un juicio subjetivo, tomado a medida que avanza la investigación. [13] Un enfoque es seguir incluyendo más participantes o material hasta que se alcance la saturación . [14] El número necesario para alcanzar la saturación se ha investigado empíricamente. [15] [16] [17] [18]

Existe una escasez de orientación confiable sobre la estimación del tamaño de la muestra antes de comenzar la investigación, con una variedad de sugerencias. [16] [19] [20] [21] Se ha sugerido para el análisis temático una herramienta similar a un cálculo de poder cuantitativo, basado en la distribución binomial negativa . [22] [21]

Ver también [ editar ]

  • Diseño de experimentos
  • Ejemplo de superficie de respuesta de ingeniería en regresión escalonada
  • Cohen's h

Notas [ editar ]

  1. ^ NIST / SEMATECH , "7.2.4.2. Tamaños de muestra requeridos" , Manual electrónico de métodos estadísticos.
  2. ^ "Inferencia de regresión" . utdallas.edu .
  3. ^ "Intervalo de confianza para una proporción" Archivado el 23 de agosto de 2011 en la Wayback Machine.
  4. ^ a b Capítulo 13 , página 215, en: Kenny, David A. (1987). Estadística para las ciencias sociales y del comportamiento . Boston: pequeño, marrón. ISBN 978-0-316-48915-7.
  5. ^ a b Kirkwood, James; Robert Hubrecht (2010). El manual de la UFAW sobre el cuidado y manejo de animales de laboratorio y otros animales de investigación . Wiley-Blackwell. pag. 29. ISBN 978-1-4051-7523-4. en línea Página 29
  6. ^ Isogenic.info> Ecuación de recursos de Michael FW Festing. Actualizado en septiembre de 2006
  7. ^ Kish (1965, sección 3.1)
  8. ^ Kish (1965), pág. 148.
  9. ^ Kish (1965), pág. 78.
  10. ^ Kish (1965), pág. 81.
  11. ^ Kish (1965), pág. 93.
  12. ^ Kish (1965), pág. 94.
  13. ^ Sandelowski, M. (1995). Tamaño de la muestra en la investigación cualitativa. Investigación en enfermería y salud , 18, 179–183
  14. ^ Glaser, B. (1965). El método comparativo constante de análisis cualitativo. Problemas sociales , 12, 436–445
  15. ^ Francis, JJ, Johnston, M., Robertson, C., Glidewell, L., Entwistle, V., Eccles, MP y Grimshaw, JM (2010). ¿Qué es un tamaño de muestra adecuado? Operacionalización de la saturación de datos para estudios de entrevistas basados ​​en la teoría. Psicología y salud , 25, 1229-1245. doi : 10.1080 / 08870440903194015
  16. ^ a b Invitado, G., Bunce, A. y Johnson, L. (2006) . ¿Cuántas entrevistas son suficientes ?: Un experimento con saturación y variabilidad de datos. Métodos de campo , 18, 59–82. doi : 10.1177 / 1525822X05279903
  17. ^ Wright, A., Maloney, FL y Feblowitz, JC (2011) . Actitudes de los médicos y uso de listas de problemas electrónicos: un análisis temático. BMC Medical Informatics and Decision Making , 11, 36. doi : 10.1186 / 1472-6947-11-36
  18. ^ "Tamaño de la muestra y saturación en estudios de doctorado mediante entrevistas cualitativas - Mason - Forum Qualitative Sozialforschung / Forum: Qualitative Social Research" . Qualitative-research.net . 11 (3). 2010-08-24.
  19. ^ Emmel, N. (2013). Muestreo y elección de casos en la investigación cualitativa: un enfoque realista. Londres: Sage.
  20. ^ Onwuegbuzie, AJ y Leech, NL (2007) . Un llamado a análisis de poder cualitativo. Calidad y cantidad , 41, 105–121. doi : 10.1007 / s11135-005-1098-1
  21. ^ a b Fugard AJB; Potts HWW (10 de febrero de 2015). "Apoyar el pensamiento sobre tamaños de muestra para análisis temáticos: una herramienta cuantitativa" (PDF) . Revista Internacional de Metodología de la Investigación Social . 18 (6): 669–684. doi : 10.1080 / 13645579.2015.1005453 . S2CID 59047474 .  
  22. ^ Galvin R (2015). ¿Cuantas entrevistas son suficientes? ¿Las entrevistas cualitativas en la investigación del consumo de energía en edificios producen conocimiento confiable? Journal of Building Engineering, 1: 2–12.

Referencias [ editar ]

  • Bartlett, JE, II; Kotrlik, JW; Higgins, C. (2001). "Investigación organizacional: determinar el tamaño de muestra apropiado para la investigación de encuestas" (PDF) . Revista de tecnología de la información, aprendizaje y rendimiento . 19 (1): 43–50.
  • Kish, L. (1965). Muestreo de encuestas . Wiley. ISBN 978-0-471-48900-9.
  • Smith, Scott (8 de abril de 2013). "Determinación del tamaño de la muestra: cómo asegurarse de obtener el tamaño de muestra correcto" . Qualtrics . Consultado el 19 de septiembre de 2018 .
  • Israel, Glenn D. (1992). "Determinación del tamaño de la muestra" . Universidad de Florida, PEOD-6 . Consultado el 29 de junio de 2019 .
  • Rens van de Schoot, Milica Miočević (eds.). 2020. Soluciones para muestras pequeñas (acceso abierto): una guía para investigadores y profesionales aplicados . Routledge.

Lectura adicional [ editar ]

  • NIST: selección de tamaños de muestra
  • ASTM E122-07: Práctica estándar para calcular el tamaño de la muestra para estimar, con precisión especificada, el promedio de una característica de un lote o proceso

Enlaces externos [ editar ]

  • Un script de MATLAB que implementa la fórmula de tamaño de muestra de Cochran