" Todos los modelos están equivocados " es un aforismo común en estadística ; a menudo se amplía como "Todos los modelos son incorrectos, pero algunos son útiles". Por lo general, se considera aplicable no solo a modelos estadísticos , sino a modelos científicos en general. El aforismo reconoce que los modelos estadísticos o científicos siempre están a la altura de las complejidades de la realidad, pero aún pueden ser útiles.
El aforismo se atribuye generalmente al estadístico George Box , aunque el concepto subyacente es anterior a los escritos de Box.
Citas de George Box
El primer registro de Box que dice "todos los modelos son incorrectos" se encuentra en un artículo de 1976 publicado en la Revista de la Asociación Estadounidense de Estadística . [1] El artículo de 1976 contiene el aforismo dos veces. Las dos secciones del artículo que contienen el aforismo se copian a continuación.
2.3 Parsimonia
Dado que todos los modelos son incorrectos, el científico no puede obtener uno "correcto" mediante una elaboración excesiva. Por el contrario, siguiendo a Guillermo de Occam , debería buscar una descripción económica de los fenómenos naturales. Así como la capacidad de idear modelos simples pero evocadores es la firma del gran científico, la sobreelaboración y la parametrización excesiva son a menudo la marca de la mediocridad.
2.4 Preocupación selectiva
Dado que todos los modelos son incorrectos, el científico debe estar alerta a lo que es más importante. No es apropiado preocuparse por los ratones cuando hay tigres en el exterior.
Box repitió el aforismo en un artículo que se publicó en las actas de un taller de estadística de 1978. [2] El documento contiene una sección titulada "Todos los modelos son incorrectos pero algunos son útiles". La sección se copia a continuación.
Ahora bien, sería muy notable si cualquier sistema existente en el mundo real pudiera ser representado exactamente por un modelo simple. Sin embargo, los modelos parsimoniosos elegidos astutamente a menudo proporcionan aproximaciones notablemente útiles. Por ejemplo, la ley PV = RT que relaciona la presión P, el volumen V y la temperatura T de un gas "ideal" a través de una constante R no es exactamente cierta para ningún gas real, pero con frecuencia proporciona una aproximación útil y, además, su estructura es informativa ya que surge de una visión física del comportamiento de las moléculas de gas. Para un modelo de este tipo, no es necesario plantearse la pregunta "¿Es el modelo verdadero?". Si la "verdad" ha de ser la "verdad total", la respuesta debe ser "No". La única pregunta de interés es "¿Es el modelo esclarecedor y útil?".
Box repitió el aforismo dos veces más en su libro de 1987, Empirical Model-Building and Response Surfaces (que fue coautor con Norman Draper). [3] La primera repetición está en la p. 74: "Recuerda que todos los modelos están equivocados; la pregunta práctica es qué tan equivocados tienen que estar para no ser útiles". La segunda repetición está en la p. 424, que se extrae a continuación.
... todos los modelos son aproximaciones. Básicamente, todos los modelos son incorrectos, pero algunos son útiles. Sin embargo, siempre se debe tener en cuenta la naturaleza aproximada del modelo ...
En 2007 se publicó una segunda edición del libro, bajo el título Response Surfaces, Mixture, and Ridge Analyzes . La segunda edición también repite el aforismo dos veces, en contextos idénticos a los de la primera edición (en p. 63 y p. 414). [4]
Box repitió el aforismo dos veces más en su libro de 1997, Statistical Control: By Monitoring and Feedback Adjustment (que fue coautor con Alberto Luceño). [5] La primera repetición está en la p. 6, que se extrae a continuación.
Se ha dicho que "todos los modelos son incorrectos pero algunos modelos son útiles". En otras palabras, cualquier modelo es, en el mejor de los casos, una ficción útil: nunca hubo, ni existirá, una distribución exactamente normal o una relación lineal exacta. No obstante, se ha avanzado enormemente entreteniendo tales ficciones y utilizándolas como aproximaciones.
La segunda repetición está en la p. 9: "Entonces, dado que todos los modelos están equivocados, es muy importante saber de qué preocuparse; o, para decirlo de otra manera, qué modelos pueden producir procedimientos que funcionen en la práctica (donde las suposiciones exactas nunca son ciertas)" .
En 2009 se publicó una segunda edición del libro, bajo el título Control estadístico por seguimiento y ajuste (en coautoría con Alberto Luceño y María del Carmen Paniagua-Quiñones). La segunda edición también repite el aforismo dos veces. [6] La primera repetición está en la p. 61, que se extrae a continuación.
Todos los modelos son aproximaciones. Las suposiciones, ya sean implícitas o claramente establecidas, nunca son exactamente verdaderas. Todos los modelos son incorrectos, pero algunos modelos son útiles. Entonces, la pregunta que debe hacerse no es "¿Es cierto el modelo?" (nunca lo es) pero "¿Es el modelo lo suficientemente bueno para esta aplicación en particular?"
La segunda repetición está en la p. 63; su contexto es esencialmente el mismo que el de la segunda repetición de la primera edición.
El libro Statistics for Experimenters , ampliamente citado de Box (en coautoría con William Hunter ) no incluye el aforismo en su primera edición (publicada en 1978). [7] La segunda edición (publicada en 2005; en coautoría con William Hunter y J. Stuart Hunter) incluye el aforismo tres veces: en la p. 208, pág. 384 y p. 440. [8] En la p. 440, la oración relevante es la siguiente: "Lo máximo que se puede esperar de cualquier modelo es que pueda proporcionar una aproximación útil a la realidad: todos los modelos son incorrectos; algunos modelos son útiles".
Además de enunciar el aforismo palabra por palabra, Box a veces expresaba la esencia del aforismo con diferentes palabras. Un ejemplo es de 1978, cuando Box era presidente de la Asociación Estadounidense de Estadística . En la reunión anual de la Asociación, Box pronunció su Discurso de Presidencia, donde afirmó lo siguiente: "Los modelos, por supuesto, nunca son verdaderos, pero afortunadamente solo es necesario que sean útiles". [9]
Discusiones
Ha habido discusiones variadas sobre el aforismo. A continuación se presenta una selección de esas discusiones.
En 1983, los estadísticos Peter McCullagh y John Nelder publicaron su muy citado libro sobre modelos lineales generalizados . El libro incluye una breve discusión del aforismo (aunque sin citar Box). [10] Una segunda edición del libro, publicada en 1989, contiene una discusión muy similar del aforismo. [11] La discusión de la primera edición es la siguiente.
Modelar en la ciencia sigue siendo, al menos en parte, un arte. Sin embargo, existen algunos principios para guiar al modelador. La primera es que todos los modelos están equivocados ; algunos, sin embargo, son mejores que otros y podemos buscar los mejores. Al mismo tiempo, debemos reconocer que la verdad eterna no está a nuestro alcance.
En 1995, el estadístico Sir David Cox comentó lo siguiente. [12]
... no parece útil decir simplemente que todos los modelos están equivocados. La misma palabra modelo implica simplificación e idealización. La idea de que los sistemas físicos, biológicos o sociológicos complejos puedan describirse con exactitud mediante unas pocas fórmulas es evidentemente absurda. La construcción de representaciones idealizadas que capturan importantes aspectos estables de tales sistemas es, sin embargo, una parte vital del análisis científico general y los modelos estadísticos, especialmente los sustantivos, no parecen esencialmente diferentes de otros tipos de modelos.
En 1996, se propuso el Credo de un estadístico aplicado. [13] El Credo incluye, en su parte central, el aforismo.
En 2002, KP Burnham y DR Anderson publicaron su libro muy citado sobre selección de modelos estadísticos . El libro dice lo siguiente. [14]
Un modelo es una simplificación o aproximación de la realidad y, por lo tanto, no reflejará toda la realidad. ... Box señaló que "todos los modelos son incorrectos, pero algunos son útiles". Si bien un modelo nunca puede ser "verdadero", un modelo puede clasificarse de muy útil a útil, de algo útil a, finalmente, esencialmente inútil.
El estadístico J. Michael Steele ha comentado sobre el aforismo de la siguiente manera. [15]
... hay modelos maravillosos, como mapas de ciudades ...
Si digo que un mapa está mal, significa que un edificio tiene un nombre incorrecto o que la dirección de una calle de un solo sentido está mal etiquetada. Nunca esperé que mi mapa recreara toda la realidad física, y solo me siento estafado si mi mapa no responde correctamente a las preguntas que dice responder.
Mis mapas de Filadelfia son útiles. Además, a excepción de unos pocos que están desactualizados, no se equivocan .
Entonces, usted dice: "Sí, un mapa se puede considerar como un modelo, pero seguramente sería más preciso decir que un mapa es una 'base de datos visualmente mejorada'". Estas bases de datos pueden ser correctas. Éstos no son los tipos de modelos que tenía en mente Box ".
Estoy de acuerdo. ...
En 2008, el estadístico Andrew Gelman respondió a eso, diciendo en particular lo siguiente. [dieciséis]
Tomo su punto general, que es que un mapa de calles podría ser exactamente correcto, a la resolución del mapa.
... el dicho, "todos los modelos están equivocados," es útil, ya que es no completamente obvio ....
Este es un punto simple, y puedo ver cómo Steele puede irritarse cuando la gente hace un gran comentario al respecto. Pero el problema es que muchas personas no se dan cuenta de que todos los modelos están equivocados.
En 2013, el filósofo de la ciencia Peter Truran publicó un ensayo relacionado con el aforismo. [17] El ensayo señala, en particular, lo siguiente.
... se pueden usar modelos aparentemente incompatibles para hacer predicciones sobre el mismo fenómeno. ... Para cada modelo, podemos creer que su poder predictivo es una indicación de que es al menos aproximadamente cierto. Pero si ambos modelos tienen éxito en hacer predicciones y, sin embargo, son incompatibles entre sí, ¿cómo pueden ambos ser verdaderos? Consideremos una simple ilustración. Dos observadores miran un objeto físico. Uno puede informar haber visto un disco circular y el otro puede informar haber visto un rectángulo. Ambos serán correctos, pero uno estará mirando el objeto (una lata cilíndrica) desde arriba y el otro estará observando desde un lado. Los dos modelos representan diferentes aspectos de la misma realidad.
El ensayo de Truran señala además que la teoría de la gravitación de Newton ha sido suplantada por la teoría de la relatividad de Einstein y, sin embargo, la teoría de Newton sigue siendo en general "empíricamente adecuada". De hecho, la teoría de Newton tiene generalmente un excelente poder predictivo. Sin embargo, la teoría de Newton no es una aproximación a la teoría de Einstein. Por ejemplo, considere una manzana que se cae de un árbol. Según la teoría de Newton, la manzana cae porque la Tierra ejerce una fuerza sobre la manzana, lo que se llama "la fuerza de la gravedad". Según la teoría de Einstein, la Tierra no ejerce ninguna fuerza sobre la manzana. [18] Por lo tanto, la teoría de Newton podría considerarse, en cierto sentido, completamente errónea pero extremadamente útil. (La utilidad de la teoría de Newton proviene en parte de ser mucho más simple, tanto matemática como computacionalmente, que la teoría de Einstein).
En 2014, el estadístico David Hand hizo la siguiente declaración. [19]
En general, al construir modelos estadísticos, no debemos olvidar que el objetivo es comprender algo sobre el mundo real. O predecir, elegir una acción, tomar una decisión, resumir evidencia, etc., pero siempre sobre el mundo real, no sobre un mundo matemático abstracto: nuestros modelos no son la realidad, un punto bien planteado por George Box en su citado a menudo comenta que "todos los modelos son incorrectos, pero algunos son útiles".
En 2016, PJ Bickel y KA Doksum publicaron el segundo volumen de su libro sobre estadística matemática . El volumen incluye la cita del discurso presidencial de Box, que figura más arriba. Afirma que la cita es la mejor formulación del "principio rector de las estadísticas modernas". [20]
Además, en 2011, se llevó a cabo un taller sobre selección de modelos en los Países Bajos. El nombre del taller era "Todos los modelos están mal ...". [21]
Antecedentes historicos
Aunque el aforismo parece haberse originado con George Box, el concepto subyacente se remonta a décadas, quizás siglos. Algunas ejemplificaciones de eso se dan a continuación.
En 1960, Georg Rasch dijo lo siguiente.
... ningún modelo es [verdadero], ni siquiera las leyes newtonianas. Cuando construyes un modelo, omites todos los detalles que tú, con el conocimiento a tu disposición, consideras no esenciales…. Los modelos no deben ser verdaderos, pero es importante que sean aplicables y, por supuesto, debe investigarse si son aplicables para un propósito determinado. Esto también significa que un modelo nunca se acepta finalmente, solo a prueba.
- Rasch, G. (1960), Modelos probabilísticos para algunas pruebas de inteligencia y logro , Copenhague: Danmarks Paedagogiske Institut, págs. 37–38; republicado en 1980 por University of Chicago Press
En 1947, el matemático John von Neumann dijo que "la verdad ... es demasiado complicada para permitir algo más que aproximaciones". [22]
En 1942, el filósofo y poeta francés Paul Valéry dijo lo siguiente. [23]
Ce qui est simple est toujours faux. Ce qui ne l'est pas est inutilisable. | Lo simple siempre está mal. Lo que no es inutilizable. [24] |
- Valéry, Paul (1942), Mauvaises pensées et autres , París: Éditions Gallimard |
En 1939, el fundador del control de procesos estadísticos , Walter Shewhart , dijo lo siguiente. [25]
... ningún modelo puede ser teóricamente alcanzable que caracterice completa y exclusivamente el concepto indefinidamente expansible de un estado de control estadístico. Lo que es quizás aún más importante, sobre la base de una porción finita de la secuencia [ X 1 , X 2 , X 3 ,…] —y nunca podremos tener más que una porción finita— no podemos esperar razonablemente construir un modelo que representará exactamente cualquier característica específica de un estado de control particular, aunque tal estado realmente exista. Aquí la situación es muy parecida a la de la ciencia física, donde encontramos un modelo de molécula; cualquier modelo es siempre una imagen incompleta, aunque útil, de la cosa física concebida llamada molécula.
- Shewhart, WA (1939), Método estadístico desde el punto de vista del control de calidad , Departamento de Agricultura de EE. UU. , Pág. 19
En 1923, el artista Pablo Picasso articuló una idea relacionada .
Todos sabemos que el arte no es la verdad. El arte es una mentira que nos hace darnos cuenta de la verdad, al menos la verdad que se nos da a entender. El artista debe conocer la manera de convencer a otros de la veracidad de sus mentiras.
- Picasso, Pablo (1923), "Picasso habla", Las artes , 3 : 315–326; [26] reimpreso en Barr, Alfred H., Jr. (1939), Picasso: cuarenta años de su arte (PDF) , Museo de Arte Moderno , págs. 9-12
Ver también
- Cuarteto de Anscombe
- La paradoja de Bonini
- Relación mapa-territorio : la relación entre un objeto y una representación de ese objeto.
- Pragmatismo : tradición filosófica que considera las palabras y el pensamiento como herramientas e instrumentos para la predicción, la resolución de problemas y la acción.
- Reificación (falacia) : falacia de tratar una abstracción como si fuera algo real
- Modelización científica - Actividad científica
- Modelo estadístico
- Validación del modelo estadístico
Notas
- ^ Box, GEP (1976), "Ciencia y estadística" (PDF) , Revista de la Asociación Estadounidense de Estadística , 71 (356): 791–799, doi : 10.1080 / 01621459.1976.10480949.
- ^ Box, GEP (1979), "Robustez en la estrategia de construcción de modelos científicos", en Launer, RL; Wilkinson, GN (eds.), Robustness in Statistics , Academic Press , págs. 201–236, doi : 10.1016 / B978-0-12-438150-6.50018-2 , ISBN 9781483263366.
- ^ Caja, GEP; Draper, NR (1987), Superficies de respuesta y construcción de modelos empíricos , John Wiley & Sons.
- ^ Caja, GEP; Draper, NR (2007), Análisis de superficies, mezclas y crestas de respuesta , John Wiley & Sons.
- ^ Caja, GEP; Luceño, A (1997), Control estadístico: por seguimiento y ajuste de retroalimentación , John Wiley & Sons.
- ^ Caja, GEP; Luceño, A .; del Carmen Paniagua-Quiñones, M. (2009), Control estadístico por seguimiento y ajuste , John Wiley & Sons.
- ^ Caja, GEP; Hunter, WG (1978), Estadísticas para experimentadores , John Wiley & Sons.
- ^ Caja, GEP; Hunter, JS; Hunter, WG (2005), Estadísticas para experimentadores (2a ed.), John Wiley & Sons.
- ^ Box, GEP (1979), "Algunos problemas de estadística y la vida cotidiana", Revista de la Asociación Estadounidense de Estadística , 74 (365): 1–4, doi : 10.2307 / 2286713 , JSTOR 2286713.
- ^ McCullagh, P .; Nelder, JA (1983), Modelos lineales generalizados , Chapman y Hall , §1.1.4.
- ^ McCullagh, P .; Nelder, JA (1989), Modelos lineales generalizados (segunda ed.), Chapman & Hall , §1.1.4.
- ^ Cox, DR (1995), "Comentario sobre" Incertidumbre del modelo, extracción de datos e inferencia estadística " ", Revista de la Royal Statistical Society, Serie A , 158 : 455–456.
- ^ Nester, MR (1996), "El credo de un estadístico aplicado" (PDF) , Journal of the Royal Statistical Society, Serie C , 45 (4): 401–410, doi : 10.2307 / 2986064 , JSTOR 2986064.
- ^ Burnham, KP; Anderson, DR (2002), Selección de modelos e inferencia multimodelo: un enfoque práctico de la teoría de la información (2a ed.), Springer-Verlag , §1.2.5. [A octubre de 2019,[actualizar]las ediciones combinadas de este libro tienen más de 48000 citas en Google Académico ].
- ^ Steele, JM, " Modelos: obras maestras y excusas poco convincentes ".
- ^ Gelman, A. (12 de junio de 2008), " Algunas reflexiones sobre el dicho:" Todos los modelos están mal, pero algunos son útiles " ".
- ^ Truran, P. (2013), "Modelos: útiles pero no verdaderos", Aplicaciones prácticas de la filosofía de la ciencia , SpringerBriefs in Philosophy, Springer , págs. 61–67, doi : 10.1007 / 978-3-319-00452-5_10 , ISBN 978-3-319-00451-8.
- ↑ Según la teoría de la relatividad de Einstein , la razón principal por la que la manzana se cae es que la Tierra deforma el tiempo, de modo que los relojes cerca de la base del árbol corren más lentamente que los relojes en lo alto del árbol; También hay una razón secundaria, que es que la Tierra deforma el espacio. La evidencia empírica de la teoría de Einstein es extremadamente fuerte, por ejemplo, el GPS se basa en la teoría de Einstein y no funcionaría si se basara en la teoría de Newton ( Ashby 2002 ).
- ^ Hand, DJ (2014), "Ejemplos maravillosos, pero no cerremos los ojos", Statistical Science , 29 : 98–100, arXiv : 1405.4986 , doi : 10.1214 / 13-STS446.
- ^ Bickel, PJ; Doksum, KA (2016), Estadística matemática , II , Chapman y Hall , p. 2.
- ^ Wit, E .; van den Heuvel, E .; Romeijn, J.-W. (2012), " ' Todos los modelos son incorrectos ...': una introducción a la incertidumbre del modelo" (PDF) , Statistica Neerlandica , 66 (3): 217–236, doi : 10.1111 / j.1467-9574.2012.00530.x. [Ver también la página web del taller: " Todos los modelos son incorrectos ... ".]
- ^ von Neumann, J. (1947), "The mathematician", en Haywood, RB (ed.), Works of the Mind , University of Chicago Press , págs. 180-196; reeditado en 1995 por Bródy F., Vámos T. (editores), The Neumann Compendium , World Scientific , p. 618–626.
- ↑ La relación de la cita de Valéry con el aforismo "todos los modelos son incorrectos" ha sido notada por varios autores, por ejemplo, Vankat (2013 , §1.7).
- ↑ Algunos autores han realizado diferentes traducciones al inglés, por ejemplo, Valéry (1970 , p. 466), Wolfson & Murphy (1998) y Vankat (2013 , §1.7). La traducción presentada aquí fue proporcionada por Google Translate ; solo tiene una palabra diferente de la traducción de Wolfson & Murphy: "Qué" en lugar de "Lo que sea" (ambas apariciones).
- ↑ La relación de la cita de Shewhart con el aforismo "todos los modelos están equivocados" es notada por Fricker & Woodall (2016) .
- ↑ La cita se dio originalmente en español (durante una entrevista de Marius de Zayas ); la publicación citada está en inglés.
Referencias
- Ashby, N. (2002), "La relatividad y el sistema de posicionamiento global" (PDF) , Physics Today , 55 (5): 41–47, Bibcode : 2002PhT .... 55e..41A , doi : 10.1063 / 1.1485583.
- Fricker, RD, Jr .; Woodall, WH (2016), "Tócala una y otra vez, Sam", Significación , 13 (4): 46, doi : 10.1111 / j.1740-9713.2016.00944.x.
- Valéry, Paul (1970), Obras completas de Paul Valéry, Volumen 14 — Analectas , traducido por Stuart Gilbert , Princeton University Press.
- Vankat, JL (2013), Dinámica de la vegetación en las montañas y mesetas del suroeste de Estados Unidos , Springer.
- Wolfson, MC; Murphy, BB (abril de 1998), "Nuevos puntos de vista sobre las tendencias de la desigualdad" (PDF) , Monthly Labor Review : 3–23.
Otras lecturas
- Anderson, C. (23 de junio de 2008), " El fin de la teoría ", Wired
- Box, GEP (1999), "La estadística como catalizador del aprendizaje mediante el método científico, Parte II: un debate", Journal of Quality Technology , 31 : 16–29, doi : 10.1080 / 00224065.1999.11979890
- Saltelli, A .; Funtowicz, S. (invierno de 2014), " When all models are wrong ", Issues in Science and Technology , 30
enlaces externos
- "Todos los modelos tienen razón, la mayoría son inútiles" - Blog de Andrew Gelman
- Todos los modelos están equivocados - blog de Peter Coles
- ¿Están mal todos los modelos? —Blog de teoría, evolución y juegos