En la teoría de la probabilidad y la elección de carteras intertemporales , el criterio de Kelly (o estrategia de Kelly o apuesta de Kelly ), también conocido como método científico de juego, es una fórmula para calcular el tamaño de las apuestas que conduce casi con seguridad (bajo el supuesto de rendimientos esperados conocidos) a una mayor riqueza. en comparación con cualquier otra estrategia a largo plazo (es decir, acercándose al límite a medida que el número de apuestas llega al infinito). El tamaño de la apuesta de Kelly se calcula maximizando el valor esperadodel logaritmo de riqueza, lo que equivale a maximizar la tasa de crecimiento geométrico esperada. El criterio de Kelly es apostar una fracción predeterminada de activos, y puede parecer contradictorio. Fue descrito por JL Kelly Jr , investigador de Bell Labs , en 1956. [1]
Para una apuesta de dinero par , el criterio de Kelly calcula el porcentaje del tamaño de la apuesta multiplicando el porcentaje de probabilidad de ganar por dos, luego restando el cien por ciento. Entonces, para una apuesta con un 70% de posibilidades de ganar, el tamaño de apuesta óptimo es el 40% de los fondos disponibles.
Se ha demostrado el uso práctico de la fórmula para los juegos de azar [2] [3] y se utilizó la misma idea para explicar la diversificación en la gestión de inversiones . [4] En la década de 2000, el análisis al estilo Kelly se convirtió en parte de la teoría de la inversión convencional [5] y se ha afirmado que inversores de éxito conocidos, incluidos Warren Buffett [6] y Bill Gross [7], utilizan métodos de Kelly. William Poundstone escribió un extenso relato popular de la historia de las apuestas Kelly. [8]
Ejemplo
En un estudio, a cada participante se le dio $ 25 y se le pidió que hiciera apuestas iguales en una moneda que obtendría cara el 60% de las veces. Los participantes tenían 30 minutos para jugar, por lo que podían realizar unas 300 apuestas y los premios tenían un límite de 250 dólares. El comportamiento de los sujetos de prueba estuvo lejos de ser óptimo:
Sorprendentemente, el 28% de los participantes quebró y el pago promedio fue de solo $ 91. Solo el 21% de los participantes alcanzó el máximo. 18 de los 61 participantes apostaron todo en un solo lanzamiento, mientras que dos tercios apostaron a cruz en algún momento del experimento. [9] [10]
Usando el criterio de Kelly y basado en las probabilidades en el experimento (ignorando el límite de $ 250 y la duración finita de la prueba), el enfoque correcto sería apostar el 20% de los fondos de uno en cada lanzamiento de la moneda (vea el primer ejemplo a continuación). ). Si pierde, el tamaño de la siguiente apuesta se reduce; si gana, la apuesta aumenta. Si los apostadores hubieran seguido esta regla (asumiendo que las apuestas tienen una granularidad infinita y hay hasta 300 lanzamientos de monedas por juego y que un jugador que alcanza el límite dejaría de apostar después de eso), un promedio del 94% de ellos habría alcanzado el tope, y el pago promedio habría sido de $ 237,36.
En este juego en particular, debido al límite, una estrategia de apostar solo el 12% del bote en cada lanzamiento tendría mejores resultados (una probabilidad del 95% de alcanzar el límite y un pago promedio de $ 242.03).
Declaración
Para apuestas simples con dos resultados, uno que implica perder el monto total de la apuesta y el otro que implica ganar el monto de la apuesta multiplicado por las probabilidades de pago , la apuesta de Kelly es:
dónde:
- es la fracción de los fondos actuales para apostar; (es decir, cuánto apostar, expresado en fracción)
- son las probabilidades fraccionarias netas recibidas en la apuesta; (p. ej., apostar $ 10, en ganar, recompensa $ 4 más la apuesta; luego)
- es la probabilidad de ganar;
- es la probabilidad de una pérdida.
Por ejemplo, si una apuesta tiene un 60% de posibilidades de ganar (, ), y el jugador recibe probabilidades de 1 a 1 en una apuesta ganadora (), entonces el jugador debe apostar el 20% del bankroll en cada oportunidad (), con el fin de maximizar la tasa de crecimiento a largo plazo del bankroll.
Si el jugador tiene ventaja cero, es decir, si , entonces el criterio recomienda que el jugador no apueste nada.
Si el borde es negativo () la fórmula da un resultado negativo, lo que indica que el jugador debe tomar el otro lado de la apuesta. Por ejemplo, en la ruleta americana , al apostador se le ofrece una recompensa de dinero uniforme () en rojo, cuando hay 18 números rojos y 20 números no rojos en la rueda (). La apuesta de Kelly es, lo que significa que el jugador debe apostar un diecinueve de su bankroll a que no saldrá rojo . No se ofrece una apuesta anti-rojo explícita con probabilidades comparables en la ruleta, por lo que lo mejor que puede hacer un jugador de Kelly es no apostar nada.
La parte superior de la primera fracción son las ganancias netas esperadas de una apuesta de $ 1, ya que los dos resultados son que usted gana $ con probabilidad , o perder el $ 1 apostado, es decir, ganar $ -1, con probabilidad . Por eso:
Para apuestas de dinero par (es decir, cuando ), la primera fórmula se puede simplificar a:
Desde , esto simplifica aún más
Un problema más general relevante para las decisiones de inversión es el siguiente:
- La probabilidad de éxito es .
- Si tiene éxito, el valor de su inversión aumenta de a .
- Si falla (para lo cual la probabilidad es ) el valor de su inversión disminuye de a . (Tenga en cuenta que la descripción anterior anterior asume que es 1.)
En este caso, como se demuestra en la siguiente sección, el criterio de Kelly resulta ser la expresión relativamente simple
Tenga en cuenta que esto se reduce a la expresión original para el caso especial anterior () por .
Claramente, para decidir a favor de invertir al menos una pequeña cantidad , debes tener
que obviamente no es más que el hecho de que la ganancia esperada debe exceder la pérdida esperada para que la inversión tenga algún sentido.
El resultado general aclara por qué el apalancamiento (sacar un préstamo que requiere pagar intereses para obtener capital de inversión ) disminuye la fracción óptima a invertir, como en ese caso. Obviamente, no importa cuán grande sea la probabilidad de éxito,, es, si es suficientemente grande, la fracción óptima para invertir es cero. Por lo tanto, usar demasiado margen no es una buena estrategia de inversión cuando el costo de capital es alto, incluso cuando la oportunidad parece prometedora.
Prueba
Las pruebas heurísticas del criterio de Kelly son sencillas. [11] El criterio de Kelly maximiza el valor esperado del logaritmo de riqueza (el valor esperado de una función viene dado por la suma, sobre todos los resultados posibles, de la probabilidad de cada resultado particular multiplicado por el valor de la función en el evento de ese resultado). Empezamos con 1 unidad de riqueza y apostamos una fracción de esa riqueza en un resultado que ocurre con probabilidad y ofrece probabilidades de . La probabilidad de ganar es, y en ese caso la riqueza resultante es igual a . La probabilidad de perder es, y en ese caso la riqueza resultante es igual a . Por tanto, el valor esperado de la riqueza logarítmica es dado por:
Para encontrar el valor de para el cual se maximiza el valor esperado, denotado como , diferenciamos la expresión anterior y la ponemos en cero. Esto da:
Reordenando esta ecuación para resolver el valor de da el criterio de Kelly:
Para obtener una prueba rigurosa y general, consulte el artículo original de Kelly [1] o algunas de las otras referencias que se enumeran a continuación. Se han publicado algunas correcciones. [12]
Damos el siguiente argumento no riguroso para el caso con (una apuesta 50:50 de "dinero par") para mostrar la idea general y proporcionar algunas ideas. [1]
Cuándo , un apostador Kelly apuesta veces su riqueza inicial , como se muestra arriba. Si ganan, tienendespués de una apuesta. Si pierden, tienen. Supongamos que hacen apuestas como esta, y gana tiempos de esta serie de apuestas. La riqueza resultante será:
Tenga en cuenta que el orden de las ganancias y las pérdidas no afecta la riqueza resultante.
Supongamos que otro apostador apuesta una cantidad diferente, por algún valor de (dónde puede ser positivo o negativo). Ellos tendrán después de una victoria y después de una pérdida. Después de la misma serie de victorias y derrotas que el apostador Kelly, tendrán:
Tome la derivada de esto con respecto a y obten:
La función se maximiza cuando esta derivada es igual a cero, lo que ocurre en:
lo que implica que
pero la proporción de apuestas ganadoras eventualmente convergerá a:
según la ley débil de los grandes números .
Entonces, a largo plazo, la riqueza final se maximiza estableciendo a cero, lo que significa seguir la estrategia de Kelly.
Esto ilustra que Kelly tiene un componente tanto determinista como estocástico. Si uno conoce K y N y desea elegir una fracción constante de riqueza para apostar cada vez (de lo contrario, podría hacer trampa y, por ejemplo, apostar cero después de la K- ésima victoria sabiendo que el resto de las apuestas perderán), se terminará. hasta con la mayor cantidad de dinero si uno apuesta:
cada vez. Esto es cierto sies pequeño o grande. La parte de "largo plazo" de Kelly es necesaria porque K no se conoce de antemano, solo que como se vuelve grande, se acercará . Alguien que apuesta más que Kelly puede hacerlo mejor sipor un tramo; alguien que apuesta menos que Kelly puede hacerlo mejor si por un tiempo, pero a la larga, Kelly siempre gana.
La prueba heurística para el caso general procede de la siguiente manera. [ cita requerida ]
En una sola prueba, si inviertes la fracción de su capital, si su estrategia tiene éxito, su capital al final de la prueba aumenta en el factor y, de la misma manera, si la estrategia falla, terminas teniendo tu capital disminuido por el factor . Así, al final de ensayos (con éxitos y fracasos), el capital inicial de $ 1 rinde
Maximizando , y consecuentemente , con respecto a conduce al resultado deseado
Edward O. Thorp proporcionó una discusión más detallada de esta fórmula para el caso general. [13] Allí se observa que la sustitución de porque la relación entre el número de "éxitos" y el número de ensayos implica que el número de ensayos debe ser muy grande, ya que se define como el límite de esta relación cuando el número de ensayos llega al infinito. En resumen, apostar cada vez probablemente maximizará la tasa de crecimiento de la riqueza solo en el caso en que el número de ensayos sea muy grande, y y son los mismos para cada prueba. En la práctica, se trata de jugar el mismo juego una y otra vez, donde la probabilidad de ganar y las probabilidades de pago son siempre las mismas. En la prueba heurística anterior, éxitos y Las fallas son muy probables solo para muy grandes .
Bernoulli
En un artículo de 1738, Daniel Bernoulli sugirió que, cuando uno puede elegir entre apuestas o inversiones, debe elegir aquello con la media geométrica más alta de resultados. Esto es matemáticamente equivalente al criterio de Kelly, aunque la motivación es completamente diferente (Bernoulli quería resolver la paradoja de San Petersburgo ).
Un idioma Inglés traducción del artículo de Bernoulli no se publicó hasta 1954, [14] pero el trabajo era bien conocido entre los matemáticos y economistas.
Múltiples resultados
El criterio de Kelly puede generalizarse [15] sobre los juegos de azar en muchos resultados mutuamente excluyentes, como en las carreras de caballos. Suponga que hay varios resultados mutuamente excluyentes. La probabilidad de que el-th caballo gana la carrera es , la cantidad total de apuestas realizadas en -th caballo es , y
dónde son las probabilidades de pago. , es la tasa de dividendos donde es la pista o el impuesto, es la tasa de ingresos después de la deducción de la pista cuando -th caballo gana. La fracción de los fondos del apostador para apostar-th caballo es . El criterio de Kelly para apostar con múltiples resultados mutuamente excluyentes proporciona un algoritmo para encontrar el conjunto óptimo de resultados sobre los que es razonable apostar y proporciona una fórmula explícita para encontrar las fracciones óptimas de la riqueza del apostador para apostar en los resultados incluidos en el conjunto óptimo . El algoritmo para el conjunto óptimo de resultados consta de cuatro pasos. [15]
- Paso 1 : Calcule la tasa de ingresos esperada para todos los resultados posibles (o solo para varios de los más prometedores):
- Paso 2 : reordene los resultados para que la nueva secuencia no aumenta. Por lo tanto será la mejor apuesta.
- Paso 3 : configurar (el conjunto vacío), , . Por lo tanto, la mejor apuesta se considerará primero.
- Paso 4 : Repite:
- Si luego inserta -th resultado en el set: , recalcular según la fórmula:
- y luego establecer ,
- De lo contrario, configure y detener la repetición.
- Si luego inserta -th resultado en el set: , recalcular según la fórmula:
Si el conjunto óptimo está vacío, entonces no apueste en absoluto. Si el conjunto de resultados óptimos no está vacío, entonces la fracción óptima apostar en -ésimo resultado se puede calcular a partir de esta fórmula:
- .
Se puede probar [15] que
donde el lado derecho es el tipo de reserva [ aclaración necesaria ] . Por lo tanto, el requisitopuede interpretarse [15] de la siguiente manera:-th resultado se incluye en el conjunto de resultados óptimos si y solo si su tasa de ingresos esperada es mayor que la tasa de reserva. La fórmula de la fracción óptima puede interpretarse como el exceso de la tasa de ingresos esperada de -th caballo sobre la tasa de reserva dividido por los ingresos después de la deducción de la pista tomar cuando -th caballo gana o como el exceso de la probabilidad de -th caballo ganando sobre la tasa de reserva dividido por los ingresos después de la deducción de la pista cuando -th caballo gana. El exponente de crecimiento binario es
y el tiempo de duplicación es
Este método de selección de apuestas óptimas puede aplicarse también cuando las probabilidades son conocidos solo por varios de los resultados más prometedores, mientras que los resultados restantes no tienen ninguna posibilidad de ganar. En este caso debe ser que
- y
- .
Aplicación al mercado de valores
En finanzas matemáticas, una cartera se denomina crecimiento óptimo si las ponderaciones de los valores maximizan la tasa de crecimiento geométrico esperada (que es equivalente a maximizar la riqueza logarítmica). [ cita requerida ]
Los cálculos de carteras óptimas de crecimiento pueden sufrir tremendos problemas de entrada y salida de basura. [ cita requerida ] Por ejemplo, los casos siguientes dan por sentado el rendimiento esperado y la estructura de covarianza de varios activos, pero estos parámetros se estiman o modelan en el mejor de los casos con una incertidumbre significativa. El rendimiento ex post de una cartera supuestamente óptima para el crecimiento puede diferir fantásticamente con la predicción ex ante si las ponderaciones de la cartera se basan en gran medida en errores de estimación. Tratar la incertidumbre de los parámetros y el error de estimación es un tema importante en la teoría de carteras. [ cita requerida ]
El polinomio de Taylor de segundo orden se puede utilizar como una buena aproximación del criterio principal. Principalmente, es útil para la inversión en acciones, donde la fracción dedicada a la inversión se basa en características simples que pueden estimarse fácilmente a partir de datos históricos existentes: valor esperado y varianza . Esta aproximación conduce a resultados que son robustos y ofrecen resultados similares a los del criterio original. [dieciséis]
Activo único
Considerando un solo activo (acciones, fondo indexado, etc.) y una tasa libre de riesgo, es fácil obtener la fracción óptima para invertir mediante el movimiento browniano geométrico . El valor de un activo distribuido logarítmicamente en el momento () es
de la solución del movimiento browniano geométrico donde es un proceso de Wiener , y (deriva porcentual) y (el porcentaje de volatilidad) son constantes. Tomando expectativas del logaritmo:
Entonces el registro esperado regresa es
Para una cartera compuesta por un activo y una tasa libre de riesgo de pago de bonos , con fracción invertido en y en el bono, el rendimiento esperado de un período viene dado por
sin embargo, la gente parece lidiar con el retorno de registro esperado para un período en cambio en el contexto de Kelly:
Resolviendo obtenemos
es la fracción que maximiza el retorno logarítmico esperado y, por tanto, es la fracción de Kelly.
Thorp [13] llegó al mismo resultado pero a través de una derivación diferente.
Recuérdalo es diferente del rendimiento del registro de activos . Confundir esto es un error común que cometen los sitios web y los artículos que hablan sobre el Criterio de Kelly.
Muchos activos
Considere un mercado con acciones correlacionadas con retornos estocásticos , y un vínculo sin riesgo con retorno . Un inversor pone una fracción de su capital en y el resto se invierte en el bono. Sin pérdida de generalidad, suponga que el capital inicial del inversor es igual a 1. De acuerdo con el criterio de Kelly, se debe maximizar
Ampliando esto con una serie de Taylor alrededor obtenemos
Por lo tanto, reducimos el problema de optimización a la programación cuadrática y la solución sin restricciones es
dónde y son el vector de medias y la matriz de segundos momentos mixtos no centrales de los excesos de rendimiento.
También hay un algoritmo numérico para las estrategias de Kelly fraccionarias y para la solución óptima sin apalancamiento y sin restricciones de venta en corto. [17]
Crítica
Aunque la promesa de la estrategia de Kelly de hacerlo mejor que cualquier otra estrategia a largo plazo parece convincente, algunos economistas han argumentado enérgicamente en su contra, principalmente porque las limitaciones de inversión específicas de un individuo pueden anular el deseo de una tasa de crecimiento óptima. [8] La alternativa convencional es la teoría de la utilidad esperada, que dice que las apuestas deben dimensionarse para maximizar la utilidad esperada del resultado (para un individuo con utilidad logarítmica , la apuesta de Kelly maximiza la utilidad esperada, por lo que no hay conflicto; además, el artículo original de Kelly establece claramente la necesidad de una función de utilidad en el caso de los juegos de azar que se juegan un número finito de veces [1] ). Incluso los partidarios de Kelly suelen argumentar a favor de Kelly fraccional (apostar una fracción fija de la cantidad recomendada por Kelly) por una variedad de razones prácticas, como desear reducir la volatilidad o protegerse contra errores no deterministas en sus cálculos de ventaja (ventaja). [18]
Ver también
- Riesgo de ruina
- Teoría del juego y la información
- La paradoja de Proebsting
- El problema de la cartera de Merton
Referencias
- ↑ a b c d Kelly, JL (1956). "Una nueva interpretación de la tasa de información" (PDF) . Revista técnica de Bell System . 35 (4): 917–926. doi : 10.1002 / j.1538-7305.1956.tb03809.x .
- ^ Thorp, EO (enero de 1961), "Fórmula de la fortuna: El juego del blackjack", Sociedad matemática estadounidense
- ^ Thorp, EO (1962), Beat the dealer: una estrategia ganadora para el juego de veintiuno. Un análisis científico del juego mundial conocido como blackjack, veintiuno, vingt-et-un, pontón o Van John , Blaisdell Pub. Co
- ^ Thorp, Edward O .; Kassouf, Sheen T. (1967), Beat the Market: A Scientific Stock Market System (PDF) , Random House, ISBN 0-394-42439-5, archivado desde el original (PDF) el 2009-10-07, página 184 y siguientes.
- ^ Zenios, SA; Ziemba, WT (2006), Manual de gestión de activos y pasivos , Holanda Septentrional, ISBN 978-0-444-50875-1
- ^ Pabrai, Mohnish (2007), The Dhandho Investor: el método de valor de bajo riesgo para obtener altos rendimientos , Wiley, ISBN 978-0-470-04389-9
- ^ Thorp, EO (septiembre de 2008), "El criterio de Kelly: Parte II", Revista Wilmott
- ^ a b Poundstone, William (2005), Fórmula de la fortuna: La historia no contada del sistema científico de apuestas que venció a los casinos y Wall Street , Nueva York: Hill and Wang, ISBN 0-8090-4637-7
- ^ https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2856963
- ^ "Buttonwood", "Lanzadores irracionales" , The Economist Newspaper Limited 2016 , 1 de noviembre de 2016.
- ^ Presione, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007), "Sección 14.7 (Ejemplo 2)" , Recetas numéricas: El arte de la informática científica (3ª ed.), Nueva York: Cambridge University Press, ISBN 978-0-521-88068-8
- ^ Thorp, EO (1969). "Sistemas de juego óptimos para juegos favorables" . Revue de l'Institut International de Statistique / Revista del Instituto Internacional de Estadística . Instituto Internacional de Estadística (ISI). 37 (3): 273-293. doi : 10.2307 / 1402118 . JSTOR 1402118 . Señor 0135630 .
- ^ a b Thorp, Edward O. (junio de 1997). "El criterio de Kelly en el blackjack, las apuestas deportivas y el mercado de valores" (PDF) . X Congreso Internacional de Juego y Asunción de Riesgos . Montreal. Archivado desde el original (PDF) el 20 de marzo de 2009 . Consultado el 20 de marzo de 2009 .
- ^ Bernoulli, Daniel (1954) [1738]. "Exposición de una nueva teoría sobre la medición del riesgo". Econometrica . La sociedad econométrica . 22 (1): 22–36. doi : 10.2307 / 1909829 . JSTOR 1909829 .
- ^ a b c d Smoczynski, Peter; Tomkins, Dave (2010) "Una solución explícita al problema de optimizar las asignaciones de la riqueza de un apostador al apostar en carreras de caballos", Mathematical Scientist ", 35 (1), 10-17
- ^ Marek, Patrice; Ťoupal, Tomáš; Vávra, František (2016). "Distribución eficiente del capital de inversión" . 34ª Conferencia Internacional de Métodos Matemáticos en Economía, MME2016, Actas de la conferencia : 540–545 . Consultado el 24 de enero de 2018 .
- ^ Nekrasov, Vasily (2013). "Criterio de Kelly para carteras multivariantes: un enfoque sin modelos". SSRN 2259133 . Cite journal requiere
|journal=
( ayuda ) - ^ Thorp, EO (mayo de 2008), "El criterio de Kelly: Parte I", Revista Wilmott