Un sistema de calificación deportiva es un sistema que analiza los resultados de las competiciones deportivas para proporcionar calificaciones para cada equipo o jugador. Los sistemas comunes incluyen encuestas de votantes expertos, crowdsourcing de votantes no expertos, mercados de apuestas y sistemas informáticos. Las clasificaciones, o clasificaciones de poder , son representaciones numéricas de la fuerza competitiva, a menudo directamente comparables para que se pueda predecir el resultado del juego entre dos equipos cualesquiera. Las clasificaciones , o clasificaciones de poder , se pueden proporcionar directamente (p. Ej., Pidiendo a las personas que clasifiquen los equipos), o se pueden derivar clasificando las clasificaciones de cada equipo y asignando un ordinal.rango a cada equipo, de modo que el equipo mejor calificado gane el rango # 1. Los sistemas de clasificación brindan una alternativa a las clasificaciones deportivas tradicionales que se basan en proporciones de empates ganados-perdidos.
En los Estados Unidos, el uso más grande de los sistemas de clasificación de deportes es calificar a los equipos de fútbol americano universitario de la NCAA en la División I FBS , eligiendo equipos para jugar en la eliminatoria de fútbol americano universitario . Los sistemas de clasificación deportiva también se utilizan para ayudar a determinar el campo para los torneos de baloncesto masculino y femenino de la NCAA , los torneos de golf profesional masculino, los torneos de tenis profesional y NASCAR . A menudo se mencionan en discusiones sobre los equipos que podrían o deberían recibir invitaciones para participar en ciertos concursos, a pesar de no obtener la vía de entrada más directa (como un campeonato de liga). [1]
Los sistemas de clasificación por computadora pueden tender hacia la objetividad , sin un jugador, equipo, región o sesgo de estilo específico. Ken Massey escribe que una ventaja de los sistemas de clasificación por computadora es que pueden "rastrear objetivamente a todos" los 351 equipos de baloncesto universitarios, mientras que las encuestas humanas "tienen un valor limitado". [2] Las calificaciones por computadora son verificables y repetibles, y son completas, lo que requiere la evaluación de todos los criterios seleccionados. En comparación, los sistemas de clasificación que se basan en encuestas humanas incluyen la subjetividad humana inherente; esto puede o no ser una propiedad atractiva dependiendo de las necesidades del sistema.
Historia
Los sistemas de calificaciones deportivas han existido durante casi 80 años, cuando las calificaciones se calculaban en papel en lugar de por computadora, como la mayoría lo hace hoy. Algunos sistemas informáticos más antiguos que todavía se utilizan en la actualidad incluyen: los sistemas de Jeff Sagarin, el sistema del New York Times y el índice Dunkel , que se remonta a 1929. Antes del advenimiento de los playoffs de fútbol americano universitario, los participantes del juego de campeonato de la Bowl Championship Series estaban determinados por una combinación de encuestas de expertos y sistemas informáticos.
Teoría
Los sistemas de clasificación deportiva utilizan una variedad de métodos para clasificar equipos, pero el método más común se llama clasificación de potencia. La potencia nominal de un equipo es un cálculo de la fuerza del equipo en relación con otros equipos de la misma liga o división. La idea básica es maximizar la cantidad de relaciones transitivas en un conjunto de datos dado debido a los resultados del juego. Por ejemplo, si A derrota a B y B derrota a C, entonces se puede decir con seguridad que A> B> C.
Existen problemas obvios al basar un sistema únicamente en victorias y derrotas. Por ejemplo, si C vence a A, entonces se establece una relación intransitiva (A> B> C> A) y se producirá una infracción de clasificación si estos son los únicos datos disponibles. Escenarios como este ocurren con bastante regularidad en los deportes; por ejemplo, en la temporada de fútbol americano de la División IA de la NCAA de 2005 , Penn State venció a Ohio State , Ohio State venció a Michigan y Michigan venció a Penn State. Para abordar estas fallas lógicas, los sistemas de clasificación suelen considerar otros criterios, como la puntuación del juego y dónde se llevó a cabo el partido (por ejemplo, para evaluar una ventaja de campo local ). Sin embargo, en la mayoría de los casos, cada equipo juega una cantidad suficiente de otros juegos durante una temporada determinada, lo que reduce el efecto general de tales violaciones.
Desde una perspectiva académica , el uso de álgebra lineal y estadística es popular entre muchos de los autores de los sistemas para determinar sus calificaciones. Algunos trabajos académicos se publican en foros como el MIT Sloan Sports Analytics Conference , otros en revistas tradicionales de estadística, matemáticas, psicología e informática.
Si no se logra suficiente juego de liga "entre divisiones", los equipos en una división aislada pueden ser artificialmente apuntalados hacia arriba o hacia abajo en las calificaciones generales debido a la falta de correlación con otros equipos en la liga general. Este fenómeno es evidente en los sistemas que analizan temporadas históricas de fútbol americano universitario, como cuando algunos sistemas de clasificación calcularon que los mejores equipos de la Ivy League de la década de 1970, como Dartmouth , eran comparables con los equipos consumados de esa época, como Nebraska , USC , y el estado de Ohio . Esto entra en conflicto con la opinión subjetiva que afirma que, si bien son buenos por derecho propio, no eran tan buenos como los programas principales. Sin embargo, los equipos que no pertenecen a la BCS en el fútbol universitario de la División IA pueden considerar esto como un "profesional" , quienes señalan que los sistemas de clasificación han demostrado que sus mejores equipos pertenecen al mismo estrato que los equipos de la BCS. Esto se evidencia en el equipo de Utah de 2004 que quedó invicto en la temporada regular y ganó una oferta de tazón de BCS debido al aumento en sus calificaciones generales de BCS a través del componente de calificaciones de computadora. Continuaron jugando y derrotaron al campeón de la Conferencia Big East, Pittsburgh, en el Fiesta Bowl 2005 por una puntuación de 35-7. Un ejemplo relacionado ocurrió durante el Torneo de Baloncesto Masculino de la NCAA de 2006 , donde George Mason recibió una oferta de torneo general debido a su récord de temporada regular y su calificación de RPI y aprovechó esa oportunidad hasta la Final Four .
Los objetivos de algunos sistemas de clasificación difieren entre sí. Por ejemplo, los sistemas pueden diseñarse para proporcionar un análisis retrodictivo perfecto de los juegos jugados hasta la fecha, mientras que otros son predictivos y dan más peso a las tendencias futuras que a los resultados pasados. Esto da como resultado la posibilidad de una mala interpretación de los resultados del sistema de clasificación por parte de personas que no estén familiarizadas con estos objetivos; por ejemplo, un sistema de clasificación diseñado para proporcionar predicciones precisas de distribución de puntos para los jugadores podría no ser adecuado para seleccionar los equipos que más merecen jugar en un campeonato o torneo.
Consideraciones de calificación
Ventaja de casa
Cuando juegan dos equipos de igual calidad, el equipo de casa tiende a ganar con más frecuencia. El tamaño del efecto cambia según la era del juego, el tipo de juego, la duración de la temporada, el deporte e incluso el número de zonas horarias cruzadas . Pero en todas las condiciones, "simplemente jugar en casa aumenta las posibilidades de ganar". [3] Por lo tanto, una victoria fuera de casa se ve más favorablemente que una victoria en casa, porque fue más desafiante. La ventaja de jugar en casa (que, para los deportes que se juegan en un campo, casi siempre se llama "ventaja de jugar en casa") también se basa en las cualidades del estadio individual y del público; la ventaja en la NFL puede ser más de 4 puntos de diferencia del estadio con la menor ventaja al estadio con más. [4]
Fuerza del horario
La fuerza del horario se refiere a la calidad de los oponentes de un equipo. Una victoria contra un oponente inferior generalmente se considera menos favorable que una victoria contra un oponente superior. A menudo, los equipos de la misma liga, que se comparan entre sí para considerar el campeonato o los playoffs, no han enfrentado a los mismos oponentes. Por lo tanto, juzgar sus registros relativos de victorias y derrotas es complicado.
Miramos más allá del registro. El comité valoró significativamente la calidad de las victorias de Oregon.
- Jeff Long , presidente del comité de playoffs de fútbol americano universitario , conferencia de prensa, semana 12 de la temporada 2014, [5] después de ocupar el puesto 9-1 en Oregon por encima del 9-0 en Florida State
El comité de playoffs de fútbol americano universitario utiliza un algoritmo de fuerza de horario limitado que solo considera los registros de los oponentes y los registros de los oponentes de los oponentes [6] (muy parecido al RPI ).
Puntos versus victorias
Una dicotomía clave entre los sistemas de clasificación deportiva radica en la representación de los resultados del juego. Algunos sistemas almacenan las puntuaciones finales como eventos ternarios discretos: victorias, empates y derrotas. Otros sistemas registran la puntuación final exacta del juego y luego juzgan a los equipos según el margen de victoria . La calificación de equipos basada en el margen de victoria a menudo es criticada por crear un incentivo para que los entrenadores aumenten la puntuación, un resultado "antideportivo". [7]
Aún otros sistemas eligen un término medio, reduciendo el valor marginal de los puntos adicionales a medida que aumenta el margen de victoria. Sagarin optó por reducir el margen de la victoria a una cantidad predeterminada. [8] Otros enfoques incluyen el uso de una función de desintegración, como un logaritmo o la ubicación en una función de distribución acumulativa .
Información del juego
Más allá de los puntos o las victorias, algunos diseñadores de sistemas optan por incluir información más detallada sobre el juego. Los ejemplos incluyen el tiempo de posesión de la pelota, las estadísticas individuales y los cambios de ventaja. Los datos sobre el clima, las lesiones o los juegos "desechables" cerca del final de la temporada pueden afectar los resultados del juego, pero son difíciles de modelar. Los "juegos desechables" son juegos en los que los equipos ya han ganado espacios en los playoffs y han asegurado su siembra de playoffs antes del final de la temporada regular, y quieren descansar / proteger a sus jugadores titulares colocándolos en la banca para los juegos restantes de la temporada regular. Esto generalmente da como resultado resultados impredecibles y puede sesgar el resultado de los sistemas de calificación.
Composición del equipo
Los equipos a menudo cambian su composición entre y dentro de los juegos, y los jugadores se lesionan de forma rutinaria. La calificación de un equipo a menudo se trata de calificar una colección específica de jugadores. Algunos sistemas asumen la paridad entre todos los miembros de la liga, como que cada equipo se construye a partir de un grupo equitativo de jugadores a través de un draft o un sistema de agencia libre como se hace en muchos deportes de las grandes ligas como la NFL , MLB , NBA y NHL . Ciertamente, este no es el caso en ligas universitarias como el fútbol de la División IA o el baloncesto masculino y femenino.
Inicio fresco
Al comienzo de una temporada, no ha habido juegos para juzgar la calidad relativa de los equipos. Las soluciones al problema del arranque en frío a menudo incluyen alguna medida de la temporada anterior, quizás ponderada por el porcentaje del equipo que regresa para la nueva temporada. ARGH Power Ratings es un ejemplo de un sistema que utiliza varios años anteriores más un porcentaje de peso de los jugadores que regresan.
Métodos de calificación
Permutación de posiciones
Varios métodos ofrecen alguna permutación de las clasificaciones tradicionales. Esta búsqueda del registro "real" de victorias y derrotas a menudo implica el uso de otros datos, como el diferencial de puntos o la identidad de los oponentes, para alterar el registro de un equipo de una manera que sea fácilmente comprensible. El escritor deportivo Gregg Easterbrook creó una medida de Authentic Games, que solo considera los juegos jugados contra oponentes considerados de suficiente calidad. [9] El consenso es que no todos los triunfos son iguales.
Pasé las primeras semanas de juegos y rehice los récords de todos, etiquetando cada juego como una victoria o una derrota legítima, una victoria o una derrota espectacular, o un juego de una u otra. Y si algo más sucedió en ese juego con repercusiones en el juego (una victoria de regreso, una ventaja rota, una disfunción importante, lo que sea), también lo etiqueté.
- Bill Simmons , periodista deportivo, Grantland [10]
pitagórico
La expectativa pitagórica, o proyección pitagórica, calcula un porcentaje basado en la cantidad de puntos que un equipo ha anotado y permitido. Normalmente, la fórmula implica el número de puntos anotados, elevado a algún exponente, colocado en el numerador. Luego, el número de puntos que el equipo permitió, elevado al mismo exponente, se coloca en el denominador y se suma al valor en el numerador. Football Outsiders ha utilizado [11]
El porcentaje resultante a menudo se compara con el porcentaje de victorias real de un equipo, y se dice que un equipo ha "superado" o "bajo rendimiento" en comparación con las expectativas pitagóricas. Por ejemplo, Bill Barnwell calculó que antes de la semana 9 de la temporada 2014 de la NFL, los Arizona Cardinals tenían un récord pitagórico dos victorias menos que su récord real. [12] Bill Simmons cita el trabajo de Barnwell antes de la semana 10 de esa temporada y agrega que "cualquier nerd de números está agitando un" ¡¡¡¡REGRESIÓN !!!!! " bandera ahora mismo ". [13] En este ejemplo, el récord de temporada regular de los Arizona Cardinals fue 8-1 entrando en la décima semana de la temporada 2014. La fórmula de victoria pitagórica implicó un porcentaje de victorias del 57,5%, basado en 208 puntos anotados y 183 puntos permitidos. Multiplicado por 9 juegos jugados, la expectativa pitagórica de los Cardinals fue de 5.2 victorias y 3.8 derrotas. El equipo había "superado" en ese momento por 2,8 victorias, derivadas de sus 8 victorias reales menos las 5,2 victorias esperadas, un aumento de 0,8 victorias superadas solo una semana antes.
Intercambiar "puntos de habilidad"
Diseñado originalmente por Arpad Elo como un método para clasificar a los jugadores de ajedrez, varias personas han adaptado el sistema de clasificación Elo para deportes de equipo como baloncesto, fútbol y fútbol americano. Por ejemplo, Jeff Sagarin y FiveThirtyEight publican clasificaciones de fútbol americano de la NFL utilizando métodos Elo. [14] Las calificaciones Elo inicialmente asignan valores de fuerza a cada equipo, y los equipos intercambian puntos según el resultado de cada juego.
Resolver ecuaciones
Investigadores como Matt Mills usan cadenas de Markov para modelar juegos de fútbol americano universitario, con puntajes de fuerza del equipo como resultados. [15] Los algoritmos como el PageRank de Google también se han adaptado para clasificar los equipos de fútbol. [16] [17]
Lista de sistemas de clasificación deportiva
- Estadísticas avanzadas de la NFL , Liga Nacional de Fútbol de los Estados Unidos de América
- Clasificaciones de potencia ARGH
- Ranking ATP , tenis internacional
- Matriz de Colley
- Dickinson System , fútbol universitario de los Estados Unidos de América
- Pomeroy College Basketball Ratings , baloncesto universitario de los Estados Unidos de América
- Índice de porcentaje de calificaciones (RPI) , baloncesto , béisbol , sóftbol , hockey , fútbol , lacrosse y voleibol de la NCAA de los Estados Unidos de América
- Índice Cualitativo Smithman , fútbol de los Estados Unidos de América - obsoleto
- Calificaciones de potencia de Sonny Moore
- TrueSkill , un sistema de clasificación bayesiano inspirado en el sistema de clasificación Glicko [18]
Sistemas de clasificación por computadora de la Serie Bowl Championship
En el fútbol americano colegiado, se utilizaron los siguientes sistemas de personas para elegir equipos para jugar en el juego del campeonato nacional.
- Anderson y Hester / Seattle Times
- Richard Billingsley
- Wes Colley / Atlanta Journal-Constitution
- Richard Dunkel
- Kenneth Massey
- Herman Matthews / Scripps Howard
- New York Times
- David Rothman
- Jeff Sagarin / USA Today
- Peter Wolfe
Otras lecturas
Bibliografias
- Wilson, David. "Bibliografía sobre sistemas de clasificación de fútbol universitario" . Universidad de Wisconsin – Madison . Consultado el 18 de noviembre de 2014 .
Prensa popular
- Feng, Ed (24 de noviembre de 2014). "Cómo entender el análisis de fútbol americano universitario: la guía definitiva" . El rango de poder .
- Mather, Victor (23 de octubre de 2012). "Los clasificadores de fútbol americano universitario por docena hacen la pregunta n . ° 1" . New York Times .
- Wayne Winston es profesor de ciencias de la decisión en la Universidad de Indiana y fue compañero de clase de Jeff Sagarin en el MIT. [19] Publicó varias ediciones de un texto en el software de hoja de cálculo de Microsoft Excel que incluye material sobre la clasificación de equipos deportivos, así como un libro enfocado directamente en este tema. Él y Sagarin crearon sistemas de clasificación juntos. [20]
- Winston, Wayne L. (2012). Mathletics: cómo los jugadores, gerentes y entusiastas de los deportes usan las matemáticas en el béisbol, el baloncesto y el fútbol . Prensa de la Universidad de Princeton. ISBN 978-1-4008-4207-0.
- Winston, Wayne L. (2009). Análisis de datos y modelado empresarial de Microsoft® Excel . Microsoft Press. ISBN 978-0-7356-3714-6.
Trabajo académico
- Barrow, Daniel; Drayer, Ian; Elliott, Peter; Gaut, Garren; Osting, Braxton (mayo de 2013). "Ranking de rankings: una comparación empírica del poder predictivo de los métodos de ranking deportivo". Revista de análisis cuantitativo en el deporte . 9 (2). doi : 10.1515 / jqas-2013-0013 . ISSN 1559-0410 .
- Gran parte de esta información está disponible en Sports Rankings REU Final Report 2012: An Analysis of Pairwise-Comparison Based Sports Ranking Methods and a New Age-Based Markovian Basketball Simulation at the Internet Archive PDF
- Gray, Kathy L .; Schwertman, Neil C. (marzo de 2012). "Comparación de selección de equipo y cabeza de serie para el torneo de baloncesto masculino de la NCAA 2011". Revista de análisis cuantitativo en el deporte . 8 (1). doi : 10.1515 / 1559-0410.1369 . ISSN 1559-0410 .
- Massey, Ken (primavera de 1997). "Proyecto de Honor en Matemáticas" (PDF) .disponible en Modelos estadísticos aplicados a la clasificación de equipos deportivos en Internet Archive PDF
- Mease, David (2003). "Un enfoque de máxima probabilidad penalizado para la clasificación de equipos de fútbol americano universitario independientemente de los márgenes de victoria" (PDF) . El estadístico estadounidense . 57 (4): 241–248. doi : 10.1198 / 0003130032396 .
Referencias
- ^ Fagan, Ryan (9 de marzo de 2011). "Clasificando equipos en una gran burbuja" . Noticias deportivas . Consultado el 24 de marzo de 2011 .
Este es un vistazo a 20 de los equipos (en orden alfabético) que residen en la gran burbuja de este año. Hemos incluido tres clasificaciones estadísticas. El RPI (índice de porcentaje de calificaciones, tomado de collegeRPI.com) se considera el estándar y se proporciona a los miembros del comité durante el proceso de selección. Los otros dos índices de clasificación incluyen el margen de victoria en sus fórmulas: las calificaciones de Pomeroy (en kenpom.com) y las calificaciones de Sagarin (a través de USA Today), no son nuevas, pero han desempeñado un papel más importante en las discusiones sobre posibles semillas durante este baloncesto universitario. estación.
- ^ Ken Massey [@masseyratings] (3 de noviembre de 2014). "Las encuestas humanas de @kenpomeroy tienen un valor limitado. Los sistemas informáticos pueden rastrear objetivamente a todos los equipos. www.masseyratings.com/cb/compare.htm # all351" (Tweet) . Consultado el 9 de noviembre de 2014 , a través de Twitter .
- ^ Jamieson, Jeremy P. (2010). "La ventaja del campo local en el atletismo: un metaanálisis" (PDF) . Revista de Psicología Social Aplicada . 40 (7): 1819–1848. doi : 10.1111 / j.1559-1816.2010.00641.x . Consultado el 11 de noviembre de 2014 .
- ^ Barnwell, Bill (20 de diciembre de 2013). "Seguro en casa" . Grantland . Consultado el 11 de noviembre de 2014 .
- ^ Russo, Ralph D. (11 de noviembre de 2014). "Oregon hasta el 2 en el ranking de playoffs; TCU al 4º" . Prensa asociada . Consultado el 12 de noviembre de 2014 .
- ^ Stewart Mandel [@slmandel] (12 de noviembre de 2014). "El comité no usa una clasificación SOS. Mira el historial de los oponentes y el historial de los oponentes" (Tweet) . Consultado el 12 de noviembre de 2014 , a través de Twitter .
- ^ Richards, Darryl (2001). "BCS elimina el elemento de margen de victoria" . Fox Sports . Consultado el 12 de noviembre de 2014 .
- ^ Sagarin, Jeff (otoño de 2014). "NCAAF Jeff Sagarin Ratings" . USA Today . Consultado el 12 de noviembre de 2014 .
- ^ Easterbrook, Gregg (18 de noviembre de 2014). "Más banderas en los marcadores de D spins" . ESPN . Consultado el 19 de noviembre de 2014 .
- ^ Simmons, Bill (24 de octubre de 2014). "Selecciones de la semana 8: una epifanía del juego" . Grantland . Consultado el 19 de noviembre de 2014 .
- ^ Schatz, Aaron; Alamar, Ben; Barnwell, Bill; Bill Connelly; Doug Farrar (2011). Football Outsiders Almanac 2011: La guía esencial para las temporadas de fútbol americano universitario y de la NFL 2011 . CreateSpace. pag. xviii. ISBN 978-1-4662-4613-3.
- ^ Barnwell, Bill (5 de noviembre de 2014). "NFL en la mitad: rompiendo los números" . Grantland . Consultado el 7 de enero de 2015 .
- ^ Simmons, Bill (7 de noviembre de 2014). "Revisando a los mariscales de campo que cumplen con el año 2000" . Consultado el 10 de noviembre de 2014 .
- ^ Silver, Nate (4 de septiembre de 2014). "Presentación de NFL Elo Ratings" . FiveThirtyEight . Consultado el 10 de noviembre de 2014 .
- ^ Mills, Matt (21 de diciembre de 2014). "Uso de cadenas de Markov de tiempo continuo para clasificar equipos de fútbol universitario" . La propagación . Consultado el 21 de diciembre de 2014 .
- ^ "Clasificación de equipos de la NFL utilizando Network Science" . LinkedIN . 17 de marzo de 2016 . Consultado el 17 de marzo de 2016 .
- ^ "Modificación del algoritmo de clasificación de páginas de Google para clasificar equipos" . Reddit . 21 de diciembre de 2014 . Consultado el 22 de diciembre de 2014 .
- ^ Weng, Ruby C .; Lin, Chih-Jen (2011). "Un método de aproximación bayesiana para la clasificación en línea" (PDF) . Revista de investigación sobre aprendizaje automático . 12 : 267–300.
- ^ "Wayne Winston: análisis en el mundo de los deportes" . Indiana University Bloomington - Kelley School of Business - Tecnologías de operaciones y decisiones . 25 de noviembre de 2013 . Consultado el 8 de noviembre de 2014 .
- ^ "Juego de números" . Washington Times . 13 de abril de 2004 . Consultado el 8 de noviembre de 2014 .