premio netflix

El Premio Netflix fue un concurso abierto al mejor algoritmo de filtrado colaborativo para predecir las calificaciones de los usuarios para las películas , basado en calificaciones anteriores sin ninguna otra información sobre los usuarios o las películas, es decir, sin identificar a los usuarios o las películas excepto por los números asignados para el concurso. .

La competencia fue organizada por Netflix , un servicio de transmisión de video y alquiler de DVD en línea, y estaba abierta a cualquier persona que no esté conectada con Netflix (empleados actuales y anteriores, agentes, parientes cercanos de los empleados de Netflix, etc.) ni residente de ciertos países bloqueados (como Cuba o Corea del Norte). ^[1] El 21 de septiembre de 2009, el gran premio de US $ 1,000,000 fue otorgado al equipo Pragmatic Chaos de BellKor, que superó el propio algoritmo de Netflix para predecir calificaciones en un 10,06%. ^[2]

Netflix proporcionó un conjunto de datos de capacitación de 100 480 507 calificaciones que 480 189 usuarios otorgaron a 17 770 películas. Cada calificación de entrenamiento es un cuádruple de la forma <user, movie, date of grade, grade>. Los campos de usuario y película son ID de números enteros , mientras que las calificaciones son de 1 a 5 ( número entero ) estrellas. ^[3]

El conjunto de datos de calificación contiene más de 2.817.131 tripletes de la forma <user, movie, date of grade>, con calificaciones conocidas solo por el jurado. El algoritmo de un equipo participante debe predecir las calificaciones en todo el conjunto de clasificación, pero se les informa de la puntuación de solo la mitad de los datos: un conjunto de prueba de 1.408.342 calificaciones. La otra mitad es el conjunto de prueba de 1.408.789, y el jurado utiliza su rendimiento para determinar los posibles ganadores del premio. Solo los jueces saben qué calificaciones están en el conjunto de pruebas y cuáles están en el conjunto de prueba; este arreglo tiene la intención de dificultar la escalada en el conjunto de prueba. Las predicciones enviadas se puntúan frente a las calificaciones reales en forma de error cuadrático medio(RMSE), y el objetivo es reducir este error tanto como sea posible. Tenga en cuenta que, si bien las calificaciones reales son números enteros en el rango de 1 a 5, no es necesario que las predicciones enviadas lo sean. Netflix también identificó un subconjunto de sondeo de 1 408 395 calificaciones dentro del conjunto de datos de capacitación . Los conjuntos de datos de sonda , cuestionario y prueba se eligieron para tener propiedades estadísticas similares.

Para cada película, el título y el año de lanzamiento se proporcionan en un conjunto de datos separado. No se proporciona ninguna información sobre los usuarios. Para proteger la privacidad de los clientes, "algunos de los datos de calificación de algunos clientes en los conjuntos de capacitación y calificación se han alterado deliberadamente de una o más de las siguientes maneras: eliminando calificaciones, insertando calificaciones y fechas alternativas y modificando la calificación fechas." ^[2]

El conjunto de entrenamiento está construido de tal manera que el usuario promedio calificó más de 200 películas, y la película promedio fue calificada por más de 5000 usuarios. Pero hay una gran variación en los datos: algunas películas en el conjunto de entrenamiento tienen solo 3 calificaciones, ^[4] mientras que un usuario calificó más de 17,000 películas. ^[5]