Matchbox Educable Noughts and Crosses Engine


El motor Matchbox Educable Noughts and Crosses (a veces llamado Machine Educable Noughts and Crosses Engine o MENACE ) era una computadora mecánica hecha de 304 cajas de fósforos diseñadas y construidas por el investigador de inteligencia artificial Donald Michie en 1961. Fue diseñado para jugar con oponentes humanos en juegos de ceros y cruces (tic-tac-toe) devolviendo un movimiento para cualquier estado de juego dado y para refinar su estrategia a través del aprendizaje por refuerzo .

Michie no tenía una computadora disponible, por lo que evitó esta restricción construyéndola con cajas de cerillas. Cada una de las cajas de fósforos utilizadas por Michie representaba un único diseño posible de una cuadrícula de ceros y cruces. Cuando la computadora jugaba por primera vez, elegía movimientos aleatoriamente según el diseño actual. A medida que jugaba más juegos, a través de un ciclo de refuerzo, descalificó las estrategias que llevaron a perder juegos y complementó las estrategias que llevaron a ganar juegos. Michie celebró un torneo contra MENACE en 1961, en el que experimentó con diferentes aperturas.

Después del torneo inaugural de MENACE contra Michie, demostró inteligencia artificial exitosa en su estrategia. Los ensayos de Michie sobre la inicialización de peso de MENACE y el algoritmo BOXES utilizado por MENACE se hicieron populares en el campo de la investigación en ciencias de la computación. Michie fue honrado por su contribución a la investigación del aprendizaje automático y recibió el encargo dos veces de programar una simulación de MENACE en una computadora real.

Donald Michie (1923-2007) había estado en el equipo que descifró el Código de los túnidos alemán durante la Segunda Guerra Mundial . [1] Quince años más tarde, quería mostrar aún más su destreza matemática y computacional con una red neuronal convolucional temprana . Dado que no se podía obtener equipo informático para tales usos, [2] y Michie no tenía una computadora disponible, [2] decidió mostrar y demostrar inteligencia artificial en un formato más esotérico y construyó una computadora mecánica funcional con cajas de fósforos y cuentas. . [3] [4]

MENACE fue construido como resultado de una apuesta con un colega de informática que postuló que tal máquina era imposible. [5] Michie asumió la tarea de recopilar y definir cada caja de fósforos como un "proyecto divertido", que luego se convirtió en una herramienta de demostración. [6] Michie completó su ensayo sobre MENACE en 1963, [4] "Experimentos sobre la mecanización del aprendizaje mediante juegos", así como su ensayo sobre el algoritmo BOXES, escrito con RA Chambers [6] y había desarrollado una investigación de IA unidad en Hope Park Square, Edimburgo , Escocia . [7]

MENACE "aprendió" jugando cada vez más partidos de ceros y cruces. Cada vez, eliminaría una estrategia perdedora por parte del jugador humano confiscando las cuentas que correspondían a cada movimiento. [4] Reforzó las estrategias ganadoras al hacer que los movimientos fueran más probables, al proporcionar cuentas adicionales. [8] Esta fue una de las primeras versiones del Reinforcement Loop , el algoritmo esquemático de hacer un bucle en el algoritmo, descartando estrategias fallidas hasta que solo quedan las ganadoras. [4] Este modelo comienza como completamente aleatorio y aprende gradualmente. [9]


Recreación de la amenaza
Una recreación de MENACE construida en 2015
Estrategia óptima de ceros y cruces
Estrategia óptima para el jugador X si comienza en una esquina. En cada cuadrícula, la X roja sombreada denota el movimiento óptimo, y la ubicación del próximo movimiento de O da la siguiente subcuadrícula para examinar.
Gráfico de dispersión del torneo de Michie.
Un gráfico de dispersión que muestra los resultados de las partidas de Donald Michie contra MENACE.