Intel Tera-Scale es un programa de investigación de Intel que se centra en el desarrollo de procesadores y plataformas Intel que utilizan el paralelismo inherente de las aplicaciones emergentes de computación visual. Estas aplicaciones requieren teraFLOPS de rendimiento informático paralelo para procesar terabytes de datos rápidamente. [1] El paralelismo es el concepto de realizar múltiples tareas simultáneamente. La utilización del paralelismo no solo aumentará la eficiencia de las unidades de procesamiento de computadora (CPU), sino que también aumentará los bytes de datos analizados cada segundo. Para aplicar adecuadamente el paralelismo, la CPU debe poder manejar múltiples subprocesosy para hacerlo, la CPU debe constar de varios núcleos. La cantidad convencional de núcleos en las computadoras de consumo es de 2 a 8 núcleos, mientras que las computadoras de estación de trabajo pueden tener cantidades aún mayores. Sin embargo, incluso la cantidad actual de núcleos no es lo suficientemente grande para funcionar con un rendimiento de teraFLOPS, lo que lleva a una cantidad aún mayor de núcleos que deben agregarse. Como resultado del programa, se han fabricado dos prototipos que se utilizaron para probar la viabilidad de tener muchos más núcleos que la cantidad convencional y demostraron ser exitosos.
Prototipos
El chip de investigación Teraflops (Polaris) es un prototipo de procesador de 80 núcleos desarrollado por Intel en 2007. Representa el primer intento público de Intel de crear un procesador Tera-Scale. El procesador Polaris debe ejecutarse a 3,13 GHz y 1 V para mantener su nombre teraFLOP. En su máximo rendimiento, el procesador es capaz de 1,28 teraFLOP. [2]
Cloud Computer de un solo chip es otro procesador de investigación desarrollado por Intel en 2009. Este procesador consta de 48 núcleos P54C conectados en una malla 2D 6x4. [3]
Ideología
El paralelismo es el concepto de realizar múltiples tareas simultáneamente, reduciendo efectivamente el tiempo necesario para realizar una determinada tarea. El programa de investigación Tera-Scale se centra en el concepto de utilizar muchos más núcleos que los convencionales para aumentar el rendimiento con paralelismo. Según su experiencia anterior con un mayor número de núcleos en las CPU, al duplicar el número de núcleos, se logró casi duplicar el rendimiento sin aumentar la potencia. Con una mayor cantidad de núcleos, existen posibilidades de una mayor eficiencia energética, un mejor rendimiento, una mayor vida útil y nuevas capacidades. Los procesadores Tera-Scale mejorarían la eficiencia energética al poder "poner en reposo" los núcleos que no son necesarios en ese momento y al mismo tiempo mejorar el rendimiento mediante la redistribución inteligente de las cargas de trabajo para garantizar una distribución uniforme de la carga de trabajo en el chip. Los procesadores a escala tera también permiten una vida útil prolongada debido a la posibilidad de tener núcleos de reserva que podrían ponerse en línea cuando un núcleo falla en el procesador. Por último, los procesadores obtendrían nuevas capacidades y funcionalidades a medida que se pudieran integrar motores de hardware dedicados, como motores gráficos. [4]
Hardware
Intel Tera-Scale se centra en la creación de procesadores de varios núcleos que pueden utilizar el procesamiento paralelo para alcanzar teraFLOPS de rendimiento informático. Los procesadores actuales constan de núcleos muy complicados; sin embargo, los núcleos actuales están construidos de una manera que dificulta tener más de la cantidad actual de núcleos en las CPU. Como resultado, Intel actualmente se enfoca en crear procesadores Tera-Scale con muchos núcleos en lugar de núcleos de alto rendimiento. Para simplificar los núcleos de la CPU, Intel pasó de las CPU que utilizan la arquitectura x86 a una arquitectura VLIW mucho más simple . VLIW es una arquitectura poco común para computadoras de escritorio, pero es adecuada para computadoras que ejecutan aplicaciones especializadas. Esta arquitectura simplifica el diseño de hardware a costa de aumentar la carga de trabajo en el lado del compilador, lo que significa que se debe dedicar más trabajo a la programación. Este inconveniente se compensa con el hecho de que la cantidad de aplicaciones que se ejecutarán en un procesador Tera-Scale es lo suficientemente baja como para que no sea una carga excesiva para el software. [2]
Software
Con el lanzamiento del procesador de núcleo Polaris 80 en 2007, la gente cuestionó la necesidad de decenas o cientos de núcleos. Intel respondió con una categoría de software llamada aplicaciones de reconocimiento, minería y síntesis (RMS) que requieren la potencia computacional de decenas o cientos de núcleos. Las aplicaciones de reconocimiento crean modelos basados en lo que identifican, como el rostro de una persona. Las aplicaciones de minería extraen una o más instancias de una gran cantidad de datos. Por último, las aplicaciones de síntesis permiten predecir y proyectar nuevos entornos. Un ejemplo de dónde son necesarios los procesadores RMS y teraescala es la creación de resúmenes deportivos. Por lo general, los resúmenes deportivos requieren horas para que una computadora explore cientos de miles de fotogramas de video para encontrar clips de acción cortos que se mostrarán en los resúmenes deportivos. Con el software RMS y un procesador de escala tera, se pueden crear resúmenes deportivos en tiempo real durante los eventos deportivos. [1] Los procesadores Tera-Scale también muestran potencial en el análisis en tiempo real en campos como las finanzas, que requiere un procesador que sea capaz de analizar inmensas cantidades de datos. A partir de la evolución pasada de Intel de procesadores de un solo núcleo a procesadores de múltiples núcleos, Intel ha aprendido que la paralelización es la clave para una mayor potencia de procesamiento en el futuro. El programa de investigación Intel Tera-Scale no solo se centra en la creación de procesadores de varios núcleos, sino también en las aplicaciones de paralelización de hoy y del futuro. Para mostrar su dedicación a todos los aspectos de la computación paralela, Intel reservó $ 20 millones para establecer centros que investigarán y desarrollarán nuevos métodos que utilicen la computación paralela en muchas más aplicaciones. [5]
Desafíos
A principios de 2005, Intel se encontró originalmente con el problema del ancho de banda de la memoria. A medida que se agregan más núcleos, el ancho de banda de la memoria sigue siendo el mismo debido a las restricciones de tamaño, lo que genera un cuello de botella en la CPU. Pudieron superar el problema mediante un proceso llamado apilamiento de troqueles. Este es un proceso en el que la CPU muere , la memoria flash y la DRAM se apilan una encima de la otra, lo que aumenta significativamente los posibles anchos de bus de memoria. [2] Otro desafío que enfrentó Intel fueron las limitaciones físicas de los buses eléctricos. Un ancho de banda de bus es la conexión de la CPU al mundo exterior y con el ancho de banda de bus actual, no podría mantenerse al día con el rendimiento de teraFLOPs resultante de los procesadores de teraescala. La investigación de Intel sobre Silicon Photonics ha producido un bus óptico funcional que puede ofrecer una velocidad de señalización y una eficiencia energética superiores en comparación con los buses actuales. Estos buses ópticos son una solución ideal para la limitación del ancho de banda del bus para procesadores de escala tera. [2]
Referencias
- ^ a b Celebrado, Jim; Bautista, Jerry; Koehl, Sean (2006). "De unos pocos núcleos a muchos: una descripción general de la investigación informática a escala Tera" (PDF) . Investigación de White Paper en Intel . Intel Corporation . Consultado el 28 de octubre de 2014 .
- ^ a b c d Shimpi, Anand Lal. "La era de Tera: Intel revela más sobre la CPU de 80 núcleos" . AnandTech . Consultado el 29 de octubre de 2014 .
- ^ Mattson, Tim. "Uso de la computadora en la nube de un solo chip (SCC) de Intel" (PDF) . Consultado el 11 de noviembre de 2014 .
- ^ "Descripción general de la arquitectura de computación a escala tera" . Intel. Archivado desde el original el 29 de noviembre de 2014 . Consultado el 2 de enero de 2017 .
- ^ Ferguson, Scott. "Microsoft, Intel destinan 20 millones de dólares a la informática en paralelo" . eWeek . Consultado el 6 de noviembre de 2014 .