![]() | Este artículo debe actualizarse . ( Enero de 2014 ) |
La interconexión de Intel QuickPath ( QPI ) [1] [2] es un punto-a-punto procesador de interconexión desarrollado por Intel que sustituyó al bus frontal (FSB) en Xeon , Itanium , y ciertas plataformas de escritorio a partir de 2008. Se incrementó la escalabilidad y el ancho de banda disponible. Antes del anuncio del nombre, Intel se refirió a él como Common System Interface ( CSI ). [3] Las encarnaciones anteriores se conocían como Yet Another Protocol (YAP) y YAP +.
QPI 1.1 es una versión significativamente renovada introducida con Sandy Bridge-EP ( plataforma Romley ). [4]
QPI fue reemplazado por Intel Ultra Path Interconnect (UPI) en los procesadores Skylake -SP Xeon basados en el socket LGA 3647 . [5]
Aunque a veces se le llama "bus", QPI es una interconexión punto a punto. Fue diseñado para competir con HyperTransport que había sido utilizado por Advanced Micro Devices (AMD) desde alrededor de 2003. [6] [7] Intel desarrolló QPI en su Massachusetts Microprocessor Design Center (MMDC) por miembros de lo que había sido el Alpha Development Group. , que Intel había adquirido de Compaq y HP y, a su vez, provenía originalmente de Digital Equipment Corporation (DEC). [8] Su desarrollo se había informado ya en 2004. [9]
Intel primera entrega para los procesadores de escritorio en noviembre de 2008 en la i7-9xx Intel Core y X58 chipset . Fue lanzado en los procesadores Xeon con el nombre en código Nehalem en marzo de 2009 y en los procesadores Itanium en febrero de 2010 (con el nombre en código Tukwila). [10]
El QPI es un elemento de una arquitectura de sistema que Intel llama arquitectura QuickPath que implementa lo que Intel llama tecnología QuickPath . [11] En su forma más simple en una placa base de un solo procesador, se usa un solo QPI para conectar el procesador al IO Hub (por ejemplo, para conectar un Intel Core i7 a un X58 ). En instancias más complejas de la arquitectura, los pares de enlaces QPI separados conectan uno o más procesadores y uno o más concentradores de E / S o concentradores de enrutamiento en una red en la placa base, lo que permite que todos los componentes accedan a otros componentes a través de la red. Al igual que con HyperTransport, la arquitectura QuickPath asume que los procesadores tendrán controladores de memoria integradosy habilita una arquitectura de acceso a memoria no uniforme (NUMA).
Cada QPI comprende dos enlaces de datos punto a punto de 20 carriles, uno en cada dirección ( dúplex completo ), con un par de relojes separado en cada dirección, para un total de 42 señales. Cada señal es un par diferencial , por lo que el número total de pines es 84. Los 20 carriles de datos se dividen en cuatro "cuadrantes" de 5 carriles cada uno. La unidad básica de transferencia es el flit de 80 bits , que tiene 8 bits para la detección de errores, 8 bits para el "encabezado de la capa de enlace" y 64 bits para los datos. Un giro de 80 bits se transfiere en dos ciclos de reloj (cuatro transferencias de 20 bits, dos por tic de reloj). Los anchos de banda QPI se anuncian calculando la transferencia de 64 bits (8 bytes) de datos cada dos ciclos de reloj en cada dirección. [8]
Aunque las implementaciones iniciales utilizan enlaces únicos de cuatro cuadrantes, la especificación QPI permite otras implementaciones. Cada cuadrante se puede utilizar de forma independiente. En servidores de alta confiabilidad, un enlace QPI puede operar en modo degradado. Si falla una o más de las 20 + 1 señales, la interfaz funcionará usando 10 + 1 o incluso 5 + 1 señales restantes, incluso reasignando el reloj a una señal de datos si el reloj falla. [8] La implementación inicial de Nehalem utilizó una interfaz completa de cuatro cuadrantes para lograr 25,6 GB / s, que proporciona exactamente el doble del ancho de banda teórico del FSB de 1600 MHz de Intel utilizado en el chipset X48.
Aunque algunos procesadores Core i7 de gama alta exponen QPI, otros procesadores Nehalem de escritorio y móviles "convencionales" destinados a placas de un solo socket (por ejemplo, LGA 1156 Core i3, Core i5 y otros procesadores Core i7 de Lynnfield / Clarksfield y familias sucesoras) no exponga QPI externamente, porque estos procesadores no están diseñados para participar en sistemas de múltiples sockets.
Sin embargo, QPI se usa internamente en estos chips para comunicarse con el " uncore ", que es parte del chip que contiene los controladores de memoria, PCI Express del lado de la CPU y GPU, si está presente; el uncore puede estar o no en el mismo dado que el núcleo de la CPU, por ejemplo, está en un dado separado en Clarkdale / Arrandale, con sede en Westmere . [12] [13] [14] [15] : 3
En los chips de un solo socket posteriores a 2009, comenzando con Lynnfield, Clarksfield, Clarkdale y Arrandale, las funciones tradicionales de Northbridge están integradas en estos procesadores, que por lo tanto se comunican externamente a través de las interfaces DMI y PCI Express más lentas .
Por lo tanto, no hay necesidad de incurrir en el gasto de exponer la (antigua) interfaz de bus frontal a través del zócalo del procesador. [dieciséis]
Aunque el vínculo QPI núcleo-uncore no está presente en los procesadores Sandy Bridge de escritorio y móviles (como lo estaba en Clarkdale, por ejemplo), la interconexión de anillo interno entre los núcleos en el dado también se basa en los principios detrás de QPI, al menos hasta ahora en lo que respecta a la coherencia de la caché . [15] : 10
QPI funciona a una frecuencia de reloj de 2,4 GHz, 2,93 GHz, 3,2 GHz, 3,6 GHz, 4,0 GHz o 4,8 GHz (las frecuencias de 3,6 GHz y 4,0 GHz se introdujeron con la plataforma Sandy Bridge-E / EP y 4,8 GHz con Haswell-E / Plataforma EP). La frecuencia de reloj para un enlace en particular depende de las capacidades de los componentes en cada extremo del enlace y las características de la señal de la ruta de la señal en la placa de circuito impreso. Los procesadores Core i7 9xx no extremos están restringidos a una frecuencia de 2,4 GHz en los relojes de referencia estándar.
Las transferencias de bits ocurren en los flancos ascendente y descendente del reloj, por lo que la tasa de transferencia es el doble de la tasa de reloj.
Intel describe el rendimiento de datos (en GB / s) contando solo la carga útil de datos de 64 bits en cada movimiento de 80 bits. Sin embargo, Intel duplica el resultado porque el par de enlaces de envío y recepción unidireccionales puede estar activo simultáneamente. Por lo tanto, Intel describe un par de enlaces QPI de 20 carriles (envío y recepción) con un reloj de 3,2 GHz con una velocidad de datos de 25,6 GB / s. Una frecuencia de reloj de 2,4 GHz produce una velocidad de datos de 19,2 GB / s. De manera más general, según esta definición, un QPI de dos enlaces y 20 carriles transfiere ocho bytes por ciclo de reloj, cuatro en cada dirección.
La tasa se calcula de la siguiente manera:
QPI se especifica como una arquitectura de cinco capas , con capas físicas, de enlace, de enrutamiento, de transporte y de protocolo separadas. [1] En dispositivos diseñados solo para uso QPI punto a punto sin reenvío, como los procesadores Core i7-9xx y Xeon DP, la capa de transporte no está presente y la capa de enrutamiento es mínima.