La microarquitectura NetBurst , [1] [2] llamada P68 dentro de Intel , fue la sucesora de la microarquitectura P6 en la familia x86 de unidades de procesamiento central (CPU) fabricadas por Intel. La primera CPU en utilizar esta arquitectura fue la Pentium 4 de núcleo Willamette , lanzada el 20 de noviembre de 2000 y la primera de las CPU Pentium 4 ; todas las variantes posteriores de Pentium 4 y Pentium D también se han basado en NetBurst. A mediados de 2004, Intel lanzó el núcleo Foster , que también estaba basado en NetBurst, cambiando así el XeonCPU a la nueva arquitectura también. Las CPU Celeron basadas en Pentium 4 también utilizan la arquitectura NetBurst.
Información general | |
---|---|
Lanzado | 20 de noviembre de 2000 |
Actuación | |
Max. Frecuencia de reloj de la CPU | 267 MHz a 3,8 GHz |
Velocidades FSB | 400 MT / sa 1066 MT / s |
Cache | |
Caché L1 | 8 KB a 16 KB por núcleo |
Caché L2 | 128 KB a 2048 KB |
Caché L3 | 4 MB a 16 MB compartidos |
Arquitectura y clasificación | |
Arquitectura | NetBurst x86 |
Instrucciones | x86 , x86-64 (algunos) |
Extensiones | |
Especificaciones físicas | |
Transistores | |
Núcleos |
|
Enchufe (s) | |
Productos, modelos, variantes | |
Modelo (s) |
|
Historia | |
Predecesor | P6 |
Sucesor | Intel Core P7 Itanium ( IA-64 ) |
NetBurst fue reemplazado por la microarquitectura Core basada en P6, lanzada en julio de 2006.
Tecnología
La microarquitectura de NetBurst incluye características como Hyper-Threading , Hyper Pipelined Technology , Rapid Execution Engine , Execution Trace Cache y sistema de reproducción que se introdujeron por primera vez en esta microarquitectura en particular, y algunas nunca volvieron a aparecer después.
Hyper-threading
Hyper-threading es la implementación de multiproceso simultáneo (SMT) patentada de Intel que se utiliza para mejorar la paralelización de los cálculos (realizar varias tareas a la vez) realizados en microprocesadores x86. Intel lo introdujo con procesadores NetBurst en 2002. Posteriormente Intel lo reintrodujo en la microarquitectura Nehalem después de su ausencia en el Core 2.
Bus frontal con bombeo cuádruple
"Northwood" y "Willamette" cuentan con un bus frontal externo que se ejecuta a 100 MHz y tiene 64 bits de ancho, pero también se bombea cuádruple, lo que proporciona 3,2 GB / s de ancho de banda de memoria. El chipset Intel "Northwood" i850 con RD-RAM de doble canal puede proporcionar 3,2 GB / s de ancho de banda de memoria. El "Presler" tiene un bus frontal de 800 MHz, 64 bits de ancho, capaz de transferir 6,4 GB / s, con memoria DDR2 de 800 MHz.
Tecnología Hyper Pipelined
Este es el nombre que se le da a la canalización de instrucciones de 20 etapas dentro del núcleo de Willamette. Este es un aumento significativo en el número de etapas en comparación con el Pentium III, que tenía solo 10 etapas en su cartera. El núcleo de Prescott tiene una canalización de 31 etapas (algunas etapas solo mueven datos por la CPU). Aunque una canalización más profunda tiene una mayor penalización por predicción errónea de rama, el mayor número de etapas en la canalización permite que la CPU tenga velocidades de reloj más altas, lo que se pensaba que compensaba cualquier pérdida de rendimiento. Una menor instrucción por reloj (IPC) es una consecuencia indirecta de la profundidad de la tubería, una cuestión de compromiso de diseño (una pequeña cantidad de tuberías largas tiene una IPC más pequeña que una mayor cantidad de tuberías cortas). Otro inconveniente de tener más etapas en una tubería es un aumento en la cantidad de etapas que deben rastrearse en caso de que el predictor de rama cometa un error, lo que aumenta la penalización pagada por una predicción errónea. Para abordar este problema, Intel diseñó el motor de ejecución rápida y ha invertido mucho en su tecnología de predicción de sucursales, que según Intel reduce las predicciones erróneas de sucursales en un 33% en comparación con Pentium III . [3]
Motor de ejecución rápida
Con esta tecnología, las dos unidades lógicas aritméticas (ALU) en el núcleo de la CPU tienen doble bombeo, lo que significa que en realidad operan al doble de la frecuencia de reloj del núcleo. Por ejemplo, en un procesador de 3,8 GHz, las ALU funcionarán efectivamente a 7,6 GHz. La razón detrás de esto es, en general, compensar el bajo recuento de IPC; además, esto mejora considerablemente el rendimiento entero de la CPU. Intel también reemplazó la palanca de cambios de barril de alta velocidad con una unidad de ejecución de cambio / rotación que opera a la misma frecuencia que el núcleo de la CPU. La desventaja es que ciertas instrucciones ahora son mucho más lentas (relativa y absolutamente) que antes, lo que dificulta la optimización para múltiples CPU de destino. Un ejemplo son las operaciones de cambio y rotación, que adolecen de la falta de una palanca de cambios de barril que estaba presente en todas las CPU x86 comenzando con el i386, incluido el procesador principal de la competencia, Athlon .
Caché de seguimiento de ejecución
Dentro de la caché L1 de la CPU, Intel incorporó su caché de seguimiento de ejecución. Almacena microoperaciones decodificadas , de modo que al ejecutar una nueva instrucción, en lugar de recuperar y decodificar la instrucción nuevamente, la CPU accede directamente a las microoperaciones decodificadas desde la caché de seguimiento, lo que ahorra un tiempo considerable. Además, las microoperaciones se almacenan en caché en su ruta de ejecución prevista, lo que significa que cuando la CPU extrae instrucciones de la caché, ya están presentes en el orden correcto de ejecución. [4] Intel introdujo más tarde un concepto similar pero más simple con Sandy Bridge llamado caché de microoperaciones (caché UOP).
Sistema de repetición
El sistema de reproducción es un subsistema dentro del procesador Intel Pentium 4 para detectar operaciones que el programador del procesador ha enviado por error para su ejecución. Las operaciones capturadas por el sistema de reproducción se vuelven a ejecutar en un bucle hasta que se cumplen las condiciones necesarias para su correcta ejecución.
Sugerencias de predicción de ramas
La arquitectura Intel NetBurst permite insertar sugerencias de predicción de rama en el código para indicar si la predicción estática debe tomarse o no, mientras que esta función se abandonó en los procesadores Intel posteriores. Según Intel, el algoritmo de predicción de ramas de NetBurst es un 33% mejor que el de P6. [5] [6]
Problemas de ampliación
A pesar de estas mejoras, la arquitectura NetBurst creó obstáculos para los ingenieros que intentaban aumentar su rendimiento. Con esta microarquitectura, Intel buscaba alcanzar velocidades de reloj de 10 GHz, [7] pero debido al aumento de las velocidades de reloj, Intel enfrentó crecientes problemas para mantener la disipación de energía dentro de límites aceptables. Intel alcanzó una barrera de velocidad de 3.8 GHz en noviembre de 2004, pero encontró problemas al intentar lograr incluso eso. Intel NetBurst abandonó en 2006 después de los problemas de calor se convirtió en inaceptable y después desarrollaron la microarquitectura Core , inspirado en el núcleo P6 del Pentium Pro a la Tualatin Pentium III -S, y más directamente el Pentium M .
Revisiones
Revisión | Marca (s) del procesador | Etapas del pipeline |
---|---|---|
Willamette (180 millas náuticas) | Celeron, Pentium 4 | 20 |
Northwood (130 millas náuticas) | Celeron, Pentium 4, Pentium 4 HT | 20 |
Gallatin (130 nm) | Pentium 4 HT Extreme Edition, Xeon | 20 |
Prescott (90 millas náuticas) | Celeron D, Pentium 4, Pentium 4 HT, Pentium 4 Extreme Edition | 31 |
Molino de cedro (65 nm) | Celeron D, Pentium 4 | 31 |
Smithfield (90 millas náuticas) | Pentium D | 31 |
Presler (65 nm) | Pentium D | 31 |
Intel reemplazó el núcleo original de Willamette con una versión rediseñada de la microarquitectura NetBurst llamada Northwood en enero de 2002. El diseño de Northwood combinó un mayor tamaño de caché, un proceso de fabricación más pequeño de 130 nm e Hyper-threading (aunque inicialmente todos los modelos excepto el modelo de 3,06 GHz tenía esta función desactivada) para producir una versión más moderna y de mayor rendimiento de la microarquitectura NetBurst.
En febrero de 2004, Intel presentó Prescott , una revisión más radical de la microarquitectura. El núcleo de Prescott se produjo en un proceso de 90 nm e incluyó varios cambios de diseño importantes, incluida la adición de una caché aún más grande (de 512 KB en Northwood a 1 MB y 2 MB en Prescott 2M), una línea de instrucciones mucho más profunda (31 etapas en comparación con 20 en Northwood ), un predictor de rama muy mejorado , la introducción de las instrucciones SSE3 y, más tarde, la implementación de Intel 64, la marca de Intel para su implementación compatible de la versión x86-64 de 64 bits de la microarquitectura x86 (al igual que con el hyper-threading, todos los chips Pentium 4 HT de la marca Prescott tienen hardware para admitir esta función, pero inicialmente solo se habilitó en los procesadores Xeon de gama alta , antes de ser introducido oficialmente en los procesadores con la marca Pentium ). El consumo de energía y la disipación de calor también se convirtieron en problemas importantes con Prescott , que rápidamente se convirtió en los procesadores Intel x86 y x86-64 de un solo núcleo de mayor rendimiento y mayor consumo de energía. Los problemas de energía y calor impidieron que Intel lanzara un Prescott con frecuencia superior a 3.8 GHz, junto con una versión móvil del núcleo con frecuencia superior a 3.46 GHz.
Intel también lanzó un procesador de doble núcleo basado en la marca de microarquitectura NetBurst Pentium D. El primer núcleo Pentium D recibió el nombre en código Smithfield , que en realidad son dos núcleos Prescott en un solo dado, y más tarde Presler , que consta de dos núcleos Cedar Mill en dos matrices separadas ( Cedar Mill es la matriz de encogimiento de 65 nm de Prescott ).
Mapa vial
Sucesor
Intel tenía sucesores basados en Netburst en desarrollo llamados Tejas y Jayhawk con entre 40 y 50 etapas de pipeline, pero finalmente decidió reemplazar NetBurst con la microarquitectura Core , [8] [9] lanzada en julio de 2006; estos sucesores se derivaron más directamente del Pentium Pro de 1995 ( microarquitectura P6 ). El 8 de agosto de 2008 marcó el final de los procesadores basados en Intel NetBurst. [10] La razón del abandono de NetBurst fueron los graves problemas de calor causados por las altas velocidades de reloj. Si bien algunos procesadores basados en Core y Nehalem tienen TDP más altos , la mayoría de los procesadores son multinúcleo, por lo que cada núcleo emite una fracción del TDP máximo, y los procesadores de un solo núcleo basados en Core con la frecuencia más alta emiten un máximo de 27 W de calor. Los procesadores Pentium 4 de escritorio con velocidad más rápida (un solo núcleo) tenían un TDP de 115 W, en comparación con los 88 W de las versiones móviles con velocidad más rápida. Aunque, con la introducción de nuevas versiones, los TDP para algunos modelos finalmente se redujeron.
La microarquitectura Nehalem, la sucesora de la microarquitectura Core, se suponía que era una evolución de NetBurst según las hojas de ruta de Intel que se remontan al año 2000. Pero debido al abandono de NetBurst, Nehalem es ahora un proyecto completamente diferente, pero tiene algunas similitudes con NetBurst. Nehalem reimplementa la tecnología Hyper-Threading introducida por primera vez en el núcleo Northwood de 3,06 GHz de Pentium 4. Nehalem también implementa una caché L3 en los procesadores basados en ella. Para una implementación de procesador de consumo, se utilizó por primera vez una caché L3 en el núcleo Gallatin de Pentium 4 Extreme Edition, pero extrañamente faltaba en el núcleo Prescott 2M de la misma marca.
Chips basados en NetBurst
- Celeron (NetBurst)
- Celeron D
- Pentium 4
- Pentium 4 Extreme Edition
- Pentium D
- Pentium Extreme Edition
- Xeon , desde 2001 hasta 2006
Ver también
- Mito de los megahercios
- Lista de microarquitecturas de CPU Intel
- Lista de microprocesadores Intel Celeron
- Lista de microprocesadores Intel Pentium 4
- Lista de microprocesadores Intel Pentium D
- Lista de microprocesadores Intel Xeon
- Modelo tic-tac
Referencias
- ^ Carmean, Doug (primavera de 2002). "El procesador Intel Pentium 4" (PDF) . Intel . Archivado desde el original (PDF) el 19 de abril de 2018.
- ^ "Reproducción: características desconocidas del NetBurst Core" . XbitLabs . 6 de marzo de 2016. Archivado desde el original el 6 de marzo de 2016.
- ^ "La unidad de predicción de rama de caché de seguimiento" . Nuevo procesador Pentium 4 de Intel . Hardware de Tom . 20 de noviembre de 2000 . Consultado el 30 de abril de 2021 .
- ^ "Entrar en el canal de ejecución - caché de seguimiento de Pentium 4, continuación" . Nuevo procesador Pentium 4 de Intel . Hardware de Tom . 20 de noviembre de 2000 . Consultado el 30 de abril de 2021 .
- ^ Fog, Agner (1 de diciembre de 2016). "La microarquitectura de las CPUs Intel, AMD y VIA" (PDF) . pag. 36 . Consultado el 22 de marzo de 2017 .
- ^ Milenkovic, Milena; Milenkovic, Aleksandar; Kulick, Jeffrey. "Desmitificando los predictores de sucursales de Intel" (PDF) .
- ^ Shimpi, Anand Lal. "El futuro de los procesos de fabricación de Intel" . Consultado el 4 de abril de 2018 .
- ^ "Intel dice Adios a los chips Tejas y Jayhawk" . El registro .
- ^ Buenas ganas, Rupert. "Intel cancela Tejas y Jayhawk" . ZDNet . Consultado el 21 de agosto de 2019 .
- ^ Shilov, Anton (21 de mayo de 2007). "La era de la microarquitectura NetBurst de Intel llega a su fin" . XbitLabs . Archivado desde el original el 17 de octubre de 2015 . Consultado el 29 de noviembre de 2015 .
enlaces externos
- La microarquitectura del procesador Pentium 4