Adapteva es un fabless semiconductor empresa centrándose en baja potencia muchos núcleo microprocesador diseño. La empresa fue la segunda empresa en anunciar un diseño con 1.000 núcleos de procesamiento especializados en un solo circuito integrado . [1] [2]
Industria | La industria de semiconductores |
---|---|
Fundado | Marzo de 2008 |
Fundador | Andreas Olofsson |
Sede | , nosotros |
Gente clave | Andreas Olofsson, director ejecutivo |
Productos | Unidades centrales de procesamiento |
Dueño | Financiado con fondos privados |
Sitio web | adapteva |
Adapteva se fundó en 2008 con el objetivo de lograr un avance diez veces mayor en el rendimiento de punto flotante por vatio para el mercado de dispositivos móviles. Los productos se basan en su arquitectura Epiphany de múltiples núcleos de instrucción múltiple, múltiples datos (MIMD) y su proyecto Parallella Kickstarter que promueve "una supercomputadora para todos" en septiembre de 2012. El nombre de la empresa es una combinación de "adaptar" y la palabra hebrea "Teva". "que significa naturaleza.
Historia
Adapteva fue fundada en marzo de 2008 por Andreas Olofsson. La compañía se fundó con el objetivo de lograr un avance 10 veces mayor en la eficiencia energética del procesamiento de punto flotante para el mercado de dispositivos móviles . En mayo de 2009, Olofsson tenía un prototipo de un nuevo tipo de arquitectura informática multinúcleo masivamente paralela . El prototipo inicial se implementó en 65 nm y tenía 16 núcleos de microprocesador independientes. Los prototipos iniciales permitieron a Adapteva obtener US $ 1,5 millones en financiación serie A de BittWare, una empresa de Concord, New Hampshire , en octubre de 2009. [3]
El primer producto de chip comercial de Adapteva comenzó a muestrear a los clientes a principios de mayo de 2011 y poco después anunciaron la capacidad de colocar hasta 4.096 núcleos en un solo chip.
La Epifanía III , se anunció en octubre de 2011 utilizando procesos de fabricación de 28 nm y 65 nm.
Productos
La principal familia de productos de Adapteva es la arquitectura MIMD multinúcleo escalable Epiphany . La arquitectura Epiphany podría acomodar chips con hasta 4.096 microprocesadores RISC fuera de servicio , todos compartiendo un solo espacio de memoria plana de 32 bits . Cada procesador RISC en la arquitectura Epiphany es superescalar con un microprocesador de archivo de registro unificado de 64 × 32 bits (entero o precisión simple ) que funciona hasta 1 GHz y tiene capacidad para 2 GFLOPS (precisión simple). Los procesadores RISC de Epiphany usan una arquitectura de conjunto de instrucciones personalizado (ISA) optimizada para punto flotante de precisión simple , [4] pero son programables en ANSI C de alto nivel usando una cadena de herramientas GNU-GCC estándar . Cada procesador RISC (en las implementaciones actuales; no fijo en la arquitectura) tiene 32 KB de memoria local. El código (posiblemente duplicado en cada núcleo) y el espacio de la pila deben estar en esa memoria local ; además (la mayoría) de los datos temporales deberían caber allí para máxima velocidad. Los datos también se pueden utilizar desde la memoria local de otros núcleos de procesador con una penalización de velocidad, o RAM fuera del chip con una penalización de velocidad mucho mayor.
La arquitectura de la memoria no emplea una jerarquía explícita de cachés de hardware , similar al procesador Sony / Toshiba / IBM Cell , pero con el beneficio adicional de soportar cargas y almacenes fuera del chip e inter-core (lo que simplifica la transferencia de software a la arquitectura) . Es una implementación de hardware del espacio de direcciones global particionado . [ cita requerida ]
Esto eliminó la necesidad de un hardware de coherencia de caché complejo , que coloca un límite práctico en la cantidad de núcleos en un sistema multinúcleo tradicional . El diseño permite al programador aprovechar un mayor conocimiento previo de los patrones de acceso a datos independientes para evitar el costo de tiempo de ejecución de resolver esto. Todos los nodos del procesador están conectados a través de una red en chip , lo que permite un paso de mensajes eficiente. [5]
Escalabilidad
La arquitectura está diseñada para escalar casi indefinidamente, con 4 enlaces electrónicos que permiten combinar varios chips en una topología de cuadrícula, lo que permite sistemas con miles de núcleos.
Coprocesadores multinúcleo
El 19 de agosto de 2012, Adapteva publicó algunas especificaciones e información sobre los coprocesadores multinúcleo Epiphany. [6]
Información técnica para | E16G301 [7] | E64G401 [8] |
---|---|---|
Núcleos | dieciséis | 64 |
Núcleo MHz | 1000 | 800 |
Núcleo GFLOPS | 2 | 1,6 |
"Suma GHz" | dieciséis | 51,2 |
Suma GFLOPS | 32 | 102 |
mm² | 8,96 | 8.2 |
Nuevo Méjico | sesenta y cinco | 28 |
W def. | 0,9 | 1.4 |
W máx. | 2 | 2 |
En septiembre de 2012, se produjo una versión de 16 núcleos, Epiphany-III (E16G301), utilizando 65 nm [9] (11,5 mm 2 , chip de 500 MHz [10] ) y muestras de ingeniería de Epiphany-IV de 64 núcleos (E64G401 ) se produjeron utilizando el proceso GlobalFoundries de 28 nm (800 MHz). [11]
Los mercados principales para la arquitectura multinúcleo de Epiphany incluyen:
- Aplicaciones para teléfonos inteligentes como reconocimiento facial en tiempo real , reconocimiento de voz , traducción y realidad aumentada .
- Supercomputadoras de próxima generación que requieren una eficiencia energética drásticamente mejor para permitir que los sistemas escalen a niveles informáticos exaflop .
- Aceleración de punto flotante en sistemas integrados basados en arquitecturas de arreglos de puertas programables en campo .
Proyecto Parallella
En septiembre de 2012, Adapteva inició el proyecto Parallella en Kickstarter , que se comercializó como " Una supercomputadora para todos ". Se publicaron manuales de referencia de arquitectura para la plataforma como parte de la campaña para llamar la atención sobre el proyecto. [12] El objetivo de financiación de 750 000 dólares EE.UU. se alcanzó en un mes, con una contribución mínima de 99 dólares EE.UU. que da derecho a los patrocinadores a obtener un dispositivo; aunque la fecha límite inicial se fijó para mayo de 2013, las primeras computadoras de placa única con chip Epiphany de 16 núcleos finalmente se enviaron en diciembre de 2013. [13]
Se prevé que el tamaño de la placa sea de 86 mm × 53 mm (3,4 pulg. × 2,1 pulg.). [14] [15] [16]
La campaña de Kickstarter recaudó US $ 898,921. [17] [18] La meta de recaudar US $ 3 millones no tuvo éxito, por lo que no se producirá en masa ninguna versión de 64 núcleos de Parallella. [19] Los usuarios de Kickstarter que hayan donado más de US $ 750 obtendrán la variante "paralela-64" con coprocesador de 64 núcleos (hecho a partir de la fabricación inicial de prototipos con un rendimiento de 50 chips por oblea). [20]
Micro Servidor Parallella-16 | Computadora de escritorio Parallella-16 | Plataforma integrada Parallella-16 | |
---|---|---|---|
Uso | Servidor sin cabeza conectado a Ethernet | Una computadora personal | Sistemas integrados de vanguardia |
Procesador | ARM Cortex-A9 de doble núcleo de 32 bits con NEON a 1 GHz (parte del chip Zynq Z7010 de Xilinx) | ARM Cortex-A9 de doble núcleo de 32 bits con NEON a 1 GHz (parte del chip Zynq Z7020 de Xilinx) | |
Coprocesador | Acelerador multinúcleo Epiphany III de 16 núcleos (E16) | ||
Memoria | 1 GB de RAM DDR3L | ||
Ethernet | 10/100/1000 | ||
USB | N / A | 2 × USB 2.0 (USB 2.0 HS y USB OTG) | |
Monitor | N / A | HDMI | |
Almacenamiento | MicroSD de 16 GB | ||
Expansión | N / A | 2 enlaces electrónicos + 24 GPIO | 2 enlaces electrónicos + 24 GPIO |
FPGA | 28K celdas lógicas programables 80 cortes DSP programables | 80K celdas lógicas programables 220 cortes DSP programables | |
Peso | 36 g (1,3 onzas) | 38 g (1,3 onzas) | |
Tamaño | 3,5 pulg. × 2,1 pulg. × 0,625 pulg. (88,9 mm × 53,3 mm × 15,9 mm) | ||
SKU | P1600-DK-xx | P1601-DK-xx | P1602-DK-xx |
Código HTS | 8471.41.0150 | ||
Energía | Alimentación por USB (2,5 W) o 5 V CC (≈5 W) |
Epifanía V
Para 2016, la empresa había grabado una variante de 1024 núcleos de 64 bits de su arquitectura Epiphany que incluía: tiendas locales más grandes (64 KB), direccionamiento de 64 bits, aritmética de punto flotante de doble precisión o precisión simple SIMD , y Instrucciones enteras de 64 bits, implementadas en el nodo de proceso de 16 nm . [21] Este diseño incluyó mejoras en el conjunto de instrucciones destinadas a aplicaciones de criptografía y aprendizaje profundo . En julio de 2017, el fundador de Adapteva se convirtió en gerente del programa DARPA MTO [22] y anunció que era "poco probable" que Epiphany V estuviera disponible como producto comercial. [23]
Actuación
Joel Hruska de ExtremeTech tenía la siguiente opinión sobre el proyecto Parallella de 64 núcleos, antes del diseño de 1024 núcleos: "Adapteva está exagerando drásticamente lo que Epiphany IV realmente puede ofrecer. 16-64 núcleos diminutos con pequeñas cantidades de memoria, sin local cachés, y una velocidad de reloj relativamente baja aún pueden ser útiles en ciertas cargas de trabajo, pero los colaboradores no están comprando una supercomputadora, están comprando el equivalente en el mundo real de un perno de vástago autosellante ". [24]
Sin embargo, la crítica de que los chips Epiphany no pueden ofrecer un rendimiento cercano al rendimiento de las supercomputadoras modernas es correcta: en realidad, los chips Epiphany con 16 o 64 núcleos y c. 25 o 100 GFLOP en precisión simple, respectivamente, ni siquiera igualan el rendimiento de punto flotante de los procesadores de PC de escritorio modernos (Core i7-4770K (Haswell), 4 × núcleos a 3.5 GHz AVX2: 177 GFLOPS, [25] doble precisión) - un hecho que es reconocido por Adapteva. [ cita requerida ]
Sin embargo, las últimas placas Parallella con chips Epiphany E16 [26] se pueden comparar con muchas supercomputadoras históricas en términos de rendimiento bruto (solo como ejemplo, la Cray 1, la primera supercomputadora en sí misma, tuvo un rendimiento máximo de 80 MFLOPS en 1976 , y su sucesor, el Cray 2, tuvo un rendimiento máximo de 1.9 GFLOPS en 1985), y ciertamente puede usarse para el desarrollo de código paralelo. Las similitudes arquitectónicas con las supercomputadoras (paso de mensajes y NUMA ) hacen de Parallella un sistema de desarrollo potencialmente útil, en comparación con las máquinas SMP tradicionales. [ cita requerida ]
El punto es que para una envolvente de potencia de 5 W y en términos de GFLOPS / mm 2 de espacio de chip, los chips Epiphany E16 actuales brindan mucho más rendimiento que cualquier otra cosa disponible hasta la fecha [ ¿cuándo? ] , con una arquitectura diseñada para escalar y aplicable a más que tareas de GPU vergonzosamente paralelas . [ cita requerida ] (por ejemplo, sería capaz de ejecutar el modelo de actor con muchos estados concurrentes y completamente independientes). También es adecuado para tareas similares a DSP donde los datos podrían alimentarse directamente en el chip (desde un FPGA u otro ASIC) sin tener que crear búferes en la memoria temporal como para una GPU), lo que lo hace ideal para robótica y otras aplicaciones de sensores inteligentes. La arquitectura también permite que las placas paralelas se combinen en un clúster con una interconexión rápida entre chips 'eMesh', extendiendo la cuadrícula lógica de núcleos (creando un potencial de escala casi ilimitado). [ cita requerida ]
El Parallella de 16 núcleos tiene aproximadamente 5.0 GFLOPs / W, y el Epiphany-IV de 64 núcleos hecho con 28 nm estimado en 50 GFLOPs / W (precisión simple), [27] y el sistema de 32 placas basado en ellos tiene 15 GFLOPS / W. [28] A modo de comparación, las mejores GPU de AMD y Nvidia alcanzaron 10 GFLOP / W para precisión simple en el período de tiempo 2009-2011. [29]
Ver también
- Matriz asincrónica de procesadores simples
- SW26010 : un diseño chino que presenta una arquitectura similar a la utilizada en la supercomputadora Sunway TaihuLight
- Unidad de procesamiento de visión : una clase de procesador con importantes funciones superpuestas
Referencias
- ^ Clark, Don (3 de mayo de 2011). "Startup tiene grandes planes para la tecnología Tiny Chip" . Wall Street Journal . Consultado el 3 de mayo de 2011 .
- ^ "IBM dice que la tecnología Kilocore superará a los procesadores móviles de hoy" . Hardware de Tom. 2006.
- ^ "De RTL a GDSII en sólo seis semanas" . EETimes. 2010 . Consultado el 26 de octubre de 2010 .
- ^ "Manual de referencia de la arquitectura de la epifanía" . Archivado desde el original el 9 de octubre de 2012.
- ^ "Startup lanza tecnología de aceleración de punto flotante Manycore" . HPCWire. 2011 . Consultado el 3 de mayo de 2011 .
- ^ "Epiphany Multicore IP. Configuraciones de ejemplo" . 19 de agosto de 2012.
- ^ Microprocesador Epiphany-III de 16 núcleos y 65 nm (E16G301) // admin (19 de agosto de 2012)
- ^ Microprocesador Epiphany-IV 64-core 28nm (E64G401) // admin (19 de agosto de 2012)
- ^ Dispositivos de silicio // Adapteva
- ^ Linley Gwennap, Adapteva: Más fracasos, menos vatios. Epiphany ofrece un acelerador de punto flotante para procesadores móviles. // Informe del microprocesador , junio de 2011
- ^ Michael Feldman, Adapteva presenta un chip de 64 núcleos // HPCWire
- ^ Andreas Olofsson, Publicación de documentación de Epiphany
- ^ Actualización n. ° 46: Primer video creado por el usuario de Parallella
- ^ Rick Merritt, Adapteva Kickstarts Hundred-Dollar Supercomputer // EETimes, 27 de septiembre de 2012
- ^ Parallella - Supercomputación para todos (presentación de diapositivas) . Andreas Olofsson, fundador y director ejecutivo de Adapteva . 28 de septiembre de 2012.
- ↑ Parallella: A Supercomputer For Everyone por Adapteva , página del proyecto en Kickstarter
- ^ Parallella: una supercomputadora para todos // Proyecto Kickstarter, de Adapteva
- ^ Hiawatha Bray, Adapteva crea un microchip económico y eficiente con la ayuda de Kickstarter. 'Crowdfunding' acerca una computadora pequeña y rápida a la producción // The Boston Globe, 2 de diciembre de 2012
- ↑ Andrew Back, Introducing the $ 99 Linux Supercomputer Archivado el 17 de noviembre de 2015 en Wayback Machine , Linux.com, 24 de enero de 2013: "Las promesas de $ 99 o más se recompensan con al menos una placa con un dispositivo de 16 núcleos. .. El chip Epiphany de 16 núcleos ofrece 26 GFLOPS de rendimiento y toda la computadora Parallella consume solo 5 vatios "
- ^ ¡ Ahora se ofrece la versión de 64 núcleos de la placa Parallella! // Blog de Adapteva en Kickstarter, 25 de octubre de 2012: "La placa principal de Parallella Epiphany-IV (64 + 2) se ofrecerá para contribuciones superiores a $ 750 ... el hecho de que solo obtenemos 50 matrices por oblea para estos prototipos iniciales se ejecuta. No podemos divulgar los precios de las obleas y los rendimientos a 28 nm ",
- ^ "Epifanía v anuncio" .
- ^ Olofsson, Andreas (11 de marzo de 2017). "Sr. Andreas Olofsson" . DARPA . Consultado el 16 de diciembre de 2018 .
- ^ Olofsson, Andreas (9 de julio de 2017). "Actualización de estado de Adapteva" . Blog Adapteva . Archivado desde el original el 23 de abril de 2018 . Consultado el 16 de diciembre de 2018 .
- ^ Joel Hruska (28 de septiembre de 2012). Adapteva recurre a Kickstarter para financiar un procesador masivamente paralelo ” . Extremetech.
- ^ Dr. Donald Kinghorn (26 de agosto de 2013). "Rendimiento de coma flotante de Haswell" . Blog de Puget Systems .
- ^ Andreas Olofsson (14 de julio de 2014). "Nuevas ofertas de productos de Parallella" . Blog de Parallella . Consultado el 3 de septiembre de 2014 .
- ^ Feldman, Michael (22 de agosto de 2012). "Adapteva presenta un chip de 64 núcleos" . HPCWire . Consultado el 3 de septiembre de 2014 .
- ^ "Adapteva revela la plataforma de supercomputación A-1 en ISC14" . HPCWire, comunicado de prensa de Adapteva. 23 de junio de 2014 . Consultado el 3 de septiembre de 2014 .
- ^ "Características de hardware de CPU, GPU y MIC a lo largo del tiempo. Rendimiento de cómputo sin procesar: comparación de GFLOP / seg por vatio para aritmética de precisión simple. Cuanto más alto, mejor" . Karl Rupp. 24 de junio de 2013 . Consultado el 3 de septiembre de 2014 .
Otras lecturas
- Linley Gwennap, Adapteva: más flops, menos vatios. Epiphany ofrece un acelerador de punto flotante para procesadores móviles. // Informe del microprocesador , junio de 2011
enlaces externos
- Página web oficial
- Especificaciones de Parallella