IEEE 754

El estándar IEEE para aritmética de punto flotante ( IEEE 754 ) es un estándar técnico para aritmética de punto flotante establecido en 1985 por el Instituto de ingenieros eléctricos y electrónicos (IEEE). El estándar abordó muchos problemas encontrados en las diversas implementaciones de punto flotante que los hacían difíciles de usar de manera confiable y portátil . Muchas unidades de hardware de punto flotante utilizan el estándar IEEE 754.

IEEE 754-2008 , publicado en agosto de 2008, incluye casi todo el estándar IEEE 754-1985 original , más el estándar IEEE 854-1987 para aritmética de coma flotante independiente de radix . La versión actual, IEEE 754-2019, se publicó en julio de 2019. ^[1] Es una revisión menor de la versión anterior, que incorpora principalmente aclaraciones, corrección de defectos y nuevas operaciones recomendadas.

El primer estándar para aritmética de punto flotante, IEEE 754-1985 , se publicó en 1985. Cubría solo la aritmética de punto flotante binaria.

En agosto de 2008 se publicó una nueva versión, IEEE 754-2008 , tras un proceso de revisión de siete años, presidido por Dan Zuras y editado por Mike Cowlishaw . Reemplazó tanto a IEEE 754-1985 (aritmética de punto flotante binario) como al estándar IEEE 854-1987 para aritmética de punto flotante independiente de radix . Los formatos binarios del estándar original se incluyen en este nuevo estándar junto con tres nuevos formatos básicos, uno binario y dos decimales. Para ajustarse al estándar actual, una implementación debe implementar al menos uno de los formatos básicos como formato aritmético y formato de intercambio.

La norma internacional ISO / IEC / IEEE 60559: 2011 (con contenido idéntico a IEEE 754-2008) ha sido aprobada para su adopción a través de JTC1 / SC 25 bajo el Acuerdo ISO / IEEE PSDO ^[2] y publicada. ^[3]

La versión actual, IEEE 754-2019 publicada en julio de 2019, se deriva y reemplaza a IEEE 754-2008, luego de un proceso de revisión iniciado en septiembre de 2015, presidido por David G. Hough y editado por Mike Cowlishaw. Incorpora principalmente aclaraciones (por ejemplo, totalOrder ) y corrección de defectos (por ejemplo, minNum ), pero también incluye algunas nuevas operaciones recomendadas (por ejemplo, augmentedAddition ). ^[4]^[5]

La precisión de binary32 y binary64 en el rango de 10 ^-12 a 10 ¹²