IEEE 754-2008 revisión

IEEE 754-2008 (anteriormente conocido como IEEE 754r) fue publicado en agosto de 2008 y es una revisión significativa, y sustituye, el IEEE 754-1985 en coma flotante estándar, mientras que en 2019 se consiguió actualiza con una revisión menor IEEE 754-2019 .[1]​ La revisión de 2008 extendió el estándar anterior donde era necesario, agregó aritmética y formatos decimales, ajustó ciertas áreas del estándar original que se dejaron sin definir y se fusionó en IEEE 854 (el estándar de punto flotante independiente de radix).

En algunos casos, donde las definiciones más estrictas de la aritmética de punto flotante binario pueden ser incompatibles con el rendimiento de alguna implementación existente, se hicieron opcionales.

Proceso de revisión

editar

La norma había estado bajo revisión desde 2000, con una fecha de finalización prevista para diciembre de 2006. La revisión de una norma IEEE sigue en general tres fases:

  1. Grupo de trabajo: un comité que crea un proyecto de norma
  2. Boleta: las partes interesadas se suscriben al grupo de votación y votan sobre el borrador (el 75% del grupo debe participar y el 75% debe aprobar que el borrador avance); los comentarios de los votos son resueltos por un Comité de Resolución de Boletas (BRC) y los cambios realizados deben ser recirculados con una nueva boleta si son sustantivos
  3. Cuando se resuelven todos los comentarios y no hay más cambios, el borrador se envía al IEEE para su revisión, aprobación y publicación (esto también puede dar lugar a cambios y votaciones, aunque esto es raro).

El 11 de junio de 2008, fue aprobado por unanimidad por el Comité de Revisión del IEEE (Revcom), y fue aprobado formalmente por el Consejo de Normas del IEEE-SA el 12 de junio de 2008. Se publicó el 29 de agosto de 2008.

754r fase de Grupo Laborable

editar

La participación en la redacción del estándar estaba abierta a personas con un sólido conocimiento de la aritmética de coma flotante. Más de 90 personas asistieron al menos a una de las reuniones mensuales, que se celebraron en Silicon Valley, y muchas más participaron a través de la lista de correo.

El progreso a veces fue lento, lo que llevó al presidente a declarar en la reunión del 15 de septiembre de 2005[2]​ que "no se están haciendo progresos, estoy suspendiendo estas reuniones hasta nuevo aviso por esos motivos". En diciembre de 2005, el comité se reorganizó bajo nuevas reglas con una fecha de finalización prevista para diciembre de 2006.

Se adoptaron nuevas políticas y procedimientos en febrero de 2006. En septiembre de 2006, se aprobó un borrador de trabajo para enviarlo al comité patrocinador principal (el Comité de Normas del Microprocesador de IEEE, o MSC) para su edición y para enviarlo a la boleta electoral del patrocinador.

754r fase de Papeleta

editar

La última versión del proyecto, la versión 1.2.5, se presentó al MSC el 4 de octubre de 2006. El MSC aceptó el proyecto el 9 de octubre de 2006.[3]​ El proyecto se ha modificado considerablemente en detalle durante el proceso de votación.

La primera votación del patrocinador tuvo lugar del 29 de noviembre de 2006 al 28 de diciembre de 2006. De los 84 miembros del cuerpo electoral, el 85.7% respondió, el 78.6% votó la aprobación. Hubo votos negativos (y más de 400 comentarios), por lo que hubo una votación de recirculación en marzo de 2007; esto recibió una aprobación del 84%. Hubo suficientes comentarios (más de 130) de esa boleta de que se preparó un tercer borrador para la segunda boleta de recirculación de 15 días que comenzó a mediados de abril de 2007. Por razones técnicas, el proceso de boleta se reinició con la cuarta boleta en octubre de 2007; también hubo cambios sustanciales en el borrador como resultado de los comentarios de 650 votantes y de las solicitudes del patrocinador (el IEEE MSC); esta boleta simplemente no alcanzó la aprobación requerida del 75%. La quinta votación tuvo una tasa de respuesta del 98.0% con una aprobación del 91.0%, con comentarios que condujeron a cambios relativamente pequeños. Las boletas sexta, séptima y octava mantuvieron índices de aprobación de más del 90% con progresivamente menos comentarios sobre cada borrador; el octavo (que no tenía comentarios en el alcance: 9 eran repeticiones de comentarios anteriores y uno referido a material que no estaba en el borrador) fue presentado al Comité de Revisión de Estándares de IEEE ('RevCom') para su aprobación como estándar de IEEE.

754r Revisión y fase de Aprobación

editar

El Comité de Revisión de Estándares de IEEE (RevCom) consideró y aprobó por unanimidad el borrador del IEEE 754r en su reunión de junio de 2008, y fue aprobado por la Junta de Estándares de IEEE-SA el 12 de junio de 2008. La edición final está completa y el documento ahora se ha enviado a El Departamento de Publicaciones de Normas IEEE para su publicación.

IEEE Std 754-2008 publicación

editar

El nuevo IEEE 754 (formalmente IEEE Std 754-2008, el Estándar IEEE para Aritmética de punto flotante) fue publicado por la IEEE Computer Society el 29 de agosto de 2008, y está disponible en el sitio web IEEE Xplore[4]

Esta norma reemplaza a IEEE 754-1985. IEEE 854, el estándar de punto flotante independiente de Radix se retiró en diciembre de 2008.

Resumen de las revisiones

editar

Las mejoras más obvias al estándar son la adición de un tipo binario de 16 bits y 128 bits y tres tipos decimales, algunas operaciones nuevas y muchas funciones recomendadas. Sin embargo, ha habido aclaraciones significativas en la terminología en todo momento. Este resumen destaca las principales diferencias en cada cláusula principal de la norma.

Cláusula 1: Resumen

editar

El alcance (determinado por el patrocinador del estándar) se ha ampliado para incluir formatos decimales y aritméticos, y agrega formatos extensibles.

Cláusula 2: Definiciones

editar

Muchas de las definiciones se han reescrito para mayor claridad y coherencia. Algunos términos se han renombrado para mayor claridad (por ejemplo, desnormalizado se ha renombrado a subnormal ).

Cláusula 3: Formatos

editar

La descripción de los formatos se ha hecho más regular, con una distinción entre los formatos aritméticos (en los que se puede realizar la aritmética) y los formatos de intercambio (que tienen una codificación estándar). La conformidad con el estándar ahora se define en estos términos.

Se han enumerado los niveles de especificación de un formato de punto flotante para aclarar la distinción entre:

  1. los números reales teóricos (una línea numérica extendida)
  2. las entidades que se pueden representar en el formato (un conjunto finito de números, junto con −0, infinitos y NaN )
  3. las representaciones particulares de las entidades: signo-exponente-significado, etc.
  4. El patrón de bits (codificación) utilizado.

Los conjuntos de entidades representables se explican en detalle, mostrando que pueden ser tratados con el significado considerado como una fracción o un número entero. Se definen los conjuntos particulares conocidos como formatos básicos y se explican las codificaciones utilizadas para el intercambio de formatos binarios y decimales.

Los formatos de intercambio binario tienen la " precisión media " (formato de almacenamiento de 16 bits) y la " precisión cuádruple " (formato de 128 bits) agregadas, junto con fórmulas generalizadas para algunos formatos más amplios; Los formatos básicos tienen codificaciones de 32 bits, 64 bits y 128 bits.

Se describen tres nuevos formatos decimales, que coinciden con las longitudes de los formatos binarios de 32-128 bits. Estos dan formatos de intercambio decimal con significados de 7, 16 y 34 dígitos, que pueden estar normalizados o no. Para obtener un rango y precisión máximos, los formatos combinan parte del exponente y el significado en un campo de combinación, y comprimen el resto del significado usando una codificación entera decimal (que usa la codificación Densely Packed Decimal o DPD, una forma comprimida de BCD ) o codificación entera binaria convencional. Los formatos básicos son los dos tamaños más grandes, que tienen codificaciones de 64 bits y 128 bits. También se especifican fórmulas generalizadas para algunos otros formatos de intercambio.

Los formatos extendidos y extensibles permiten la aritmética en otras precisiones y rangos.

Cláusula 4: atributos y redondeo

editar

Esta cláusula se ha cambiado para fomentar el uso de atributos estáticos para controlar las operaciones de punto flotante y (además de los atributos de redondeo requeridos) permite el manejo alternativo de excepciones, la ampliación de resultados intermedios, las optimizaciones de cambio de valor y la reproducibilidad.

Se ha agregado el atributo de redondeo a más cercano, distancia desde cero (requerido solo para operaciones decimales).

Cláusula 5: Operaciones

editar

Esta sección tiene numerosas aclaraciones (especialmente en el área de comparaciones), y ahora se requieren varias operaciones previamente recomendadas (como copiar, negar, abs y clase).

Las nuevas operaciones incluyen múltiples fusibles de suma (FMA), conversiones explícitas, predicados de clasificación (isNan ( x ), etc.), varias funciones mínimas y máximas, un predicado de ordenamiento total y dos operaciones específicas de decimales (la misma cantidad y cuantización).

Min y max

editar

Las operaciones mín. Y máx. Están definidas, pero dejan margen para el caso en el que las entradas tienen el mismo valor pero difieren en la representación. En particular:

  • min(+0,−0) o min(−0,+0) debe producir algo con un valor de cero, pero siempre puede devolver el primer argumento.

Para admitir operaciones como la ventana en la que una entrada de NaN debe reemplazarse silenciosamente con uno de los puntos finales, se definen min y max para seleccionar un número, x, en lugar de un NaN silencioso:

  • min(x,qNaN) = min(qNaN,x) = x
  • max(x,qNaN) = max(qNaN,x) = x

Estas funciones se denominan minNum y maxNum para indicar su preferencia por un número sobre un NaN silencioso. Sin embargo, en presencia de una entrada de NaN de señalización, se devuelve un NaN silencioso como con las operaciones habituales. Después de la publicación de la norma, se observó que estas reglas hacen que estas operaciones no sean asociativas; Por esta razón, han sido reemplazados por nuevas operaciones en IEEE 754-2019 .

Aritmética decimal

editar

La aritmética decimal, compatible con la utilizada en Java, C #, PL / I, COBOL, Python, REXX, etc., también se define en esta sección. En general, la aritmética decimal sigue las mismas reglas que la aritmética binaria (los resultados se redondean correctamente, etc.), con reglas adicionales que definen el exponente de un resultado (en muchos casos es posible más de uno).

Conversión de base correctamente redondeada

editar

A diferencia de 854, 754-2008 requiere una conversión de base correctamente redondeada entre coma flotante decimal y binaria dentro de un rango que depende del formato.

Cláusula 6: Infinito, NaN y bit de signo

editar

Esta cláusula ha sido revisada y aclarada, pero sin adiciones importantes.

Cláusula 7: manejo de excepciones predeterminado

editar

Esta cláusula ha sido revisada y aclarada considerablemente, pero sin adiciones importantes.

Cláusula 8: manejo alternativo de excepciones

editar

Esta cláusula se ha extendido desde la Cláusula 8 anterior ('Trampas') para permitir el manejo opcional de excepciones en varias formas, incluidas las trampas y otros modelos como try / catch. Las trampas y otros mecanismos de excepción siguen siendo opcionales, como lo fueron en IEEE 754-1985.

Cláusula 9: operaciones recomendadas

editar

Esta cláusula es nueva; recomienda cincuenta operaciones, incluidas las funciones de registro, potencia y trigonométricas, que los estándares del lenguaje deben definir. Todos estos son opcionales (no se requieren para cumplir con el estándar). Las operaciones incluyen algunas en modos dinámicos para atributos, y también un conjunto de operaciones de reducción (suma, producto escalado, etc.)

Cláusula 10: evaluación de la expresión

editar

Esta cláusula es nueva; recomienda cómo los estándares del lenguaje deben especificar la semántica de las secuencias de operaciones, y señala las sutilezas de los significados y optimizaciones literales que cambian el valor de un resultado.

Cláusula 11: Reproducibilidad

editar

Esta cláusula es nueva; recomienda que los estándares de lenguaje proporcionen un medio para escribir programas reproducibles (es decir, programas que producirán el mismo resultado en todas las implementaciones de un lenguaje), y describe lo que debe hacerse para lograr resultados reproducibles.

Anexo A: Bibliografía

editar

Este anexo es nuevo; enumera algunas referencias útiles.

Anexo B: soporte de depuración del programa

editar

Este anexo es nuevo; Proporciona orientación a los desarrolladores de depuradores para las características que se desean para soportar la depuración de código de punto flotante.

Índice de operaciones

editar

Este es un nuevo índice, que enumera todas las operaciones descritas en el estándar (obligatorio u opcional).

Discutido pero no incluido

editar

Debido a los cambios en el diseño y desarrollo de la CPU, el estándar de punto flotante IEEE 2008 podría verse como histórico u obsoleto como el estándar de 1985 que reemplazó. Hubo muchas discusiones externas y elementos no cubiertos en el proceso de estandarización, los siguientes son los que se hicieron públicos:

  • El Anexo "L" recomendó a los desarrolladores de idiomas cómo vincular elementos en el estándar a características en un idioma.
  • El Anexo "U" proporcionó orientación sobre la elección de las definiciones de flujo inferior numérico.

En 754, la definición de flujo inferior era que el resultado es pequeño y encuentra una pérdida de precisión.

Se permitieron dos definiciones para la determinación de la condición 'pequeña': antes o después de redondear el resultado infinitamente preciso a la precisión de trabajo, con exponente ilimitado.

Se permitieron dos definiciones de pérdida de precisión: resultado inexacto o pérdida debido solo a la desnormalización. Ningún sistema de hardware conocido implementó este último y se ha eliminado del estándar revisado como una opción.

El Anexo U de 754r recomendó que solo la levedad después del redondeo e inexacta como pérdida de precisión sea una causa de la señal de flujo inferior.

  • El Anexo "Z" introdujo tipos de datos opcionales para admitir otros formatos de punto flotante de ancho fijo, así como formatos de precisión arbitraria (es decir, donde la precisión de la representación y el redondeo se determina en el momento de la ejecución): parte de este material se trasladó al cuerpo del borrador generalizando la sección 5. Se eliminó la precisión arbitraria.
  • Herencia y propagación de modos (manejo de excepciones, presustitución, redondeo) e indicadores (inexacto, subdesbordamiento, desbordamiento, división por cero, no válido). El deseo es que las banderas se propaguen a la persona que llama; y los cambios de modo pueden ser heredados por una persona que llama, pero no afectan a la persona que llama.
  • Se discutieron los intervalos y otras aritméticas, pero no se incluyeron como fuera del alcance (y un gran trabajo por derecho propio). El trabajo está comenzando en 2008 en un estándar IEEE propuesto para la aritmética de intervalos.

Enlaces externos

editar

Referencias

editar
  1. «ANSI/IEEE Std 754-2019». 754r.ucbtest.org. Consultado el 6 de agosto de 2019. 
  2. «15 September 2005 meeting». 
  3. «DRAFT Standard for Floating-Point Arithmetic P754, version 1.2.5», Revising ANSI/IEEE Std 754-1985, 4 de octubre de 2006 .
  4. 754-2008 - IEEE Standard for Floating-Point Arithmetic. IEEE. 29 de agosto de 2008. ISBN 978-0-7381-5752-8. doi:10.1109/IEEESTD.2008.4610935.  (NB. Superseded by IEEE Std 754-2019, a revision of IEEE 754-2008.)