Supermuestreo de aprendizaje profundo


De Wikipedia, la enciclopedia libre
  (Redirigido desde Tensor Core )
Saltar a navegación Saltar a búsqueda

Deep Learning Super Sampling ( DLSS ) es una tecnología de escalado de imágenes temporal desarrollada por Nvidia y exclusiva de las tarjetas gráficas de Nvidia para uso en tiempo real en videojuegos selectos, que utiliza el aprendizaje profundo para escalar imágenes de menor resolución a una resolución más alta para mostrar en mayor -Resolución de monitores de computadora. Nvidia afirma que esta tecnología mejora las imágenes con una calidad similar a la de renderizar la imagen de forma nativa en la resolución más alta, pero con menos cálculo realizado por la tarjeta de video, lo que permite configuraciones gráficas y velocidades de cuadro más altas para una resolución determinada. [1] Nvidia afirma que "DLSS 2.0 ofrece una calidad de imagen comparable a la resolución nativa". [2]

A partir de junio de 2021, esta tecnología está disponible exclusivamente en las GPU de las series GeForce RTX 20 y GeForce RTX 30 .

Historia

Nvidia anunció DLSS como una característica clave de las GPU de la serie GeForce RTX 20 cuando se lanzaron en septiembre de 2018. [3] En ese momento, los resultados se limitaron a unos pocos videojuegos (a saber, Battlefield V [4] y Metro Exodus ) porque el El algoritmo tenía que ser entrenado específicamente en cada juego en el que se aplicó y los resultados generalmente no eran tan buenos como el simple aumento de resolución. [5] [6]

En 2019, el videojuego Control se envió con trazado de rayos y una versión mejorada de DLSS, que no usaba Tensor Cores. [7] [8]

En abril de 2020, Nvidia anunció y envió con la versión 445.75 del controlador una versión mejorada de DLSS llamada DLSS 2.0, que estaba disponible para algunos juegos existentes, incluidos Control y Wolfenstein: Youngblood , y estaría disponible más adelante para los próximos juegos. Esta vez, Nvidia dijo que volvió a usar Tensor Cores y que la IA no necesitaba ser entrenada específicamente en cada juego. [3] [9]

Un efecto secundario de DLSS 2.0 es que parece no funcionar muy bien con técnicas anti-aliasing como MSAA o TSAA , y el rendimiento se ve afectado negativamente si estas técnicas se habilitan sobre DLSS. [10]

A partir de julio de 2021, los desarrolladores de juegos aún deben incluir DLSS 2.0 por juego .

Historial de versiones

Ajustes preestablecidos de calidad

  1. ^ No es necesario que el algoritmo se implemente con estos ajustes preestablecidos; el implementador puede definir resoluciones personalizadas de entrada y salida.
  2. ^ El factor de escala lineal utilizado para aumentar la resolución de entrada a la resolución de salida. Por ejemplo, una escena renderizada a 540p con un factor de escala de 2.00x tendría una resolución de salida de 1080p.
  3. ^ La escala de renderizado lineal, en comparación con la resolución de salida, que utiliza la tecnología para renderizar escenas internamente antes del muestreo. Por ejemplo, una escena de 1080p con una escala de renderización del 50% tendría una resolución interna de 540p.

Algoritmo

DLSS 1.0

Nvidia explicó que DLSS 1.0 funcionó para cada imagen de juego objetivo al generar un "cuadro perfecto" usando el supermuestreo tradicional , luego entrenó la red neuronal en estas imágenes resultantes. En un segundo paso, se entrenó al modelo para reconocer entradas con alias en el resultado inicial. [14] [15]

DLSS 2.0

DLSS 2.0 funciona de la siguiente manera: [16]

  • La red neuronal es entrenada por Nvidia usando imágenes "ideales" de videojuegos de ultra alta resolución en supercomputadoras e imágenes de baja resolución de los mismos juegos. El resultado se almacena en el controlador de la tarjeta de video . Se dice que Nvidia utiliza servidores DGX-1 para realizar el entrenamiento de la red. [17]
  • La red neuronal almacenada en el controlador compara la imagen real de baja resolución con la referencia y produce un resultado de alta resolución completa. Las entradas utilizadas por la red neuronal entrenada son las imágenes con alias de baja resolución generadas por el motor del juego y los vectores de movimiento de baja resolución de las mismas imágenes, también generadas por el motor del juego. Los vectores de movimiento le dicen a la red en qué dirección se mueven los objetos en la escena de un cuadro a otro, para estimar cómo se verá el siguiente cuadro. [18]

Arquitectura

DLSS solo está disponible en las GPU de las series GeForce RTX 20 y GeForce RTX 30 , en aceleradores de IA dedicados llamados Tensor Cores . [18] [19]

Los núcleos tensores están disponibles desde la microarquitectura de la GPU Nvidia Volta , que se utilizó por primera vez en la línea de productos Tesla V100 . [20] Su especificidad es que cada Tensor Core opera en matrices 4 x 4 de coma flotante de 16 bits , y parece estar diseñado para ser utilizado en el nivel CUDA C ++, incluso en el nivel del compilador . [21]

Los núcleos tensoriales utilizan CUDA Warp -Level Primitives en 32 subprocesos paralelos para aprovechar su arquitectura paralela. [22] Un Warp es un conjunto de 32 subprocesos que están configurados para ejecutar la misma instrucción.

Ver también

  • Escala de imagen
  • Aprendizaje profundo
  • Supermuestreo
  • GeForce
  • Nvidia DGX
  • Unidad de procesamiento de tensor , un circuito integrado específico de aplicación (ASIC) del acelerador de IA desarrollado por Google
  • Lista de juegos con soporte DLSS

Referencias

  1. ^ "Nvidia RTX DLSS: todo lo que necesita saber" . Tendencias digitales . 2020-02-14 . Consultado el 5 de abril de 2020 . El supermuestreo de aprendizaje profundo utiliza inteligencia artificial y aprendizaje automático para producir una imagen que parece una imagen de mayor resolución, sin la sobrecarga de procesamiento. El algoritmo de Nvidia aprende de decenas de miles de secuencias renderizadas de imágenes que fueron creadas usando una supercomputadora. Eso entrena el algoritmo para poder producir imágenes igualmente hermosas, pero sin requerir que la tarjeta gráfica trabaje tan duro para hacerlo.
  2. ^ "¿Qué es DLSS? Explicación de la tecnología RTX de Nvidia" . Reseñas confiables . 2021-03-23 . Consultado el 30 de marzo de 2021 .
  3. ^ a b c "Nvidia DLSS en 2020: resultados asombrosos" . techspot.com. 2020-02-26 . Consultado el 5 de abril de 2020 .
  4. ^ a b "Battlefield V DLSS probado: sobreprometido, entregado insuficientemente" . techspot.com. 2019-02-19 . Consultado el 6 de abril de 2020 . Por supuesto, esto es de esperar. DLSS nunca iba a proporcionar la misma calidad de imagen que el 4K nativo, al tiempo que proporcionaría un aumento del rendimiento del 37%. Eso sería magia negra. Pero la diferencia de calidad al comparar los dos es casi ridícula, en lo lejos que está DLSS de la presentación nativa en estas áreas estresantes.
  5. ^ "AMD piensa que NVIDIA DLSS no es lo suficientemente bueno; llama a TAA y SMAA mejores alternativas" . techquila.co.in. 2019-02-15 . Consultado el 6 de abril de 2020 . Recientemente, dos grandes títulos recibieron soporte de NVIDIA DLSS, a saber, Metro Exodus y Battlefield V. Ambos juegos vienen con la implementación de NVIDIA DXR (DirectX Raytracing) que por el momento solo es compatible con las tarjetas GeForce RTX. DLSS hace que estos juegos se puedan reproducir a resoluciones más altas con velocidades de cuadro mucho mejores, aunque hay una disminución notable en la nitidez de la imagen. Ahora, AMD ha criticado DLSS, diciendo que los métodos AA tradicionales como SMAA y TAA "ofrecen combinaciones superiores de calidad de imagen y rendimiento".
  6. ^ "Nvidia muy silenciosamente hizo DLSS un infierno mucho mejor" . Kotaku . 2020-02-22 . Consultado el 6 de abril de 2020 . El beneficio para la mayoría de las personas es que, en general, DLSS viene con una mejora considerable de FPS. Cuánto varía de un juego a otro. En Metro Exodus, el salto de FPS apenas se produjo y ciertamente no valió la pena el extraño golpe a la calidad de imagen.
  7. ^ a b "Control de Remedy vs DLSS 2.0 - El escalado de AI alcanza el siguiente nivel" . Eurogamer . 2020-04-04 . Consultado el 5 de abril de 2020 . Por supuesto, esta no es la primera implementación de DLSS que hemos visto en Control. El juego se envió con una interpretación lo suficientemente decente de la tecnología que en realidad no usaba el aprendizaje automático.
  8. ^ "La actualización de NVIDIA DLSS 2.0 solucionará el gran error de las tarjetas Geforce RTX" . techquila.co.in. 2020-03-24 . Consultado el 6 de abril de 2020 . Como se prometió, NVIDIA ha actualizado la red DLSS en una nueva actualización de Geforce que proporciona una calidad de imagen mejor y más nítida al tiempo que conserva una mayor velocidad de fotogramas en los juegos con trazado de rayos. Si bien la función no se usó tan bien en su primera iteración, NVIDIA ahora confía en que han solucionado con éxito todos los problemas que tenía antes.
  9. ^ "Noticias de HW - Crysis Remastered Ray Tracing, NVIDIA DLSS 2, Ryzen 3100 Rumors" . 2020-04-19 . Consultado el 19 de abril de 2020 . “El DLSS original requería entrenar la red de IA para cada nuevo juego. DLSS 2.0 se entrena utilizando contenido no específico del juego, entregando una red generalizada que funciona en todos los juegos. Esto significa integraciones de juegos más rápidas y, en última instancia, más juegos DLSS ".
  10. ^ "Evaluación de la calidad y el rendimiento de NVIDIA DLSS 2.0 en Mech 5 y control" . hothardware.com. 2020-03-27 . Consultado el 7 de abril de 2020 . Un efecto secundario de DLSS es que no parece funcionar bien con MSAA (forzado a través de los controladores) o TXAA habilitado en el juego. El rendimiento en realidad se derrumbó bastante con cualquiera de esos métodos de suavizado en la parte superior de DLSS 2.0, con el modo de calidad solo funcionando alrededor de la mitad de rápido que sin DLSS
  11. ^ Edelsten, Andrew (30 de agosto de 2019). "NVIDIA DLSS: Control y más allá" . nividia.com . Consultado el 11 de agosto de 2020 . Desarrollamos un nuevo algoritmo de procesamiento de imágenes que se aproximaba a nuestro modelo de investigación de IA y se ajustaba a nuestro presupuesto de rendimiento. Este enfoque de procesamiento de imágenes para DLSS está integrado en Control
  12. ^ "Revisión de NVIDIA DLSS 2.0 con control: ¿es esto mágico?" . techquila.co.in. 2020-04-05 . Consultado el 6 de abril de 2020 .
  13. ^ "NVIDIA preparando el modo Ultra Quality para DLSS, versión 2.2.9.0 detectada" . VideoCardz.com . Consultado el 6 de julio de 2021 .
  14. ^ "NVIDIA DLSS: Respuestas a sus preguntas" . Nvidia . 2019-02-15 . Consultado el 19 de abril de 2020 .El equipo de DLSS primero extrae muchos fotogramas con alias del juego de destino, y luego, para cada uno, generamos un "fotograma perfecto" coincidente utilizando supermuestreo o renderizado por acumulación. Estos fotogramas emparejados se envían al superordenador de NVIDIA. La supercomputadora entrena el modelo DLSS para reconocer las entradas con alias y generar imágenes con suavizado de alta calidad que coincidan con el "cuadro perfecto" lo más fielmente posible. Luego repetimos el proceso, pero esta vez entrenamos el modelo para generar píxeles adicionales en lugar de aplicar AA. Esto tiene el efecto de aumentar la resolución de la entrada. La combinación de ambas técnicas permite que la GPU represente la resolución completa del monitor a velocidades de cuadro más altas.
  15. ^ Una supercomputadora y una inteligencia artificial impulsarán el rendimiento de las GPU NVIDIA RTX: NVIDIA RTX 2080 . Juegos JAGS. 2018-08-23 . Consultado el 19 de abril de 2020 .
  16. ^ "La tecnología de supermuestreo de aprendizaje profundo (DLSS) 2.0 de NVIDIA es el verdadero negocio" . Forbes . 2020-03-29 . Consultado el 7 de abril de 2020 .
  17. ^ "NVIDIA DLSS 2.0: un gran salto en el renderizado de IA" . Nvidia . 2020-03-23 . Consultado el 25 de noviembre de 2020 .
  18. ^ a b "NVIDIA DLSS 2.0: un gran salto en el renderizado de IA" . Nvidia . 2020-03-23 . Consultado el 7 de abril de 2020 .
  19. ^ "NÚCLEOS DEL TENSOR DE NVIDIA" . Nvidia . Consultado el 7 de abril de 2020 .
  20. ^ "En tensores, Tensorflow, y la última 'Tensor núcleos de Nvidia ' " . tomshardware.com. 2017-04-11 . Consultado el 8 de abril de 2020 .
  21. ^ "La inmersión profunda de aprendizaje profundo de NVIDIA Titan V: se trata de los núcleos tensoriales" . AnandTech . 2018-07-03 . Consultado el 8 de abril de 2020 .
  22. ^ "Uso de primitivas de nivel de deformación CUDA" . Nvidia . 2018-01-15 . Consultado el 8 de abril de 2020 . Las GPU NVIDIA ejecutan grupos de subprocesos conocidos como warps en el modo SIMT (instrucción única, subproceso múltiple)
Obtenido de " https://en.wikipedia.org/w/index.php?title=Deep_learning_super_sampling&oldid=1045430960#Architecture "