NVIDIA acaba de presentar las GPU de sobremesa GeForce RTX™ SUPER, que proporcionan un rendimiento extraordinario para la IA generativa, los nuevos portátiles de IA de los principales fabricantes y las nuevas herramientas y software de IA acelerados por NVIDIA RTX™ para desarrolladores y usuarios.
Basándose en décadas de liderazgo en PC, con más de 100 millones de sus GPUs RTX impulsando la era del PC con IA, NVIDIA ofrece ahora estas herramientas para mejorar las experiencias de PC con IA generativa: aceleración NVIDIA TensorRT™ del popular modelo Stable Diffusion XL para flujos de trabajo de texto a imagen, NVIDIA RTX Remix con herramientas de textura de IA generativa, microservicios NVIDIA ACE y más juegos que utilizan la tecnología DLSS 3 con Frame Generation.
Además, NVIDIA TensorRT-LLM (TRT-LLM), una biblioteca de código abierto que acelera y optimiza el rendimiento de inferencia de los últimos modelos de lenguaje de gran tamaño (LLM), ahora admite más modelos preoptimizados para PC. Acelerado por TRT-LLM, Chat with RTX, una demo tecnológica de NVIDIA que también se publica este mes, permite a los entusiastas de la IA interactuar con sus notas, documentos y otros contenidos.
“La IA generativa es la transición de plataforma más significativa en la historia de la computación y transformará todas las industrias, incluidos los juegos”, dijo Jensen Huang, fundador y CEO de NVIDIA. “Con más de 100 millones de PC y estaciones de trabajo RTX AI, NVIDIA es una base de instalación masiva para que desarrolladores y jugadores disfruten de la magia de la IA generativa”.
Ejecutar IA generativa localmente en un PC es fundamental para aplicaciones sensibles a la privacidad, la latencia y los costes. Requiere una amplia base de sistemas preparados para la IA, así como las herramientas de desarrollo adecuadas para ajustar y optimizar los modelos de IA para la plataforma de PC.
Para satisfacer estas necesidades, NVIDIA ofrece innovaciones a través de toda su pila tecnológica, impulsando nuevas experiencias y construyendo sobre las más de 500 aplicaciones y juegos de PC habilitados para IA ya acelerados por la tecnología NVIDIA RTX.
PC y estaciones de trabajo con IA RTX
Las GPUs NVIDIA RTX, capaces de ejecutar una amplia gama de aplicaciones al máximo rendimiento, liberan todo el potencial de la IA generativa en los PC. Los núcleos tensoriales de estas GPU aceleran drásticamente el rendimiento de la IA en las aplicaciones más exigentes para el trabajo y el tiempo libre.
Las nuevas tarjetas gráficas de la serie GeForce RTX 40 SUPER, también anunciadas hoy en CES, incluyen las GeForce RTX 4080 SUPER, 4070 Ti SUPER y 4070 SUPER para ofrecer el máximo rendimiento en IA. La GeForce RTX 4080 SUPER genera vídeo con IA 1,5 veces más rápido -e imágenes 1,7 veces más rápido- que la GPU GeForce RTX 3080 Ti. Los núcleos sensores de las GPU SUPER proporcionan hasta 836 billones de operaciones por segundo, lo que aporta una capacidad de IA transformadora a los juegos, la creación y la productividad cotidiana.
Los principales fabricantes, incluidos Acer, ASUS, Dell, HP, Lenovo, MSI, Razer y Samsung, están lanzando una nueva oleada de portátiles RTX AI, que ponen a disposición de los usuarios un completo conjunto de funciones de IA generativa nada más sacarlos de la caja. Los nuevos sistemas, que ofrecen un aumento del rendimiento de entre 20 y 60 veces en comparación con el uso de unidades de procesamiento neuronal, empezarán a comercializarse este mes.
Las estaciones de trabajo móviles con GPU RTX pueden ejecutar el software NVIDIA AI Enterprise, que incluye TensorRT y NVIDIA RAPIDS™ para simplificar y asegurar el desarrollo de inteligencia artificial generativa y ciencia de datos. Con cada GPU NVIDIA A800 40GB Active se incluye una licencia de tres años para NVIDIA AI Enterprise, lo que proporciona una plataforma de desarrollo de estaciones de trabajo ideal para IA y ciencia de datos.
Nuevas herramientas de desarrollo de PC para crear modelos de IA
NVIDIA acaba de presentar NVIDIA AI Workbench, un conjunto de herramientas unificadas y fáciles de usar para ayudar a los desarrolladores a crear, probar y personalizar modelos de IA generativa y LLM pre entrenados con un rendimiento y un consumo de memoria propios de un PC.
AI Workbench, que se lanzará en versión beta a finales de este mes, ofrece acceso simplificado a repositorios populares como Hugging Face, GitHub y NVIDIA NGC™, junto con una interfaz de usuario simplificada que permite a los desarrolladores reproducir, colaborar y migrar proyectos con facilidad.
Los proyectos se pueden escalar a prácticamente cualquier lugar, ya sea el centro de datos, una nube pública o NVIDIA DGX™ Cloud, y luego traer de vuelta a los sistemas RTX locales en un PC o estación de trabajo para la inferencia y la personalización ligera.
En colaboración con HP, NVIDIA también está simplificando el desarrollo de modelos de IA mediante la integración de NVIDIA AI Foundation Models and Endpoints, que incluyen modelos de IA acelerados por RTX y kits de desarrollo de software, en HP AI Studio, una plataforma centralizada para la ciencia de datos. Esto permitirá a los usuarios buscar, importar y desplegar fácilmente modelos optimizados en PC y en la nube.
Después de crear modelos de IA para casos de uso en PC, los desarrolladores pueden optimizarlos utilizando NVIDIA TensorRT para aprovechar al máximo los tensor cores de las GPUs RTX.
Recientemente, NVIDIA amplió TensorRT a las aplicaciones basadas en texto con TensorRT-LLM para Windows, una biblioteca de código abierto para acelerar LLM. La última actualización de TensorRT-LLM, ya disponible, añade Phi-2 y Zephyr 7B a la creciente lista de modelos pre optimizados para PC.
La IA generativa acelerada por RTX impulsa nuevas experiencias en el PC
En CES, NVIDIA y sus socios desarrolladores están lanzando nuevas aplicaciones y servicios impulsados por IA generativa para PC, incluyendo:
- NVIDIA RTX Remix, una plataforma para crear impresionantes remasterizaciones RTX de juegos clásicos. Se lanzará en versión beta a finales de este mes y ofrece herramientas de IA generativa que pueden transformar texturas básicas de juegos clásicos en modernos materiales de renderizado basados en la física y con resolución 4K.
- Microservicios NVIDIA ACE, que incluyen modelos de habla y animación basados en IA generativa, lo que permite a los desarrolladores añadir avatares digitales inteligentes y dinámicos a los juegos.
- Aceleración TensorRT para Stable Diffusion XL (SDXL) Turbo y modelos de consistencia latente, dos de los métodos de aceleración de Stable Diffusion más populares. TensorRT mejora el rendimiento para ambos hasta en un 60% en comparación con la anterior implementación más rápida. También está disponible una versión actualizada de la extensión TensorRT de Stable Diffusion WebUI, que incluye aceleración para SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) y soporte mejorado de LoRA.
- NVIDIA DLSS 3 con generación de fotogramas, que utiliza la IA para aumentar la velocidad de fotogramas hasta 4 veces en comparación con el renderizado nativo, aparecerá en una docena de los 14 nuevos juegos RTX anunciados, entre ellos Horizon Forbidden West, Pax Dei y Dragon’s Dogma 2.
- Chat with RTX, una demo tecnológica de NVIDIA disponible a finales de este mes, permite a los entusiastas de la IA conectar fácilmente los LLM del PC a sus propios datos utilizando una popular técnica conocida como retrieval-augmented generation (RAG). La demo, acelerada por TensorRT-LLM, permite a los usuarios interactuar rápidamente con sus notas, documentos y otros contenidos. También estará disponible como proyecto de referencia de código abierto, para que los desarrolladores puedan implementar fácilmente las mismas capacidades en sus propias aplicaciones.