Nvidia PiD : décodage latent et upscaling 2K en 1 passe sur RTX 5090

Nvidia présente PiD, pour Pixel Diffusion Decoder, une méthode de décodage latent qui vise le haut débit en haute définition. Sur une carte graphique grand public RTX 5090, PiD décode un latent 512×512 et le suréchantillonne directement en 2048×2048 en moins d’une seconde, avec un pic à 13 Go de mémoire. Sur un GPU GB200, l’inférence descend à 210 ms.

Décodage conditionnel et suréchantillonnage en un seul bloc

La plupart des pipelines texte‑vers‑image génèrent dans l’espace latent puis délèguent à un décodeur la reconstruction en image pleine résolution. Ce schéma est efficace, mais les décodeurs classiques excellent surtout à « rétablir » le signal encodé et peinent à enrichir la texture et les micro‑détails à l’échelle du mégapixel, avec des limites nettes en qualité et en latence.

Comparaison de latents générés avec différentes méthodes, incluant une image de chat et d'astronaute.

PiD redéfinit ce décodage en le formulant comme une diffusion conditionnelle en pixels, et fusionne décodage et upscaling au sein d’un générateur unique. Concrètement, le module comble textures, structures et détails locaux au moment même de la sortie, au lieu de s’en remettre à une chaîne de surcouches.

Comparaison de décodage VAE et PiD avec texte

Architecture, compatibilité et perfs

Le modèle s’appuie sur PixelDiT, assorti d’un adaptateur léger de type ControlNet. Celui‑ci injecte le latent bruité et module dynamiquement la confiance accordée à ce signal via un mécanisme de gating lié à sigma. Pour tasser la latence, Nvidia applique une distillation DMD2 qui réduit l’inférence à 4 pas, avec early stop pour tenir l’équilibre vitesse/fidélité.

Au‑delà des VAE, PiD accepte aussi des latents sémantiques issus des approches RAE récentes, notamment SigLIP et DINOv2. Sur les jeux de tests publiés, la solution décode et upscale en 2048×2048 en une passe, tout en affichant une latence bout‑en‑bout jusqu’à 5,9× inférieure aux chaînes de diffusion en cascade pour la super‑résolution, avec une meilleure fidélité visuelle.

La consolidation du décodage et de l’upscaling dans un bloc de diffusion pixel conditionnel, combinée à une distillation agressive, confirme la stratégie de Nvidia: couper les coûts d’inférence haute définition sur carte unique tout en gardant de la marge sur serveurs. Si l’adoption suit côté VAE/RAE tiers, PiD pourrait s’imposer comme maillon standard des pipelines génératifs 2K et plus, y compris pour les usages interactifs sur PC équipés d’une seule carte graphique.

Source : ITHome

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Vous aimez PauseHardware ?
Ajoutez-nous à vos sources favorites sur Google pour voir apparaître nos contenus directement dans votre fil d’actualité.
⭐ Ajouter Non merci
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x