Test RTX 4090 Gaming OC GIGABYTE : Elle domine toujours le classement en 2024

Spécificités des Nvidia RTX 4000

Architecture ADA de la Nvidia RTX 4090

Exit l’architecture Ampère qui équipait les cartes Nvidia GeForce RTX 3000 ! Voici l’architecture ADA. Celle-ci est inspirée du nom de la mathématicienne Ada Lovelace. C’est la troisième génération de la technologie Nvidia RTX. Elle s’équipe du nouveau noyau CUDA IPC « Ada » supérieur, du noyau RT de 3e génération, du noyau Tensor de 4e génération et d’un nouveau processeur de flux optique.

L’architecture graphique GeForce Ada de la RTX 4090 exploite le processus 4 nm TSMC. Il a permis d’augmenter le nombre de transistors à 76,3 milliards. C’est une augmentation de près de 3 fois par rapport à la génération précédente. Cependant, la taille de la matrice est plus petite. Elle est à 608 mm², par rapport aux 628 mm² du GA102 de la génération précédente. Le GPU dispose d’une interface hôte PCI-Express 4.0 x16 et d’un bus mémoire GDDR6X de 384 bits. La RTX 4090 a 24 Go de mémoire. L’accélérateur de flux optique (OFA) est un composant indépendant de niveau supérieur. La puce comprend deux unités NVENC (Nvidia Encoder) et une unité NVDEC (Nvidia Decoder).

Le silicium AD102 comprend 12 clusters de traitement graphique (GPC). Chacun d’entre eux possède les machines SIMD (Single Instruction on Multiple Data) et de rendu graphique. C’est un petit GPU à part entière. Chaque GPC partage un moteur de rastérisation (composants de traitement de la géométrie) et deux partitions ROP (chacune avec huit unités ROP). Le GPC de l’AD102 contient six clusters de traitement de texture (TPC). Chacun d’eux a deux multiprocesseurs de streaming (SM) et une unité polymorphe. Chaque SM contient 128 cœurs CUDA répartis sur quatre partitions. La moitié de ces cœurs CUDA sont en FP32 pur. L’autre moitié est capable de FP32 ou INT32. Le SM conserve la capacité de traitement mathématique simultané FP32 + INT32.

Le SM contient également un noyau RT de 3e génération, quatre noyaux Tensor de 4e génération, une mémoire cache et quatre TMU. Douze GPC totalisent donc 16 384 cœurs CUDA, 512 cœurs Tensor et 128 cœurs RT. Chaque GPC contribue à 16 ROP, il y a donc 192 ROP sur le silicium. Un cache L2 de 96 Mo sert aux différents GPC, contrôleurs de mémoire et l’interface hôte PCIe, pour échanger des données. Cependant, la RTX 4090 dispose de 72 Mo de cache L2 activé (sur 96 Mo physiquement présents sur le silicium).

Cœurs Tensor

Les cœurs NVIDIA Tensor activent et accélèrent les technologies d’intelligence artificielle transformatrices. Les nouveaux cœurs Tensor de quatrième génération d’Ada sont incroyablement rapides, augmentant le débit jusqu’à 5 fois en utilisant le nouveau moteur de transformateur FP8, introduit pour la première fois dans le GPU de centre de données Hopper H100.

Cœurs Ray Tracing

NVIDIA a fait du ray tracing en temps réel une réalité avec l’invention des RT Cores, des cœurs de traitement dédiés sur le GPU spécialement conçus pour faire face aux charges de travail du Ray Tracing gourmandes en performances. 

Les cœurs RT de troisième génération d’Ada ont deux fois le débit d’intersection rayon-triangle, augmentant les performances RT-TFLOP de plus de 2x.

Les nouveaux cœurs RT incluent également deux nouveaux moteurs, l’Opacity Micromap (OMM) et le Displaced Micro-Mesh (DMM). Le moteur OMM permet un traçage de rayons beaucoup plus rapide des textures alpha-testées souvent utilisées pour le feuillage, les particules et les clôtures. Le moteur DMM offre un temps de construction de la hiérarchie des volumes englobants (BVH) jusqu’à 10 fois plus rapide avec jusqu’à 20 fois moins d’espace de stockage BVH, permettant le traçage de rayons en temps réel de scènes géométriquement complexes.

Le Ray Tracing avancé nécessite de calculer l’impact de nombreux rayons frappant de nombreux types de matériaux différents dans une scène. Cela crée une séquence de charges de travail divergentes et inefficaces pour les shaders (les shaders calculent les niveaux appropriés de lumière, d’obscurité et de couleur pendant le rendu d’une scène 3D, et sont utilisés dans tous les jeux actuels).

La technologie Shader Execution Reordering (SER) réorganise dynamiquement ces charges de travail auparavant inefficaces en charge considérablement plus efficaces. Le SER peut améliorer jusqu’à 3 fois les performances du shader pour les opérations de Ray Tracing et les fréquences d’images en jeu jusqu’à 25 %.

DLSS 3

Depuis la sortie du DLSS, 216 jeux et applications ont intégré cette technologie. Le NVIDIA DLSS 3 est une avancée révolutionnaire dans les graphiques alimentés par l’IA qui améliore considérablement les performances. Propulsé par les nouveaux cœurs Tensor de quatrième génération et l’accélérateur de flux optique sur les GPU GeForce RTX série 40, le DLSS 3 utilise l’IA pour créer des images de haute qualité.

Le DLSS 3 intègre également le NVIDIA Reflex. Il synchronise le GPU et le CPU, assurant une réactivité optimale et une faible latence du système. Une latence système plus faible rend les commandes de jeu plus réactives et garantit que les actions à l’écran se produisent presque instantanément une fois que vous cliquez sur votre souris ou sur une autre entrée de commande. Par rapport au natif, le DLSS 3 peut réduire la latence jusqu’à 2 fois.

Encodeurs AV1

Les cartes graphiques basées sur l’architecture Ada sont dotées de nouveaux encodeurs NVIDIA de huitième génération (NVENC) avec encodage AV1. Ils offrent une multitude de nouvelles possibilités pour les streamers.

Il est 40 % plus efficace que le H.264 et permet aux utilisateurs qui diffusent en 1080p d’augmenter la résolution de leur flux à 1440p tout en fonctionnant avec le même débit et la même qualité.

Source : Nvidia

Page précédente 1 2 3 4 5 6Page suivante

Arnaud.O

Comme Obelix, je suis tombé dedans étant petit. Heureux possesseur d'un Commodore 128 à 14 ans, j'ai côtoyé les Atari et Amiga de l'époque avant de plonger définitivement dans le monde du PC. Infirmier libéral de profession, je suis habilité à vous prescrire une bonne dose de news et de tests.

2 commentaires

  1. 5

    Aucuns intérêts et je suis créateur de séquences en images de synthèse. Cela fait cher la console de jeux pour les gamers. Il y a un moment ou il faut savoir dire c’est bon, j’ai de quoi travailler rapidement et amortir mon achat et c’est là l’essentiel. Par contre je ne regrette pas mon dernier I9 13900ks ni le passage à la DDR5 malgré le problème XMP qui un jour sera résolu.

    Détails
    Leave A Review

    Qualité / Finition
    7.7
    Prix
    0
    Performances jeux
    8.8
    Consommation
    10
    Chauffe
    9.1

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Qualité / Finition
Prix
Performances jeux
Consommation
Chauffe
Note finale

Bouton retour en haut de la page