RTX 40 : Plus De Cache, Deux Fois Plus De ROP, Tensors Et RT Cores De Nouvelle Génération

Les détails concernant le GPU NVIDIA Ada Lovelace Gaming qui alimentera les cartes graphiques de la série GeForce RTX 40 ont été révélés. Les nouvelles informations proviennent de Kopte7kimi.

Le GPU NVIDIA Ada Lovelace AD102 comportera jusqu’à 12 GPC (Graphics Processing Clusters). C’est une augmentation de 70 % par rapport au GA102 qui ne comporte que 7 GPC. Chaque GPU sera composé de 6 TPC et de 2 SM. C’est l’équivalent de la configuration que la puce existante. Chaque SM (Streaming Multiprocessor) abritera quatre sous-cœurs, ce qui est également la même chose que le GPU GA102.

Ce qui a changé, c’est la configuration du noyau FP32 et INT32. Chaque sous-cœur comprendra 128 unités FP32, mais les unités combinées FP32 + INT32 iront jusqu’à 192. En effet, les unités FP32 ne partagent pas le même sous-cœur que les unités IN32. Les 128 cœurs FP32 sont séparés des 64 cœurs INT32.

Ainsi, au total, chaque sous-cœur sera composé de 128 unités FP32 plus 64 unités INT32 pour un total de 192 unités. Chaque SM aura un total de 512 unités FP32 plus 256 unités INT32 pour un total de 768 unités. Et comme il y a un total de 24 unités SM (2 par GPC), il y aurait 12 288 unités FP32 et 6 144 unités INT32 pour un total de 18 432 cœurs. Chaque SM comprendra également deux Wrap Schedules (32 threads/CLK) pour 64 wraps par SM. Il s’agit d’une augmentation de 50 % sur les cœurs (FP32 + INT32) et d’une augmentation de 33 % sur les Wraps/Threads par rapport au GPU GA102.

RTX 40, + 50% pour le cache

Concernant le cache, NVIDIA a donné un gros coup de fouet. Les GPU Ada Lovelace contiendront 192 Ko de cache L1 par SM. C’est une augmentation de 50% par rapport à Ampere. Cela représente un total de 4,5 Mo de cache L1 sur le GPU AD102 supérieur. Le cache L2 sera augmenté à 96 Mo comme mentionné dans les fuites. Il s’agit d’une augmentation de 16 fois par rapport au GPU Ampere qui n’héberge que 6 Mo de cache L2. Le cache sera partagé sur le GPU.

Enfin, nous avons les ROP qui sont également augmentés à 32 par GPC. C’est une augmentation de 2x par rapport à Ampère. Il y aura jusqu’à 384 ROP sur le produit phare de nouvelle génération contre seulement 112 sur le GPU Ampère le plus rapide, le RTX 3090 Ti. Il y aura également les derniers cœurs Tensor de 4e génération et RT (Raytracing) de 3e génération implantés sur les GPU Ada Lovelace, ce qui contribuera à faire passer les performances DLSS et Raytracing au niveau supérieur. Globalement, le GPU Ada Lovelace AD102 offrira :

2x GPC (contre Ampère)
50 % de cœurs en plus (par rapport à l’ampère)
50 % de cache L1 en plus (par rapport à l’ampère)
16x plus de cache L2 (par rapport à l’ampère)
Double ROP (par rapport à l’ampère)
Tensors de 4e génération et cœurs RT de 3e génération

Les cartes graphiques de la série NVIDIA GeForce RTX 40 dotées des GPU de jeu Ada Lovelace de nouvelle génération devraient être lancées au cours du second semestre 2022 et utiliseraient le même nœud de processus TSMC 4N que le GPU Hopper H100.

Source : wccftech

Retrouvez l’actualité hardware ici