Explications techniques des RTX série 3000

RTX IO

Le stockage est le composant matériel le plus lent d’un ordinateur. Les SSD SATA ont contribué à atténuer ce problème dans une certaine mesure, notamment en ce qui concerne les temps d’accès et les E/S. Cependant, un SSD SATA est toujours infiniment plus lent que la mémoire DDR4-4000 dual channel, le cache L3 du processeur, ou la mémoire GDDR6X à 19 Gbps. Les SSD NVMe qui utilisent la norme PCIe évoluent en largeur de bande à chaque nouvelle génération de PCIe. Les SSD NVMe de la génération précédente, basés sur le PCIe Gen3, pouvaient offrir jusqu’à 3,5 Go/s de transferts, alors que ceux basés sur le PCIe Gen4 devraient atteindre 7 Go/s. Des efforts sont déjà en cours pour rendre les SSD du futur encore plus rapides que le PCIe.

Le stockage n’est pas sans frais et chaque demande d’E/S de stockage dans une architecture PC classique dépend toujours du processeur pour traiter la demande d’E/S. Selon les tests effectués par NVIDIA, la lecture de données non compressées à partir d’un SSD Gen4 exige l’utilisation complète de deux cœurs de processeur. Le système d’exploitation répartit généralement cette charge de travail sur tous les cœurs/threads disponibles d’un CPU multicœur moderne.

Les choses changent radicalement lorsque les données sont compressées, notamment dans les jeux où il y a un nombre élevé de demandes d’E/S. Les jeux AAA modernes comportent des centaines de milliers de ressources individuelles entassées dans des fichiers compressés de type « resource-pack » (malgré que les codes binaires soient toujours déplacés à une vitesse pouvant atteindre 7 Go/s, grâce au disque NVMe). Le flux de données décompressé au niveau du processeur peut atteindre 14 Go/s (dans le meilleur des cas). En outre, chaque demande d’entrée/sortie est accompagnée de son propre surdébit. C’est-à-dire un ensemble d’instructions permettant au processeur de récupérer la ressource x dans le fichier y et de la transmettre au tampon z, ainsi que les instructions pour décompresser ou décrypter la ressource.

rtx io 7

Cela pourrait nécessiter une énorme quantité de puissance CPU à une échelle de débit d’entrée/sortie élevée. NVIDIA estime que le nombre de cœurs CPU requis pourrait atteindre 24. Microsoft a cherché à résoudre ce problème en introduisant l’API DirectStorage. Cette technologie permet à un GPU d’extraire des données compressées directement à partir du périphérique de stockage, en décompressant les données sur le GPU. NVIDIA RTX IO s’appuie sur ce système.

NVIDIA RTX IO est une couche externe de DirectStorage qui est optimisée pour le jeu et l’architecture GPU de NVIDIA. RTX IO apporte une décompression des données sans perte pour le GPU. Ce qui signifie que les données restent compressées et regroupées lorsqu’elles sont déplacées du disque vers le GPU, en exploitant DirectStorage. NVIDIA affirme que cela améliore les performances d’E/S par un facteur de deux. NVIDIA affirme en outre que les GPU GeForce RTX ; grâce à leur nombre élevé de cœurs CUDA, sont capables de décharger des « dizaines » de cœurs de CPU. Ce qui permet d’obtenir des performances de décompression dépassant même les charges de données compressées que les SSD PCIe Gen4 peuvent imposer.

Page précédente 1 2 3 4 5 6 7 8Page suivante

Gregory

Toujours intéressé par l’évolution informatique, j’ai voulu être plus actif en intégrant Pause Hardware. Depuis je traite les nouvelles et les tests au quotidien avec l’équipe.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page