Explications techniques des RTX série 3000

Le nouveau cœur Ampère RT et le cœur tenseur

Avec Ampere, NVIDIA introduit son noyau RT de 2ème génération qui vise à améliorer l’accélération du raytracing ainsi que de nouveaux effets, tels que le raytraced motion blur.

Un cœur RT est un composant à fonction unique qui gère deux des tâches difficiles pour les shaders programmables SIMD. À savoir la traversée et l’intersection avec la hiérarchie de volume limite (BVH). C’est-à-dire le calcul du point exact où un rayon entre en collision avec une surface, afin que la suite de la trajectoire puisse être tracée. Les charges de travail de traçage de rayons impliquent le calcul des étapes de traversée et d’intersection à travers les intersections BVH et bounding-box/triangle. Ceci est une charge de travail très inappropriée pour les GPU à cause des accès mémoire. Ce type de poursuite de pointeur ne s’adapte pas bien aux architectures SIMD. Les matériels spéciaux à fonction fixe, comme les cœurs MIMD RT, sont mieux adaptés pour ces calculs.

raytracing acceleration

Sans indiquer de nom, NVIDIA a souligné qu’une approche minimaliste du raytracing (peut-être ce que fait AMD avec le RDNA2) a un impact sur les performances en raison de la dépendance excessive aux processeurs de flux SIMD. Les cœurs RT de NVIDIA offrent une pile de traversées BVH entièrement matérielle, une unité d’exécution MIMD spécialement conçue et une latence intrinsèquement plus faible pour la pile matérielle. La deuxième génération de cœurs RT introduite avec Ampere ajoute un composant matériel supplémentaire.

Ampere introduit un nouveau bloc logique qui interpole les positions des triangles dans le temps, en coordination avec l’unité de triangulation. NVIDIA indique que cela est utile pour générer des effets de flou de mouvement dans le raytracing en temps réel.

A priori NVIDIA l’utilise plutôt pour optimiser les performances du raytracing. Comme très peu de choses changent entre deux images, il n’est pas nécessaire de recalculer tous les résultats pour l’image suivante. Ainsi comme toutes les intersections de rayons sont calculées pour l’image actuelle, quand le joueur se déplace ou change la caméra et que les objets sont positionnés légèrement différemment, il est probable que NVIDIA ait couplé un algorithme d’estimation du mouvement avec RTX. Cet algorithme se souvient des dernières intersections comme étant de « bons candidats » et les vérifie au début de tout le processus. Si le résultat est valide au début du test, cela signifie que de nombreuses entrées dans le BVH n’ont pas besoin d’être traitées à nouveau.

Les cœurs tenseurs de 3ème génération

Le nouveau cœur tenseur de 3e génération s’est largement inspiré du processeur A100 Tensor Core que NVIDIA a présenté ce printemps (même s’il est spécialement conçu pour le travail d’apprentissage approfondi de l’IA). Pour améliorer les performances, les cœurs tenseurs Ampère sont conçus pour tirer parti de la rareté des réseaux d’apprentissage profond. La rareté est un phénomène qui permet de découper une matrice dense sans en affecter la précision. À l’image du Jenga, l’objectif est de conserver une colonne intacte malgré certains blocs en moins. Les matrices éparses augmentent les performances d’inférence de l’IA.

Page précédente 1 2 3 4 5 6 7 8Page suivante

Gregory

Toujours intéressé par l’évolution informatique, j’ai voulu être plus actif en intégrant Pause Hardware. Depuis je traite les nouvelles et les tests au quotidien avec l’équipe.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page