
Un développeur affirme avoir porté en 30 minutes un backend CUDA complet vers ROCm en s’appuyant exclusivement sur l’agent de programmation Claude Code. Publié le 22 janvier sur Reddit par « johnnytshi », le récit décrit une migration sans couche d’abstraction intermédiaire, avec une traduction directe des primitives CUDA vers leurs équivalents ROCm via un cadre d’agents capable d’inférer la logique bas niveau du code.
Selon l’auteur, l’interaction s’est faite en ligne de commande, sans mise en place d’un pipeline Hipify. Le seul obstacle notable aurait concerné le « data layout », point sensible dès qu’on touche à la hiérarchie mémoire et aux schémas d’accès. Pour le reste, l’IA aurait géré l’alignement des appels, la réécriture des kernels et l’adaptation des API, profitant du parallélisme conceptuel entre CUDA et ROCm.
La parenté entre les deux piles logicielles facilite les cas simples, mais les limites apparaissent dès qu’un codebase fortement couplé exploite des optimisations fines de cache, des patterns warp/onde spécifiques, ou des chemins critiques sensibles à la latence mémoire. L’auteur reconnaît que les optimisations « deep hardware » restent hors de portée de l’outil dans l’état, et que l’automatisation ne remplace ni la validation de performance ni le profiling ciblé.
La démonstration illustre une tendance: l’IA abaisse le coût d’entrée du portage CUDA→ROCm pour les projets modestes, au moins jusqu’à la compilation et aux tests fonctionnels. Pour des bibliothèques HPC, des runtimes d’entraînement ou des graphes complexes mêlant communications et kernels spécialisés, la barrière reste la stabilité des perfs et la maîtrise des topologies mémoire, deux sujets qui exigent encore des itérations manuelles, du profiling et une connaissance intime des GPU cibles.
À court terme, ce type d’assistance peut accélérer les explorations multi-vendeurs et la réduction de dette technique liée au verrou CUDA. À moyen terme, l’enjeu sera la capacité de ces agents à raisonner sur les modèles d’exécution, la coalescence des accès, l’occupation, et à proposer des transformations sûres au-delà de la simple correspondance d’API.
Source : reddit



