Je n'ai jamais utiliser python pour programmer un GPU, donc je ne sais pas exactement ce qu'il se passe avec numba.
De facon general, debugger et comprendre comment s'execute un programme sur un GPU est difficile. Et c'est difficile dans tous les langages.
C'est difficile de comprendre comment un GPU fonctionne purement a partir d'uncode. C'est typiquement l'inverse que tu fais. Tu comprends comment un GPU fonctionne de facon abstraite, et tu maps ton algorithme au GPU de facon a savoir precisement ce qu'il se passe ou.
Ensuite, tu peux utiliser les chrono, events, et les compteur de performance materiel pour confirmer que ton algorithme s'execute comme tu penses qu'il s'execute. Et souvent ca veut construire des modeles de performances pour verifier que l'execution correspond a tes attentes.
Les docs de NVIDIA en generale sont tres bien faites la dessus.
Je fais des videos de mon cours de calcul parallele ce semestre. Mais je ne parles de GPU qu'a la fin du semestre. Donc c'est assez peu probable que j'ai quelquechose de directement utile pour toi avant la mi-mars.
Mais si tu as des questions, n'hesites pas!