Ah mon avis, ils n'ont aucune idee de comment fonctionne un GPU sur le forum materiel informatique. Et probablment tout ceux qui sont capable de repondre a une question comme ca font de la programmation CUDA et sont probablement aussi ici.
Ca fait longtemps que l'architecture des GPU de NVIDIA dispose d'un cache L2 pour les load en memoire global. Ce qui change est que les load globaux ne sont maintenant qu'en cache L2 et plus en cache L1.
Le cache L1 sert toujours a 3 choses:
-spiller les variables locales. (Si tu consomme trop de registres par block, les registres sont spiller dans ce cache la)
-shared memory. (Tous les shared qu'on retrouve en cuda pour partager la memoire entre thread d'un meme block avec un load de 1 cycle)
-texture memory caching. (parcequ'il faut bien cacher ce truc la quelques part)
Le cache L1 pour cacher les access a la memeoire globale etait tres peu efficace. Soit les donnee etait utilise de mamniere completement previsible et probablement il etait preferable de copier ca en shared memory. Soit on va probablement pas les lire tres souvent et du coup, c'est aussi bien en L2.
Si tu as plus de question n'hesite pas.