les nouveaux processeurs font tout " à la fois" ; un P4 fait aussi bien du SSE2 que de l´ancien MMX, les jeux d´instructions étant toujours présent. TOUTEFOIS, les instructions ne sont pas forcément cablées pareil, on a ainsi certaines instructions MMX devenues tres lentes juste par soucis de compatibilité au profit d´instructions nouvelles SSE ( faut que ça rentre, quand meme, tout ça.. alors si on rajoute des choses, meme si les capacités techniques augmentent, il faut vire un peu de l´ancien). C´est comme ça qu´on final on se retrouve avec des guides d´optimisation PAR processeur ; mais à moins de faire du tres bas niveau et de tripoter du pipeline V à longueur de journée, on prefera un bon compilo avec les options adéquates.
pour le SSE notamment, il y un " mode de programmation" bien propre, puisqu´il s´agit de vectoriser au maximum ses données pour les traiter par lots ( les mnémoniques SSE traitent des données 128 bits qui sont en fait 4 float packés ; pour la 3D, avec tout ce qui est vecteur et matrice justement, ça dépote bien comme il faut ! Quand au SSE2, c´est tout pareil, mais pour des double)