Sur le principe, la réalité virtuelle partage de nombreux points communs avec une autre technologie de rendu visuel : la 3D. Toutefois, tandis que cette dernière péchait par son manque d'immersion chronique, la VR en fait son principal argument.
Sur le papier, le fonctionnement de la VR est ainsi relativement simple à comprendre. Tout d’abord, on retrouve le principe de base de la 3D stéréoscopique : pour recréer de façon virtuelle la sensation de relief, il faut produire deux images légèrement différentes de la scène, une pour chaque œil. Dans le monde réel, nos deux yeux voient en effet notre environnement sous des angles légèrement différents, en raison de l’espace qui les sépare, et c’est principalement en interprétant les différences entre les images des deux yeux que le cerveau détermine le relief.
La VR adopte par contre une stratégie très différente pour présenter ces deux images. Alors qu’en 3D stéréoscopique classique les deux images sont affichées au même endroit puis filtrées pour que chaque œil ne voit que l’image qui lui est destinée, la VR passe par un casque contenant deux zones d’affichages distinctes (même s’il s’agit souvent d’un écran unique, coupé en deux). Ceci permet d’éliminer les deux défauts des deux principales technologies de 3D stéréoscopiques : la division de la définition horizontale par deux avec les lunettes passives polarisées, et la division du nombre d’images par seconde par deux avec les lunettes actives (même si en pratique ce dernier point est généralement compensé par un doublement de la vitesse à la source).
Toujours par rapport à la 3D, le recours au casque de réalité virtuelle permet en outre d’améliorer très fortement l’immersion du spectateur dans la scène, en occultant le reste de l’environnement et en augmentant très fortement la part du champ de vision occupée par l’écran. A titre de comparaison, un Oculus Rift couvre un champ de vision horizontal de 110°, alors qu’un écran 27° vu à une distance de 60cm ne couvre que 53°.
La dernière grosse différence par rapport à la simple 3D stéréoscopique est l’ajout de capteurs permettant de détecter les mouvements de la tête. Ces mouvements peuvent alors être pris en compte pour modifier le contenu de l’écran, l'utilisateur pouvant dès lors véritablement regarder à droite, ou à gauche, afin d'observer son environnement virtuel, amplifiant de facto la sensation d’immersion. Par exemple, dans un jeu de course, alors qu’en 3D stéréoscopique le joueur verra toujours son cockpit et la piste comme s’il regardait droit devant lui, en VR il pourra tourner la tête pour viser la corde d’un virage ou surveiller un adversaire tentant un dépassement. Ceci ne bénéficie bien entendu pleinement qu’aux contenus spécifiquement adaptés, mais peut également, dans une moindre mesure, être exploité avec des contenus prévus pour la 3D stéréoscopique, en effectuant un recadrage pour n’afficher qu’une partie de l’image, puis en déplaçant ce cadrage en fonction des mouvements de l’utilisateur.
Et voilà pour les principes qui régissent tous les casques VR actuellement disponibles ou en développement. Toutefois, si tous les dispositifs reposent sur la même base, tous ne vont pas offrir pour autant la même expérience. Ainsi, on trouve aujourd’hui deux grandes catégories de casques VR : les casques à bas prix, qui n’embarquent aucune électronique. Ils se résument le plus souvent à un simple système optique (en général, deux lentilles) accompagné d’un support permettant d’y fixer un smartphone, qui se chargera de faire office d’écran et de fournir les capteurs de mouvements. Quant au système optique, il est surtout là pour simuler un écran plus éloigné, sans quoi l’œil serait incapable de faire la mise au point sur l'image projetée. En effet, la distance minimale de mise au point d’un œil humain normal est de l’ordre de la vingtaine de centimètres en moyenne. L’exemple emblématique de cette catégorie est le fameux Cardboard de Google, un casque conçu pour pouvoir proposer de la VR à très bas prix : la structure est en carton et Google fournit les plans pour fabriquer soi-même le Cardboard.
L’autre grande catégorie, la plus prometteuse pour le secteur du jeu vidéo, ce sont les casques tout-en-un, qui intègrent le système optique, l’écran, les capteurs de mouvements, et parfois même un système audio, voire une unité complète de traitement. C'est notamment le cas du système Sulon Q annoncé dernièrement par AMD. Toutefois, si l'on reste dans le concert, au moins trois modèles de ce type vont être commercialisés en 2016 : l’Oculus Rift, précurseur de ce marché, le Playstation VR de Sony et le Vive de HTC (en collaboration avec Valve, le célèbre éditeur de Half-Life, Counter Strike, Portal, Left 4 Dead, et créateur du non moins célèbre portail Steam). Comme les choses ont l'air de se dessiner, chacun devrait viser un public différent : au Vive le segment "Premium", avec de grosses exigences en termes d'investissement financier et de place disponible, tandis que l'offre de Sony devrait représenter l'expérience la plus accessible (tout est relatif, évidemment), et que celle d'Oculus VR se positionnera entre ces deux extrêmes.
Finalement, entre le Google Cardboard et le HTC Vive, le marché de la VR devrait donc être très diversifié. Pourtant, quel que soit son positionnement, chaque fabricant va devoir faire face aux mêmes défis technologiques, et nous allons voir qu'ils sont encore loin d’être tous surmontés…