Menu
Créer un contenu
jeuxvideo.com / Dernières actualités des jeux vidéo / News jeux vidéo / News business /

Data Mining : C’est quoi ? Comment ça marche ?

Chargement du lecteur vidéo...
News business Data Mining : C’est quoi ? Comment ça marche ?
,

Vous avez lu que le petit renard Jolly Redd arrivait dans Animal Crossing : New Horizons avant même que Nintendo ne l’annonce officiellement ? C’est tout simplement parce que des petits malins ont su analyser les lignes de code comme les voyants lisent dans le marc de café. Ce phénomène communément appelé ''data mining'', littéralement “exploration de données”, ne perd pas en popularité. Il a ses stars suivies par des milliers de personnes sur les réseaux sociaux, ainsi que ses plateformes communautaires privilégiées où se propagent des informations normalement laissées à la discrétion des concepteurs. Le principe ? Ouvrir les fichiers d’une alpha, d’une démo ou encore d’une application à l’aide de différents programmes pour en afficher les contenus et en divulguer les secrets. C’est de cette façon que des titres comme Sea of Thieves, Genshin Impact ou encore Fortnite ont vu des éléments encore non-annoncés s’éventer sur Internet. Mais est-ce que n’importe quel individu peut s’improviser ''data miner'' sans risque ? En écho au jeu créé par Rare précédemment évoqué, peut-on affilier cette technique à de la piraterie allant à l’encontre des œuvres, et donc des équipes qui les créent ?

72 480 vues

What do you data mine ?

Data Mining : C’est quoi ? Comment ça marche ?

Ils sont connus sous les pseudonymes de Ninji, Senescallo, That1MiningGuy, Antediluviana ou encore Im_a_Fucking_Cereal (sic). Leur activité ? Diffuser sur Twitter, Discord et Reddit leurs trouvailles, à savoir des éléments de jeux populaires qui n’ont pas encore été révélés. Cela va des personnages à venir de Genshin Impact aux prochaines activités dans Animal Crossing : New Horizons, en passant par les futures armes d’Apex Legends. Leur méthode ? L’exploration de données, ou data mining. Le data mining est un terme qui possède plusieurs significations. Dans le monde professionnel, il signifie que des techniques automatisées – telles que des algorithmes – sont exécutées afin de croiser différentes informations qui sont ensuite étudiées. Cela permet au Data Analyst d’afficher des tendances et de dégager des connaissances, une compétence très prisée à l’époque des réseaux sociaux et des jeux-service. Dans la sphère du jeu vidéo, le terme est communément utilisé pour désigner l’analyse d’informations trouvées dans le code d’un soft ou sur un client de test public par une tierce personne.

Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?

Les data miners utilisent de multiples outils pour dénicher dans un titre les listes qui contiennent les modèles, les sons ou encore le chapitrage, dans le but de détecter des renseignements qui n’ont pas encore été divulgués. Lorsqu’ils sont chanceux, ils n’ont pas besoin de creuser trop profondément. En 2014, le patch 5.4 de World of Warcraft annonçait l’extension Warlords of Draenor par l’intermédiaire d’un dossier ajouté au client intitulé Iron Horde. L’add-on Wrath of the Lich King avait également laissé sous-entendre sa venue – plus ou moins volontairement – de la même manière. Lorsque les données ne se trouvent pas dans les fichiers atteignables par voie classique, les fouineurs passent par d’autres chemins, plus scabreux. Il existe des logiciels qui permettent d’explorer le contenu d’une compilation .pak, donnant potentiellement accès à un grand nombre d’informations cachées dans de multiples fichiers.

Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?

La plupart du temps, les ressources sensibles sont cryptées pour des raisons évidentes de confidentialité. Interrogé chez ActuGaming, That1miningguy explique qu’il utilise DXZTPorter et VPK Extractor, lui donnant accès aux modèles ainsi qu’aux images d’Apex Legends. L’utilisateur qui a “data miné” la démo de Resident Evil VII pour en publier son contenu sur Reddit a expliqué que le .pak était protégé mais qu’il s'était servi du logiciel HxD pour ouvrir l'exécutable. Peu importe la méthode utilisée, le mystérieux enquêteur dévoile ses trouvailles acquises via la démo et évente divers secrets grâce aux fichiers dénichés. Il n’en fallait pas plus pour que d’autres membres proposent une liste de chapitres regroupant les événements du jeu en se basant sur les informations trouvées, le tout avec une grande précision. L’analyse du code de la démo a permis de deviner les armes, les ennemis, le scénario et même le contenu des futurs dlc. C’est ce qui est aussi arrivé avec la lecture du fichier .pak de Sea of Thieves, éventant ainsi l’arrivée de multiples éléments. Avec quelques notions de langage de programmation, les bons logiciels, et surtout beaucoup de patience, il devient possible d’interpréter les lignes de code afin d’en ressortir ce qui n’a pas encore été montré. Il faut reconnaître qu’en nommant une animation “kraken_ingestplayer”, il est plutôt aisé de déduire qu’un monstre marin est au programme, et que ce dernier aura la faculté d’avaler le joueur.

Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?

T’es pas qu’Apk !

Data Mining : C’est quoi ? Comment ça marche ?

Dans les faits, n’importe quel individu suffisamment motivé et possédant de bonnes bases en informatique peut tenter d’extraire des renseignements provenant d’un jeu (ou d'une démo, d'une mise à jour, d'un patch) afin d’en percer ses secrets. Il faut cependant garder à l’esprit que les données textuelles trouvées n’engagent que ceux qui croient en elles. Il est effectivement commun de détecter dans ces listes des traces de développements inachevés. Dans notre exemple de Resident Evil VII, nous retrouvons entre autres des bribes d’expériences multijoueur coupées du projet ainsi que le nom d’un personnage connu de la série finalement resté derrière le rideau. Même cas de figure pour Apex Legends avec l’affaire du Smart Pistol repéré dans le code, mais finalement jamais sorti de l’armurerie. Le data mining est donc loin d’être une science exacte. Et c’est tout à fait normal, puisqu’il n’est qu’une interprétation libre d’un langage informatique. Si certains data miners se qualifient eux-mêmes d’archéologues du code, réfutant tout rapprochement de leur pratique avec celle du hacking ou d’ingénierie inverse, les éditeurs ont tendance à les voir d’un œil suspicieux. Du côté du droit, il est commun de penser qu’il n’y aurait rien d’illégal au fait de chercher des informations dissimulées au sein d’un soft. Les utilisateurs qui publient le résultat de leurs recherches trouvent même un écho auprès des sites spécialisés qui s’interdisent pourtant de mettre en avant du hacking classique dans leurs rubriques. Ce serait donc aux développeurs de faire attention à la manière dont ils protègent leur code et nomment leurs fichiers ? “Le fait de révéler une information encore inconnue du public par la simple analyse de données librement accessibles n’est pas en soi illégal” nous explique Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel, contacté le 12 mars 2021. Il continue : “dans le cas du data mining, le problème relève davantage de la manière dont les données ont été obtenues et/ou de la nature de ces données”.

En droit français, les programmes sont protégés par le droit d’auteur. Cela permet notamment aux titulaires des droits d’interdire la décompilation de leurs œuvres logicielles. Par conséquent, lorsque le data mining implique de procéder à une décompilation du logiciel, il devient une pratique illégale, la décompilation constituant un acte de contrefaçon. À cela s’ajoute que le data mining peut également impliquer de contourner d’éventuelles Mesures Techniques de Protection mises en place par l’éditeur pour verrouiller son jeu, ou encore de divulguer des œuvres dont la reproduction est illicite, comme les visuels du jeu ou encore les musiques. Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel.

Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?

Certains éditeurs comme Activision Blizzard prévoient une interdiction contractuelle au data mining dans les paragraphes de leurs licences d’utilisation.Dans ce cas, le data mining constitue également une violation de la licence d’utilisation, et donc une faute contractuelle” confirme Nicolas Bressand. “Il est donc possible de rattacher la pratique du data mining à une diversité de violations d’obligations légales et/ou contractuelles” ajoute-t-il. Par conséquent, cela signifie que la responsabilité des data miners peut, en théorie, être engagée. En pratique, les actions en justice sont rares. Il y a bien eu les pressions de Niantic envers Pokevision, site qui se servait des informations de Pokemon GO afin d’aider à localiser les petits monstres virtuels. Mais en règle générale, les géants se font discrets sur la question du data mining, ils n’ont d’ailleurs pas souhaité répondre à nos questions traitant du sujet. “Les éditeurs ont-ils intérêt à agir contre des data miners ? Je ne le crois pas” avertit Nicolas Bressand. “Dans la majorité des cas, le préjudice subi par l’éditeur paraît extrêmement limité. À titre d’exemple, lorsque le data mining de Red Dead Redemption II a révélé qu’une version PC était en développement, l’éditeur a probablement perdu l’effet d’annonce entourant cette sortie à venir, mais quel était son préjudice réel ?

Si les éditeurs poursuivaient systématiquement en justice les data miners, leur préjudice d’image serait probablement bien supérieur, dans les communautés du jeu vidéo, aux préjudices résultant des leaks. Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel.

Il faut aussi garder à l’esprit que les studios, ravis de bénéficier d’un peu de mise en avant gratuite, peuvent devenir des victimes consentantes de cette pratique. “Je pense que dans l’essentiel des cas, les éditeurs, bien que pouvant sans difficulté caractériser des atteintes à leurs droits, préfèreront probablement ne pas agir contre les data miners. Ce d’autant que la révélation d’informations encore secrètes a souvent pour effet de créer de l’émulation autour du jeu et de susciter l’intérêt des joueurs” reconnaît Nicolas Bressand. Il conclut : “Il en serait peut-être autrement si un data miner parvenait à divulguer une grande quantité d’informations capitales d’un seul coup”.

Data Mining : C’est quoi ? Comment ça marche ?Data Mining : C’est quoi ? Comment ça marche ?

D’utilité publique ?

Data Mining : C’est quoi ? Comment ça marche ?

Certes, cette pêche aux informations tenue par des marins d’eau douce fait surtout parler d’elle lorsque ses représentants remontent à la surface quelques nouvelles importantes – encore tenues secrètes – sur les gros jeux du moment. Mais le data mining ne se résume pas qu’à cette envie de lever le voile sur du contenu à venir. Dans un jeu comme World of Warcraft, il donne accès à des informations extrêmement détaillées sur les éléments de l’univers tels que les zones de farming et les patterns des adversaires. Dans Minecraft, il révèle des petites histoires parfois amusantes, parfois étranges (voire déstabilisantes). En fait, le code d’un jeu fourmille de détails sur la manière dont il a été produit. Comme l’explique le data miner Ehm, “il est fascinant d'avoir un aperçu de ce qui aurait pu être inclus dans un jeu. À l'instar des reportages sur les coulisses d'un film, l'exploration des données d'un soft donne l’impression d’accéder aux coulisses. Les ressources inutilisées racontent souvent, d'une manière ou d'une autre, une histoire sur le développement du titre. Parfois, vous pouvez même trouver un message caché du développeur qui vous renseignera littéralement sur le développement du jeu”.

Tels des chasseurs d’or munis de tamis, les data miners passent le code de nos jeux au peigne fin avec l’excitation de dévoiler un contenu enfoui qui fera peut-être briller les yeux du public. Considérés comme des éléments indispensables par toute une communauté de joueurs, ces enquêteurs 2.0 creusent dans une zone grise globalement désertée par les autorités. De quoi les laisser éprouver le frisson de la piraterie au calme, sans qu’ils n’aient à s’adonner à des actes de hacking trop barbares. Sous le regard circonspect des éditeurs.

Profil de Carnbee,  Jeuxvideo.com
Par Carnbee, Journaliste jeuxvideo.com
MP

COMMENTAIRES

Vous devez être connecté pour poster un commentaire.
_Eloas
_Eloas
MP
le 09 avr. à 21:48

Super Article :hap:

Lire la suite...
Another_player
Another_player
MP
le 07 avr. à 17:10

Bon article en effet. :ok:
Pendant un moment je me suis même cru sur nxi !

Lire la suite...
Commentaire édité 07 avr., 17:11 par Another_player
lefouduvelo
lefouduvelo
MP
le 07 avr. à 07:58

Article interessant , merci Carnbee.

Lire la suite...
CyriIMog
CyriIMog
MP
le 05 avr. à 19:50

Grosse erreur de traduction (et du coup plus largement de compréhension de ce qu'est le data mining) plusieurs fois reprise dans l'article (pour le reste plutôt intéressant au demeurant).

Le Data Mining, ce n'est pas l'exploitation de la donnée, c'est l'exploration de la donnée.

Lire la suite...
NaNahMoussKouri
NaNahMoussKouri
MP
le 05 avr. à 18:49

Bien joué Carnbee! :ok:
Un article intéressant et neutre, ça fait du bien!

Lire la suite...
Pseudo supprimé
le 05 avr. à 17:27

Oh mazette, un article intéressant !

Il était temps :rire:

Lire la suite...
Blitzballs
Blitzballs
MP
le 05 avr. à 16:29

Faut pas généraliser non plus , certaines grosses boites sans scrupules n'hésite pas à traquer et à poursuivre les data-miners , peu importe si leur image en pâtisse.
Je pense par exemple à Pearl Abyss , entreprise billionaire, qui n'a pas hésité une seule seconde a perma-ban IP le célèbre data-miner Bloo pour avoir leak des stats cachés sur des items du jeu Black Desert Online.
Ils s'en tapent de leur "image" , ils sont tellement pété de thune qu'ils savent très bien que l'impact sur leur chiffre d'affaire sera extrêmement minime voir inexistant. :oui:

Lire la suite...
Commentaire édité 05 avr., 16:31 par Blitzballs
Razzial23
Razzial23
MP
le 05 avr. à 15:45

C'est surtout ce qui a Causé l'enorme et longue rupture de CG en ce moment, et qui empêche les VRAIS gamers de pouvoir utiliser ce pour quoi elles sont faites à l'origine, et c'est aussi ce qui risque de provoquer la fin du gaming sur PC si ça dure

Lire la suite...
ValerioFluo
ValerioFluo
MP
le 05 avr. à 15:02

Article intéressant par contre vous manquez de rubriques sur jvc :rire: ça se voit que les articles de fond sont trop peu nombreux pour avoir des rubriques dédiées qui leur conviennent :rire2: ...
Parce que ce n'est pas vraiment une "news business" ça :hap:

Lire la suite...
seeow
seeow
MP
le 05 avr. à 14:34

Data Mining : C’est quoi ?

Ben c'est de la merde.. y'a plus aucune surprise, on sait tout à l'avance.. vraiment je comprends pas.

Lire la suite...
Top commentaires
Van32
Van32
MP
le 05 avr. à 11:26

Le jour où Carnbee quittera jv.com, ce site sera mort et enterré sous ses news putaclic, bons plans et autres sponsorisées ...

Lire la suite...
TBONTUMONTES
TBONTUMONTES
MP
le 05 avr. à 10:49

Excellent article

Lire la suite...
Les jeux attendus
1
Hogwarts Legacy : l'Héritage de Poudlard
2022
2
Diablo II : Resurrected
2021
3
Resident Evil Village
07 mai 2021
4
Mass Effect : Legendary Edition
14 mai 2021
5
Légendes Pokémon : Arceus
1er trimestre 2022