CONNEXION
  • RetourJeux
    • Tests
    • Soluces
    • Previews
    • Sorties
    • Hit Parade
    • Les + attendus
    • Tous les Jeux
  • RetourActu
    • Culture Geek
    • Astuces
    • Réalité Virtuelle
    • Rétrogaming
    • Toutes les actus
  • RetourHigh-Tech
    • Actus JVTECH
    • Bons plans
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTECH
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch
    • Xbox Series
    • Overwatch 2
    • FUT 23
    • League of Legends
    • Genshin Impact
    • Tous les Forums
  • PC
  • PS5
  • Xbox Series
  • PS4
  • One
  • Switch
  • Wii U
  • iOS
  • Android
  • MMO
  • RPG
  • FPS
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Etoile Abonnement RSS

Sujet : R/ Data

DébutPage précedente
1
Page suivantePage suivante
Vegetox3 Vegetox3
MP
Niveau 5
29 mai 2020 à 05:11:42

Bonjour, l'année pro je rentre en filière Data Sciences, et donc évidemment cet été je vais bosser python car je n'en avait jamais fait avant, seulement du C et du Java.
Mais qu'en est il du R ? Je sais que c'est basé sur du python axé sur les données, mais selon c'est vous c'est complexe à apprendre/maitriser ?

godrik godrik
MP
Niveau 22
29 mai 2020 à 07:28:23

mmm, Si tu as fais du C et du Java, je ne sais pas si apprendre python et R va vraiment t'apporter quelquechose de plus. Ce sont des langages relativement simple a apprendre. Ils vont te faire t'arracher les cheveux pendant une semaine, mais tu sais deja tout ce qu'il ya a savoir probablement.

Tu es au point en Maths? Si tu ne l'es pas, bosse les maths, ca te sera beaucoup plus utile!

Tu es au point en algo? Si tu ne l'es pas, bosse l'algo, ca te sera beaucoup plus utile!

Parceque vraiment il n'y a que trois problemes de fond en Data Science:
1) Comment est ce que l'on modelise le probleme et construit les methodes qui fixent les parametres du modele? Et ca, c'est des proba, des stats, et des methodes numeriques (dont du calcul, des EDPs, et de l'algebre lineaire)
2) Comment est ce que l'on construit un algorithm qui permet de fixer les parametres et qui permet de construire le modele a partir de teraoctet/petaoctet de donnee? Et ca c'est des structures de donnees, de l'algo, et du calcul parallele theorique.
3) Comment est ce qu'on programme tout ca sur les machines moderne pour avoir une application qui soit viable dans le temps? Et c'est du systeme et du genie logiciel. Si tu as fait du C et du Java, ca tu en as deja probablement fait un peu.

Vegetox3 Vegetox3
MP
Niveau 5
29 mai 2020 à 08:40:27

En maths, je pense pas que sa va trop de poser de problèmes je sais à quoi m’attendre en probas et stats. Pour la programmation aussi, d’après les dires, c’est pas ce qui va le plus déranger.
Par contre l’algo quand j’en avais fait c’était une horreur, j’ai vraiment eu du mal à bosser cette unité, c’est l’unité d’info qui pose le plus problème.
Tu aurai des conseils pour la travailler ?
Merci pour tes réponses claires.

blackapplex blackapplex
MP
Niveau 10
29 mai 2020 à 13:21:46

R est pas beaucoup plus complexe que Python à maitriser. L'avantage de R et Python c'est que ce sont des langages plus libres et simples que C ou Java.
Pour moi ce qui aide vraiment à avancer en algo, c'est la pratique et avoir toujours des problèmes différents en face, et ne pas rester dans une zone de confort, essayer de comprendre le code d'autres personnes qui font les choses différemment, parfois mieux, parfois moins bien etc..

Un des projets étudiant que j'avais à faire était la détection de visage, ce qui est embêtant si tu pars sur ça direct c'est que ça te feras pas approfondir la théorie de la datascience qui comme godrik l'a dit est un élément assez important, mais ça permet de pratiquer. Sinon tu prends un cours de datascience en R sur internet et tu essayes de comprendre le cours, ça me semble être mieux (t'as des cours d'Hugo Larochelle sur youtube, ils utilisent pas R je crois, mais du coup rien ne t'empêche d'utiliser R pour pratiquer ce que le cours traite). Si le cours te parle d'ACP, t'essayes de refaire une ACP en R etc..

L'algorithmie classique sert pas forcément beaucoup en datascience. On te demande pas vraiment d'enchainer des if/else et des boucles ni même de faire une belle programmation objet ou de suivre un design pattern MVC, on te demande de comprendre les maths du modèle, d'obtenir des données dans un format pratique à traiter, et de choisir le meilleur modèle. On te demandera aussi la fiabilité de ton modèle, son temps d'exécution, son temps d'entrainement, sa robustesse face à de nouvelles données etc..

godrik godrik
MP
Niveau 22
31 mai 2020 à 07:16:17

@blackapplex,
Je ne suis pas d'accord que l'algo classique ne'st pas utile en data science. Ca depend de ce que tu fais en data science. Certainement, tu pourra etre l'ingenieur qui pond le modele et fait des tests a l'echelle d'une machine.
Mais tu peux aussi etre l'ingenieur a qui on dit "Il y a 2 petaoctet de donnee dans le data lake et on rajoute 50 gigaoctet tous les jours et on a besoin de reconstruire le modele toute les nuits". Et la il y a beaucoup de question d'algo standard qui vont apparaitre.
Ou encore celui qui pond le code d'extraction de feature qui ensuite est pousse dans un modele de learning plus classique. Et la encore, des connaissances generales en algo sont utile.

En particulier, en gros 50% des etudiants qui sortent du MS en DS a mon universite finissent en ingenieur de developpement ou ingenieur de production en support de l'equipe d'ingenieur/scientifique qui sont l'analyse de donnee.

Message édité le 31 mai 2020 à 07:19:37 par godrik
blackapplex blackapplex
MP
Niveau 10
01 juin 2020 à 14:31:30

En fait je me suis peut-être mal exprimé mais je parlais surtout des concepts de programmation avancée.
Connaitre les concepts d'algorithmie avancée (gestion de graphes, multiprocessing etc..) peut être utile en datascience, mais connaitre l'encapsulation, l'architecture logicielle MVC ou ce qu'est une lvalue n'a pas forcément d'usage pour un datascientist.

S'il faut traiter 2 petaoctets de données + 50go/jour, je demande à un datascientist de me faire un modèle qui peut faire un entrainement de base sur 2 petaoctets et un entrainement incrémental de 50Go/jour; et derrière je demande à un devops de faire en sorte que ces données puissent être accessible sur un serveur qui puisse faire tourner le code du datascientist.
Si on demande à une personne de tout faire, j'imagine qu'on parle de dataops, et c'est très bien s'il sait tout faire efficacement mais quand les jobs sont complexes il vaut mieux avoir 2 personnes spécialisées qui font en 2 jours leur tâche et mettent 2 jours à mettre en commun, qu'avoir un datascientist qui met 2 jours à faire le modèle et 2 semaines à gérer tous les autres aspects réseau/hardware/software/prod parce que même s'il peut savoir faire c'est pas son coeur de métier et il devra gérer des problèmes inattendus

Ils réussissent vraiment à maitriser tous les aspects dev/prod en sortie de ton université, ou ils se spécialisent avant?

Message édité le 01 juin 2020 à 14:33:01 par blackapplex
godrik godrik
MP
Niveau 22
01 juin 2020 à 16:58:24

Ce que je veux dire, c'est que dans beaucoup de cas, tous ces gens la peuvent sortir de la meme formation.

DébutPage précedente
1
Page suivantePage suivante
Répondre
Prévisu
?
Victime de harcèlement en ligne : comment réagir ?
Infos 0 connecté(s)

Gestion du forum

Modérateurs : godrik, LGV
Contacter les modérateurs - Règles du forum

Sujets à ne pas manquer

La vidéo du moment