CONNEXION
  • RetourJeux
    • Sorties
    • Hit Parade
    • Les + populaires
    • Les + attendus
    • Soluces
    • Tous les Jeux
    • Gaming
  • RetourActu Gaming
    • News
    • Astuces
    • Tests
    • Previews
    • Toute l'actu gaming
  • RetourBons plans
    • Bons plans
    • Bons plans Smartphone
    • Bons plans Hardware
    • Bons plans Image et Son
    • Bons plans Amazon
    • Bons plans Cdiscount
    • Bons plans Decathlon
    • Bons plans Fnac
    • Tous les Bons plans
  • RetourJVTech
    • Actus High-Tech
    • Intelligence Artificielle
    • Smartphones
    • Mobilité urbaine
    • Hardware
    • Image et son
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTech
  • RetourCulture
    • Actus Culture
    • Culture
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch 2
    • Xbox Series
    • Switch
    • Pokemon pocket
    • FC 25 Ultimate Team
    • League of Legends
    • Tous les Forums
  • PC
  • PS5
  • Xbox Series
  • Switch 2
  • PS4
  • One
  • Switch
  • iOS
  • Android
  • MMO
  • RPG
  • FPS
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Liste des sujets

Comment progresser en data science ?

ifsbdlv
ifsbdlv
Niveau 31
16 avril 2022 à 00:46:26

Bonsoir,

Je fais ce topic car je suis un peu perdu sur ce que je dois faire pour progresser en ML/DL. Il y a tellement de choses à faire que je ne fais plus rien malheureusement.

Je suis en école d'ingé post-prépa donc j'ai déjà les bases en maths.

J'ai aussi suivi un cours d'intro au ML (regression linéaire/logistique, regularisation, k means, kNN, SVM, reduction de dimension, kernels, arbres de décision) et de DL (MLP, fonctions d'activations, retro/back propagation, CNN, RNN, GAN).

Soit je commence à faire des projets et à apprendre sur le tas, soit j'approfondis le sujet en lisant les livres Deep Learning de I.Goodfellow et Introduction to Statistical Learning de T.Hastie pour approfondir les connaissances.

Après je trouve que ces livres sont "lourds" avec 700 pages par livre, j'ai du mal à les digérer :(

Comment feriez-vous à ma place ?

Faire des projets sur Python en ayant des connaissances de bases sur le ML/DL ou approfondir le sujet et une fois maitrisé, passer à la pratique ?

the_ff3_fan
the_ff3_fan
Niveau 40
16 avril 2022 à 02:15:54

Pour maitriser les trucs compliqués faut maitriser sur le bout des doigts les trucs simples :hap:

Fais quelques projets et une fois que tu te sentiras à l'aise avec les notions tu pourras en explorer de nouvelles.

Aussi, qu'est-ce que tu veux fais après ?

De la recherche en DL avec pas mal de théorie ? Dans ce cas , il vaut peut-être mieux se concentrer à fond sur la théorie, ptet faire un ou deux projets juste histoire de voir à quoi ressemble la pratique.

Bosser chez des boites spécialisées en ML qui font des trucs un peu originaux (Genre DeepMind) ? Dans ce cas choisis la boite/le domaine qui t'intéresse et essaie d'approfondir à fond l'état de l'art. Par contre faudra être au point sur la programmation aussi.

Ou juste utiliser le ML comme un outil pour un job de data scientist à peu près partout ? Dans ce cas t'as probablement déjà vu tout ce qu'il te fallait en théorie, il te reste juste a poncer l'aspect pratique pour être efficace, et te rendre compte des écueils auxquels tu ne penses pas quand tu fais de la théorie, mais qui t'embêteront si t'essaies de faire un projet.

ifsbdlv
ifsbdlv
Niveau 31
16 avril 2022 à 21:49:58

Merci pour ta réponse c'est très clair.

Je ne suis pas à un stade où je cherche à me spécialiser en particulier.

Je cherche surtout à obtenir de bons stages dans des entreprises où je vais vraiment apprendre des choses. Je ne comptais pas aller jusqu'à une thèse, mais être assez bon pour obtenir des bons postes en sortie et faire des projets ambitieux de mon côté.

Par ailleurs j'aimerai aussi regarder du côté de la finance de marché. Tu penses qu'il y a plus trop d'avenir pour les Quant ?

J'hésite entre les deux mais j'aimerais me focus dans l'un et devenir bon plutôt que travailler les deux de manière moins efficace

Pseudo supprimé
Pseudo supprimé 16 avril 2022 à 22:46:23

C’est fatiguant de voir tous les jeunes vouloir faire la même chose, et en même temps, c’est représentatif d’un système scolaire qui les guide vers ces métiers.
Tu veux faire un métier intéressant en data science mais tu veux pas faire de thèse (?) c’est un peu contradictoire aujourd’hui, et ça risque de le devenir de plus en plus.
« Quant » ça veut rien dire, tu as des quants qui font presque pas de statistiques et d’autres qui en font beaucoup.
Il y a différent type de machine learning, ce qu’on appelle « statistical machine learning » qui a un fondement plus mathématiques, qui consiste à avoir des garanties théoriques avec des borne minimax par exemple, puis tu as le machine learning plus pratique qui est , en fait, plus un mélange entre math et info.
Mais avant de te lancer dans l’un des deux, tu dois d’abord suivre un cours de statistiques de niveau M1, parce que voir des gens qui font de la data qui ne maîtrisent pas les bases de statistiques de M1, c’est une aberration et c’est la conséquence de la démocratisation du métier à tout le monde via des pseudo cours sur internet.
Ensuite, tu pourras aller chercher des cours en pdf sur internet, je te conseil des cours d’Orsay ( plus généralement Saclay) ou Sorbonne qui sont, de loin, les 2 meilleurs facs sur le sujet.
Ensuite, comme la concurrence commence à être rude dans ce milieu, la plupart des jobs que tu auras avec un M2 lambda sera un job, comme j’aime les appeler, job «bâtard» qui consiste à faire du SQL, à nettoyer des donnés, faire du machine learning représentera à peu près 5 à 10% de ton job, et ça tend à diminuer avec l’automatisation des outils. Ne parlons même pas de la modélisation qui sera inexistante, tu essayeras juste plusieurs algorithmes jusqu’à choisir celui qui marche le mieux, whouaou ... Super modélisation.
Si tu veux un meilleur poste : tu dois viser un gros M2 style X ou MVA, et encore là, j’en connais beaucoup, et franchement, des bullshit jobs, il y en a à la pelle, mais j’ai envie de dire ... Ce qui intéressent surtout les jeunes c’est l’argent, mais après 2/3 ans, ils se rendent compte qu’ils gagnent à peu près 200/300 euros de plus seulement avec les impôts et regrettent parfois leur choix, donc attention à tes intentions.

ifsbdlv
ifsbdlv
Niveau 31
16 avril 2022 à 23:00:14

Le 16 avril 2022 à 22:46:23 :
C’est fatiguant de voir tous les jeunes vouloir faire la même chose, et en même temps, c’est représentatif d’un système scolaire qui les guide vers ces métiers.
Tu veux faire un métier intéressant en data science mais tu veux pas faire de thèse (?) c’est un peu contradictoire aujourd’hui, et ça risque de le devenir de plus en plus.
« Quant » ça veut rien dire, tu as des quants qui font presque pas de statistiques et d’autres qui en font beaucoup.
Il y a différent type de machine learning, ce qu’on appelle « statistical machine learning » qui a un fondement plus mathématiques, qui consiste à avoir des garanties théoriques avec des borne minimax par exemple, puis tu as le machine learning plus pratique qui est , en fait, plus un mélange entre math et info.
Mais avant de te lancer dans l’un des deux, tu dois d’abord suivre un cours de statistiques de niveau M1, parce que voir des gens qui font de la data qui ne maîtrisent pas les bases de statistiques de M1, c’est une aberration et c’est la conséquence de la démocratisation du métier à tout le monde via des pseudo cours sur internet.
Ensuite, tu pourras aller chercher des cours en pdf sur internet, je te conseil des cours d’Orsay ( plus généralement Saclay) ou Sorbonne qui sont, de loin, les 2 meilleurs facs sur le sujet.
Ensuite, comme la concurrence commence à être rude dans ce milieu, la plupart des jobs que tu auras avec un M2 lambda sera un job, comme j’aime les appeler, job «bâtard» qui consiste à faire du SQL, à nettoyer des donnés, faire du machine learning représentera à peu près 5 à 10% de ton job, et ça tend à diminuer avec l’automatisation des outils. Ne parlons même pas de la modélisation qui sera inexistante, tu essayeras juste plusieurs algorithmes jusqu’à choisir celui qui marche le mieux, whouaou ... Super modélisation.
Si tu veux un meilleur poste : tu dois viser un gros M2 style X ou MVA, et encore là, j’en connais beaucoup, et franchement, des bullshit jobs, il y en a à la pelle, mais j’ai envie de dire ... Ce qui intéressent surtout les jeunes c’est l’argent, mais après 2/3 ans, ils se rendent compte qu’ils gagnent à peu près 200/300 euros de plus seulement avec les impôts et regrettent parfois leur choix, donc attention à tes intentions.

Je comprends tout à fait ta remarque et il est vrai que j'ai un peu suivi la "mode".

Pour placer le contexte, je suis à CS et j'ai toujours été un prolo donc évidemment c'est pourquoi j'essaie de me tourner vers des métiers rémunerateurs.

La thèse ne me déplairait pas mais avec la 5/2 je finirai mes études à 27-28 ans, ce qui est trop difficile pour moi d'autant plus que je compte rester en Europe, le PhD n'est pas aussi "essentiel" qu'au USA.

Mais je sais que pour avoir des bons postes, il faut être bon c'est pour ça que j'essaie d'optimiser la voie qui en fin de M2 me permettra de faire quelque chose d'intéressant et bien payé à la fois. Avec mon dossier ça sera quasi impossible d'aller au MVA, mais je tenterai le M2A, ou le M2 de l'X.

Selon toi si on ne fait pas de thèse, qu'est-ce que tu me donnerai comme conseil pour arriver à concilier à la fois un poste intéressant et assez rémunérateur ?

the_ff3_fan
the_ff3_fan
Niveau 40
17 avril 2022 à 17:15:50

Si tu vas en finance ou dans une gafam t'es pas a 200/300 euros de plus hein :hap:

Mais sinon je trouve que t'as raison sur le reste, le job de data scientist classique c'est honnetement un peu chiant mais ca paie bien, a toi de voir si ça te va comme job :hap:

Si tu veux faire des trucs intéressants tu peux pas vraiment echapper a faire de la théorie poussée jpense

Milliounaire3
Milliounaire3
Niveau 41
18 avril 2022 à 01:42:04

Je te recommande Kaagle pour progresser en DataScience j'pense que c'est la seule chose puis ensuite de lire (et relire encore) des documentations... Et ça devra le faire si tu vises DataScientist (si tu veux plus haut genre Research Scientist il te faut des connaissances théoriques essentiels (et on parle pas d'un gradient descent)

Bonne continuation

ifsbdlv
ifsbdlv
Niveau 31
21 avril 2022 à 22:48:28

Merci

Je comptais déjà acquérir toutes les bases importantes (probas M1, stats L3, séries temporelles) puis passer du ML au DL au RL en faisant des projets à côté pour me familiariser avec les librairies Python

Sous forums
  • Histoire
  • Philosophie
  • Cours et Devoirs
  • Politique
  • Environnement & Nature
  • Métiers & Orientation