Data Scientist ça vaut toujours le coup ?

cosmochienne
2021-02-15 10:20:17

Après rien ne vous empêche de faire le bullshit job bien payé et chez vous faire de la recherche en ML ou IA ...

Un notebook colab et c'est partie 🚀

chibbimitia
2021-02-15 10:21:58

Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

dabhu00
2021-02-15 10:22:19

N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

cosmochienne
2021-02-15 10:25:32

Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

chibbimitia
2021-02-15 10:32:02

Le 15 février 2021 à 10:25:32 Cosmochienne a écrit :
Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

Pire idée. Sauf si tu vises le top et finir researcher chez un GAFA.

loiconline
2021-02-15 10:40:15

Le 15 février 2021 à 10:13:40 CauchySchwartz a écrit :
D'où sort ce mythe comme quoi ce serait différent ailleurs qu'en France ? De ce que je vois sur Reddit, le côté "nettoyage de DB et utiliser des lib python" du job est en train de se généraliser partout et que même avoir un doctorat ne t'évitera pas automatiquement cette facette du job :(

Ca dépend de la boîte je dirais. Je suis tout à fait d'accord avec toi, mais ce type de job est le plus souvent rattaché à l'étranger à la dénomination de data engineer ou ML engineer, qui nécessitent le plus souvent plus de fortes compétences en info qu'en maths et recrutent sur du bachelor (+quelques années d'exp le plus souvent). A l'étranger, ils ont l'intelligence de séparer ça du "AI scientist", ou "ML/AI researcher", qui nécessite aussi des compétences en info, mais dont la principale tâche est vraiment le développement de nouvelles solutions (très rare que tu te retrouves à clean des bases de données par ex).

Mais souvent comme c'est basé sur le modèle anglo-saxon, ba ce type de job recrute sur doctorat et non pas master car ça n'existe pas vraiment master dans le cadre d'études plutôt orientée technique/recherche.

RaidepileIII
2021-02-15 10:41:41

Le 15 février 2021 à 09:53:08 Geoxor a écrit :
El famoso de plus en plus bouché alors que c'est TOP 1 des métiers en expansion

Métier full sous-data pourrie. Des métiers qui s'appelle Data.Scientist et tu te contentes de faire des stats pourries sur R et Python quoi.

temporaire50
2021-02-15 10:42:14

Le 15 février 2021 à 10:01:25 IbnTachefine2 a écrit :
Il n y a pas de vrai data science en France, la plupart utilisent les modèles développés par les Gafam, c'est pour cela que tout le monde s'y mets donc c'est remplis de charlatans et bien sûr les salaires chutent. Si tu veux faire de la data science avec des bases solides en mathématiques pour se différencier des chimistes et agronomes qui deviennent subitement des DS, il faut partir de France.

Ceci bordel.
On utilise des librairies sans comprendre ce qu'il y a derrière, et là on se sent data scientist professionel :)

loiconline
2021-02-15 10:44:27

Le 15 février 2021 à 10:25:32 Cosmochienne a écrit :
Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

Post Doc pour moi c'est vraiment si t'arrives à chopper un truc dans une grosse équipe et que tu as besoin de grosses publications pour compléter ce que tu n'as pas réussi à avoir lors de ton doctorat (que ce soit pour après go industrie, ou académique). Sans forcement aller vers les GAFAM, il y a pleins de startup à l'étranger (y compris quelques rares en France), qui proposent vraiment de la recherche intéressante, même si selon la culture de l'entreprise, tu échapperas plus ou moins aux tâches ingrates de nettoyage et autres.

CauchySchwartz
2021-02-15 10:46:15

Le 15 février 2021 à 10:21:58 chibbimitia a écrit :
Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

C'est surtout ça que les gens ne comprennent pas.
J'ai limite envie de changer complètement de domaine à cause de ça (je me chauffe sur les DSL et les compilateurs là, j'avais une offre intéressante dans le domaine en fin de master)

dabhu00
2021-02-15 10:47:12

Après calmez vous les "true" data scientist. Developper un algo ultra complexe et impossible à mettre en prod pour gagner 0.01 point d'accuracy, c'est pas du tout ce qui est recherché en entreprise :hap:

MajinBuu93
2021-02-15 10:53:49

Oui, tu trouveras du travail bien payé si tu es bon :ok:

Cetasser53
2021-02-15 10:55:13

J'ai une question.
Je veux faire un Master 1 Maths appliquées et statistiques dans le secteur de la santé, en gros, ça s'apparente à être épidémiologue (je ferai sûrement une remise à niveau en biologie / ue transversale). J'espère pouvoir après travailler dans la nutrition/santé et avoir un poste à l'ANSES (Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail) ou à l'INRA.
Est ce que selon vous, mon projet professionnel tient la route ?
Quel Master 2 devrais-je choisir ?

Merci les kheys.

Edit: je suis en 3ème année de Licence Mathématiques et Applications où j'ai eu 4 UE d'informatique ( Algorithmique 1 et 2 en C++, Base de données (MySQL, PHP, CSS, JavaScript, statistiques et analyse de données ( Python, R, Java avec complexité).

InfectedRAM
2021-02-15 10:56:40

Le 15 février 2021 à 09:55:02 KoukouLaTeley a écrit :
Tu trouveras facilement mais ça maie moins bien qu'au tout début (Mais toujours relativement bien, attends toi à 50k en milieu de carrière)

50k en milieu de carrière :rire:
50k au bout de 3-4 ans plutôt.

QUElouisFERDIN
2021-02-15 10:59:02

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

chibbimitia
2021-02-15 11:00:00

Le 15 février 2021 à 10:46:15 CauchySchwartz a écrit :

Le 15 février 2021 à 10:21:58 chibbimitia a écrit :
Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

C'est surtout ça que les gens ne comprennent pas.
J'ai limite envie de changer complètement de domaine à cause de ça (je me chauffe sur les DSL et les compilateurs là, j'avais une offre intéressante dans le domaine en fin de master)

C'est pour ca que je dis que le domaine le plus intéressant, ca reste du data engineering, ou du data system engineering (le terme commence à apparaitre). Etre calé sur les systèmes distribués, déployer du presto ou autre tech stylée dans une boite et s'assurer que tout ca tourne bien et de manière optimisée, etc.

0nfray
2021-02-15 11:00:06

Le 15 février 2021 à 09:56:14 [Ascension] a écrit :

Le 15 février 2021 à 09:55:20 Cosmochienne a écrit :

Le 15 février 2021 à 09:54:00 [Ascension] a écrit :
Passer par les filières aseptisés des Maths pour etre data scientist :rire:

J'ai toujours été une des plus grosse merde en math depuis le collège , et lors de mon récent stage dans le domaine j'ai tout réussi meme l'évaluation de fin de stage :rire:

Ouvre un bouquin de data science c'est full math ...

C'est full logique , c'est pas purement mathématique

ne me dis pas d'ouvrir un bouquin j'ai carrément fait un stage dans le domaine :pf:

Eh non pas toujours Jean-Médiocre, cf ma copine agrégé de maths et datascientiste, qui m'explique que les données donnent souvent des résultats qui sont totalement contre-intuitifs...
Et aussi qu'énormément de travaux dans les datasciences sont complètements biaisé par des ahuris comme toi qui ne comprennent pas ce qu'ils manipulent.

Pascalopomme2
2021-02-15 11:00:43

Informatique ≠ math

dabhu00
2021-02-15 11:28:46

Le 15 février 2021 à 10:59:02 QUElouisFERDIN a écrit :

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

Bordel Dataiku, ce truc du démon qui fait perdre du temps plus qu'autre chose :malade:

RisiLego
2022-04-09 01:48:56

Le 15 février 2021 à 11:28:46 :

Le 15 février 2021 à 10:59:02 QUElouisFERDIN a écrit :

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

Bordel Dataiku, ce truc du démon qui fait perdre du temps plus qu'autre chose :malade:

Dataiku :bave:
Faire toutes les manips chiantes de pandas super facilement :bave:
Les graphs ultra faciles à générer :bave:
Avoir toute la puissance de Spark sous le capot :bave:
Le no code :bave:

Infos
Gestion du forum

contact@geevey.com

API disponible. Utilisez le paramètre "api" en GET, peu importe le contenu, sur une page du site.

Notes

    Partenaire: JVFlux
    Ce site n'est pas associé à Jeuxvideo.com ou Webedia. Nous utilisons seulement des archives publiques.
    Il est inutile de me spammer par e-mail pour supprimer un topic. Au contraire, en conséquence, je mettrais votre topic dans le bloc ci-dessous.
Non-assumage
    Personne n'a pas assumé de topic pour le moment.