Je suis data scientist, des questions ?
NomadeCostaRica
2021-08-10 00:53:25
Le 10 août 2021 à 00:47:36 :
[00:34:14] <NomadeCostaRica>
Tu sais faire un algorithme génétique ?
Oui, j'en ai fait lors de mon semestre au Canada.
C'est pas du machine learning c'est plutôt de la recherche opérationnelle les algorithmes génétiques (et tous ces algorithmes qualifiés de méta-heuristiques comme les algorithmes à pas de fourmis).
Si mon algorithme marche pas, ça peut être dû à quoi ? J'essaie d'entraîner un réseau de neurones avec un algorithme génétique, mais même après plusieurs centaines de générations, il est toujours aussi nul
GalaxyA71
2021-08-10 00:53:54
[00:47:48] <Jugram-->
Data scientist chez Axa t'en pense quoi ?
Stressant mais en se débrouillant bien doit y avoir moyen de se faire des roupettes selon le sujet.
cayleyhamilton
2021-08-10 00:55:57
Le 10 août 2021 à 00:53:05 GalaxyA71 a écrit :
[00:45:52] <cayleyhamilton>
Le 10 août 2021 à 00:41:36 :
[00:31:34] <2-sur-10>
Ton salaire ? Ta formation ? Tu penses qu'on peut obtenir un stage/CDD avec un master en physique quantique ?
Salaire que dalle je suis sur la fin de mon alternance (oui le titre est putaclique). Mais c'est du 3k€ brut minimum en début de carrière et ça monte très vite, je connais plusieurs data scientist qui ont quelques années d'expérience et ils sont à 100k brute par an.
Possible avec ton Master mais seulement si tu t'es fait la main sur les algos de machine learning.
Franchement j'ai un "gros" réseau dans la data science, que ce soit en start-up, en SSII ou en entreprise du cac40 et faut pas rêver non plus. à part si quelques années pour toi c'est 10 ans (donc imaginons tu commences à travailler à 23, ouais à 30ans+ tu peux espérer 100k brut variable compris etc.) mais sinon ça monte pas si vite que ça à part si tu t'expat
Je connais trois data scientist de 5 ans d'expérience et deux sont en gros à 100k. L'autre un peu moins.
Ça dépend je pense aussi de ce que tu entends par data scientist et de la formation, tous ceux que je connais sortent des diplômes un peu hypés de bonnes écoles d'ingénieur publiques.
Je parle de mecs qui sortent de Central Supelec, ENSTA ParisTech, donc oui
tu généralises ton cas sur 2-3 valeurs aberrantes, pas très scientifiques comme approche
alors que sur Linkedin tu peux direct te faire une idée du salaire moyen, même si c'est pas parfait
GalaxyA71
2021-08-10 00:57:32
[00:53:01] <Tagomaphyte>
D'après ce que j'ai entendu il ne faut pas de grandes connaissances en mathématiques (à part si ça fait du ML très poussé notamment en recherche).
A ce que j'ai entendu si tu as des bases en algèbre linéaire c'est bon.
Alors vraiment mais vraiment pas. C'est ce qui fait la différence entre un bon data scientist et un arnaqueur c'est les maths.
Exemple mais là j'ai lissé des séries temporelles avec des ondelettes. Les ondelettes c'est de l'analyse hilbertienne et si tu sais pas ce que tu fais c'est très difficile d'utiliser le truc correctement (estimer la variance du bruit, savoir quelle ondelette choisir selon les moments nuls que tu veux, bref jargon de matheux).
Après concernant les algorithmes de ML faut un minimum de connaissances en optimisation pour comprendre comment ça tourne et faire de bonnes architectures (de réseaux de neurones par exemple).
Donc au final, pour moi un mec qui est data scientist mais a pas fait de maths va produire des trucs consommateurs en calculs pour que dalle, qu'il aura galéré à trouver en faisant des essais et surtout sur tout ce qui est nettoyage des données il sera mauvais.
Ça n'est que mon avis.
GalaxyA71
2021-08-10 00:58:37
[00:53:25] <NomadeCostaRica>
Le 10 août 2021 à 00:47:36 :
[00:34:14] <NomadeCostaRica>
Tu sais faire un algorithme génétique ?
Oui, j'en ai fait lors de mon semestre au Canada.
C'est pas du machine learning c'est plutôt de la recherche opérationnelle les algorithmes génétiques (et tous ces algorithmes qualifiés de méta-heuristiques comme les algorithmes à pas de fourmis).
Si mon algorithme marche pas, ça peut être dû à quoi ? J'essaie d'entraîner un réseau de neurones avec un algorithme génétique, mais même après plusieurs centaines de générations, il est toujours aussi nul
Qu'est-ce que tu entends par entraîner un réseau de neurones avec un algorithme génétique ?
Pour la phase d'optimisation tu utilises un algorithme génétique au lieu de faire une rétro-propagation du gradient tu veux dire ?
GalaxyA71
2021-08-10 01:00:01
[00:55:57] <cayleyhamilton>
Le 10 août 2021 à 00:53:05 GalaxyA71 a écrit :
[00:45:52] <cayleyhamilton>
Le 10 août 2021 à 00:41:36 :
[00:31:34] <2-sur-10>
Ton salaire ? Ta formation ? Tu penses qu'on peut obtenir un stage/CDD avec un master en physique quantique ?
Salaire que dalle je suis sur la fin de mon alternance (oui le titre est putaclique). Mais c'est du 3k€ brut minimum en début de carrière et ça monte très vite, je connais plusieurs data scientist qui ont quelques années d'expérience et ils sont à 100k brute par an.
Possible avec ton Master mais seulement si tu t'es fait la main sur les algos de machine learning.
Franchement j'ai un "gros" réseau dans la data science, que ce soit en start-up, en SSII ou en entreprise du cac40 et faut pas rêver non plus. à part si quelques années pour toi c'est 10 ans (donc imaginons tu commences à travailler à 23, ouais à 30ans+ tu peux espérer 100k brut variable compris etc.) mais sinon ça monte pas si vite que ça à part si tu t'expat
Je connais trois data scientist de 5 ans d'expérience et deux sont en gros à 100k. L'autre un peu moins.
Ça dépend je pense aussi de ce que tu entends par data scientist et de la formation, tous ceux que je connais sortent des diplômes un peu hypés de bonnes écoles d'ingénieur publiques.
Je parle de mecs qui sortent de Central Supelec, ENSTA ParisTech, donc oui
tu généralises ton cas sur 2-3 valeurs aberrantes, pas très scientifiques comme approche
alors que sur Linkedin tu peux direct te faire une idée du salaire moyen, même si c'est pas parfait
Bah ouais je t'avoue que je suis un peu étonné de ce que tu me dis là.
NomadeCostaRica
2021-08-10 01:00:06
Le 10 août 2021 à 00:58:37 :
[00:53:25] <NomadeCostaRica>
Le 10 août 2021 à 00:47:36 :
[00:34:14] <NomadeCostaRica>
Tu sais faire un algorithme génétique ?
Oui, j'en ai fait lors de mon semestre au Canada.
C'est pas du machine learning c'est plutôt de la recherche opérationnelle les algorithmes génétiques (et tous ces algorithmes qualifiés de méta-heuristiques comme les algorithmes à pas de fourmis).
Si mon algorithme marche pas, ça peut être dû à quoi ? J'essaie d'entraîner un réseau de neurones avec un algorithme génétique, mais même après plusieurs centaines de générations, il est toujours aussi nul
Qu'est-ce que tu entends par entraîner un réseau de neurones avec un algorithme génétique ?
Pour la phase d'optimisation tu utilises un algorithme génétique au lieu de faire une rétro-propagation du gradient tu veux dire ?
Oui. Je peux pas faire de rétro-propagation du gradient parce-que j'ai pas de résultat attendu
GalaxyA71
2021-08-10 01:03:36
[01:00:06] <NomadeCostaRica>
Le 10 août 2021 à 00:58:37 :
[00:53:25] <NomadeCostaRica>
Le 10 août 2021 à 00:47:36 :
[00:34:14] <NomadeCostaRica>
Tu sais faire un algorithme génétique ?
Oui, j'en ai fait lors de mon semestre au Canada.
C'est pas du machine learning c'est plutôt de la recherche opérationnelle les algorithmes génétiques (et tous ces algorithmes qualifiés de méta-heuristiques comme les algorithmes à pas de fourmis).
Si mon algorithme marche pas, ça peut être dû à quoi ? J'essaie d'entraîner un réseau de neurones avec un algorithme génétique, mais même après plusieurs centaines de générations, il est toujours aussi nul
Qu'est-ce que tu entends par entraîner un réseau de neurones avec un algorithme génétique ?
Pour la phase d'optimisation tu utilises un algorithme génétique au lieu de faire une rétro-propagation du gradient tu veux dire ?
Oui. Je peux pas faire de rétro-propagation du gradient parce-que j'ai pas de résultat attendu
Suis pas certain de comprendre le principe mais de ce que je sais des algorithmes génétiques, peut-être qu'il faut que tu continues l'analyse des paramètres pour éviter de tomber dans un minimum local.
J'avais codé des algorithmes génétiques en C++ pour faire de la recherche opérationnelle et ce que j'en retiens c'est que c'est cool pour trouver un minimum pertinent mais c'est rare de tomber sur le minimum global (si tant est qu'il existe) et qu'il faut parfois pas mal d'itérations pour sortir d'un minimum local si ton paramètre qui jauge l'exploration est trop faible.
GalaxyA71
2021-08-10 01:09:36
[01:00:06] <NomadeCostaRica>
Le 10 août 2021 à 00:58:37 :
[00:53:25] <NomadeCostaRica>
Le 10 août 2021 à 00:47:36 :
[00:34:14] <NomadeCostaRica>
Tu sais faire un algorithme génétique ?
Oui, j'en ai fait lors de mon semestre au Canada.
C'est pas du machine learning c'est plutôt de la recherche opérationnelle les algorithmes génétiques (et tous ces algorithmes qualifiés de méta-heuristiques comme les algorithmes à pas de fourmis).
Si mon algorithme marche pas, ça peut être dû à quoi ? J'essaie d'entraîner un réseau de neurones avec un algorithme génétique, mais même après plusieurs centaines de générations, il est toujours aussi nul
Qu'est-ce que tu entends par entraîner un réseau de neurones avec un algorithme génétique ?
Pour la phase d'optimisation tu utilises un algorithme génétique au lieu de faire une rétro-propagation du gradient tu veux dire ?
Oui. Je peux pas faire de rétro-propagation du gradient parce-que j'ai pas de résultat attendu
Suis pas certain de comprendre le principe mais de ce que je sais des algorithmes génétiques, peut-être qu'il faut que tu continues l'analyse des paramètres pour éviter de tomber dans un minimum local.
J'avais codé des algorithmes génétiques en C++ pour faire de la recherche opérationnelle et ce que j'en retiens c'est que c'est cool pour trouver un minimum pertinent mais c'est rare de tomber sur le minimum global (si tant est qu'il existe) et qu'il faut parfois pas mal d'itérations pour sortir d'un minimum local si ton paramètre qui jauge l'exploration est trop faible.
EDIT : sinon peut-être que tu donnes des features trop mauvaises pour détecter ce qui te convient au réseau. C'est difficile parfois de trouver de la bonne donnée et de la présenter au réseau sous la bonne forme pour qu'il se tape le moins de travail possible. Et n'hésite pas à monitorer les métriques que tu utilises avec tensorflow et faire trois jeux : entraînement, validation et test pour éviter de sur-entrainer (ou l'inverse mais bon c'est plus rare).
Oslo1994
2021-08-10 01:09:44
Quelle école ? Pas trop envie de suicide ?
Que penses-tu de la médecine ?
GalaxyA71
2021-08-10 01:14:26
[01:09:44] <Oslo1994>
Quelle école ? Pas trop envie de suicide ?
Que penses-tu de la médecine ?
Je dirai pas les écoles, je crois qu'il existe qu'un ou deux doubles diplômes de data science en France et c'est des petites promos donc on me retrouverait facilement.
Non j'adore ce que je fais. J'ai un grand respect pour les médecins, les études de médecine c'est énormément de sacrifices. Mais je trouve que bonne école d'ingénieur > médecine niveau évolution professionnelle. Bon après y'a les bons et mauvais côtés, en médecine t'as le contact patientèle, mais t'as aussi l'ingratitude qui va avec (et qui va pas en s'améliorant je pense).
Je pense que j'essayerai de faire de la data science appliquée à la médecine à un moment dans ma vie, à voir.
TechnoForce3
2021-08-10 01:18:32
[01:14:26] <GalaxyA71>
[01:09:44] <Oslo1994>
Quelle école ? Pas trop envie de suicide ?
Que penses-tu de la médecine ?
Je dirai pas les écoles, je crois qu'il existe qu'un ou deux doubles diplômes de data science en France et c'est des petites promos donc on me retrouverait facilement.
Non j'adore ce que je fais. J'ai un grand respect pour les médecins, les études de médecine c'est énormément de sacrifices. Mais je trouve que bonne école d'ingénieur > médecine niveau évolution professionnelle. Bon après y'a les bons et mauvais côtés, en médecine t'as le contact patientèle, mais t'as aussi l'ingratitude qui va avec (et qui va pas en s'améliorant je pense).
Je pense que j'essayerai de faire de la data science appliquée à la médecine à un moment dans ma vie, à voir.
Siemens finance pas mal de thèses
CouilleVerbale
2021-08-10 01:21:10
Le 10 août 2021 à 00:57:32 :
[00:53:01] <Tagomaphyte>
D'après ce que j'ai entendu il ne faut pas de grandes connaissances en mathématiques (à part si ça fait du ML très poussé notamment en recherche).
A ce que j'ai entendu si tu as des bases en algèbre linéaire c'est bon.
Alors vraiment mais vraiment pas. C'est ce qui fait la différence entre un bon data scientist et un arnaqueur c'est les maths.
Exemple mais là j'ai lissé des séries temporelles avec des ondelettes. Les ondelettes c'est de l'analyse hilbertienne et si tu sais pas ce que tu fais c'est très difficile d'utiliser le truc correctement (estimer la variance du bruit, savoir quelle ondelette choisir selon les moments nuls que tu veux, bref jargon de matheux).
Après concernant les algorithmes de ML faut un minimum de connaissances en optimisation pour comprendre comment ça tourne et faire de bonnes architectures (de réseaux de neurones par exemple).
Donc au final, pour moi un mec qui est data scientist mais a pas fait de maths va produire des trucs consommateurs en calculs pour que dalle, qu'il aura galéré à trouver en faisant des essais et surtout sur tout ce qui est nettoyage des données il sera mauvais.
Ça n'est que mon avis.
On est d’accord sur le fait que les devs n’ont pas besoin de math pour être un bon dev non ?
Car si la diff entre un bon data scientist et un mauvais data scientist c’est les maths
J’ose espérer que ce n’est pas la même chose pour les devs ou sinon je suis dans la merde
GalaxyA71
2021-08-10 08:58:44
[01:21:10] <CouilleVerbale>
Le 10 août 2021 à 00:57:32 :
[00:53:01] <Tagomaphyte>
D'après ce que j'ai entendu il ne faut pas de grandes connaissances en mathématiques (à part si ça fait du ML très poussé notamment en recherche).
A ce que j'ai entendu si tu as des bases en algèbre linéaire c'est bon.
Alors vraiment mais vraiment pas. C'est ce qui fait la différence entre un bon data scientist et un arnaqueur c'est les maths.
Exemple mais là j'ai lissé des séries temporelles avec des ondelettes. Les ondelettes c'est de l'analyse hilbertienne et si tu sais pas ce que tu fais c'est très difficile d'utiliser le truc correctement (estimer la variance du bruit, savoir quelle ondelette choisir selon les moments nuls que tu veux, bref jargon de matheux).
Après concernant les algorithmes de ML faut un minimum de connaissances en optimisation pour comprendre comment ça tourne et faire de bonnes architectures (de réseaux de neurones par exemple).
Donc au final, pour moi un mec qui est data scientist mais a pas fait de maths va produire des trucs consommateurs en calculs pour que dalle, qu'il aura galéré à trouver en faisant des essais et surtout sur tout ce qui est nettoyage des données il sera mauvais.
Ça n'est que mon avis.
On est d’accord sur le fait que les devs n’ont pas besoin de math pour être un bon dev non ?
Car si la diff entre un bon data scientist et un mauvais data scientist c’est les maths
J’ose espérer que ce n’est pas la même chose pour les devs ou sinon je suis dans la merde
D'après mon expérience, un bon dev c'est quelqu'un de rigoureux et qui a un minimum de connaissances en algorithme et informatique. Mais pas nécessairement besoin de maths.
Je te donne un exemple, le stagiaire en data science venu m'épauler sur la tâche de générer des tableurs excels (qui devenait trop chronophage pour moi tout seul) a fait du code pour un rapport. Il a blindé de boucles for et le code mettait 11 minutes à run.
Je suis passé derrière, j'ai vectorisé tous les calculs. Résultats ? De 300 lignes à 50 lignes et le run prenait moins de 1 minute.
StanleyTylon
2021-08-10 08:59:16
moi aussi mais je ne cherche pas d'attention sur un forum
GalaxyA71
2021-08-10 09:00:10
[08:59:16] <StanleyTylon>
moi aussi mais je ne cherche pas d'attention sur un forum
Bof, on est beaucoup.
poulain78451
2021-08-10 09:01:29
C'est toi qui fait les algo qui détectent les fraudes?
Jean-OCaml
2021-08-10 09:04:33
La plupart des clients sont pas casse bonbon ?
Dans le sens, ils ont en tout et pour tout un fichier excel de 11 ko et veulent de l'IA et du "big data" pour obtenir des trucs magiques ?
GalaxyA71
2021-08-10 10:19:28
[09:01:29] <poulain78451>
C'est toi qui fait les algo qui détectent les fraudes?
Non.
GalaxyA71
2021-08-10 10:20:41
[09:04:33] <Jean-OCaml>
La plupart des clients sont pas casse bonbon ?
Dans le sens, ils ont en tout et pour tout un fichier excel de 11 ko et veulent de l'IA et du "big data" pour obtenir des trucs magiques ?
Bah l'entreprise c'est un peu ça au final. C'est une startup, c'est difficile d'avoir accès aux données et je dois faire du ML en ayant pas tant de données d'entraînement que ça.
Le truc chiant avec les clients c'est plutôt quand ils veulent que j'analyse leurs données des fois pour des demandes ponctuelles mais ils te filent un excel dégueulasse à parser.