Messages de Mikicort

Le 25 janvier 2022 à 16:25:13 :
Pour les datascientist du topic, miki & co, les entretiens d'embauches se passent comment ?

Car genre un bon programmeur en entretien gafam on va lui sortir des exo leetcode "hard", pour voir son pattern recognition etc. Mais niveau datascience les entretiens sérieux c'est comment ? Je ne touche absolument pas au domaine

Le pattern recognition c'est une branche de data science je trouve ? Je suis sur ce sujet, j'ai des séries temporelles 1D avec des pattern mais la période de pattern bouge et les signaux sont très très peu réguliers (au sens maths du terme) du coup c'est une merde infâme (je peux pas faire de Fourrier pour estimer les périodes par exemple comme les signaux sont super irréguliers, mais du coup trouver les patterns sans les périodes c'est encore un bon gros domaine de recherche). :hap:

Niveau entretiens dans des grosses boîtes personne à eu à faire d'exo ou de test dans ma promo perso. Et pour ceux qui bossent en startup généralement personne est plus calé que le candidat. :hap:

Le 25 janvier 2022 à 16:22:07 :

Je bosse énormément en lien avec Airbus (suis à Toulouse en maths appliquées) et jamais entendu personne parler d'OCaml chez eux. De l'Ada à la limite et encore, ça se perd. :(

Bon après si tu le dis, pourquoi pas. :(

Exa exa Ada. Le C++ pour les gros projets. :malade: Le garbage collector. :malade: Les pointeurs gérés avec le cul. :malade:

Ouais m'enfin Ada c'est pas très orienté objet c'est très "procédural" quand même. Et bien la tendinite vu la syntaxe, t'as l'impression d'écrire un romain littéraire. :rire:

Le 25 janvier 2022 à 16:21:50 :

Le 25 janvier 2022 à 16:18:49 :

Le 25 janvier 2022 à 16:17:47 :

Le 25 janvier 2022 à 16:16:16 :

Le 25 janvier 2022 à 16:14:04 :

Le 25 janvier 2022 à 16:10:06 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel langage si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Python pour les algorithmes de machine learning, R pour faire les statistiques qui permettent de faire de la feature engineering (modifier les données pour donner à manger aux algos de machine learning le meilleur format possible).

Malheureusement pour l'instant il manque encore trop d'outils stats en Python pour se passer du R, ça viendra mais pas tout de suite. :(

C++ à part si tu veux coder tes propres couches de réseau de neurones ou tes propres descentes de gradient, ou alors que tu fais de l'embarqué (comme dab' avec le C++), j'en vois pas trop l'intérêt. :(

Autant R est viable dans l'industrie, autant je doute fortement qu'il y ait un intérêt à apprendre de nos jours. Tout se fait de plus en plus sous Python de nos jours.

Je sais bien mais le truc c'est qu'il y a beaucoup d'outils statistiques qui sont pas encore disponibles sous Python. Essaye de faire un graphe de projections de variables sur les composantes principales dans une ACP, en R tout est déjà fait, en Python faut tout faire soi-même avec matplotlib (et c'est super chronophage). Et encore je parle d'un truc aussi banal qu'une ACP, j'ai pas parlé tests statistiques ou autres outils exotiques comme ALD, AFCM, etc. :hap:

Ouais c'est sûr, mais bon, TOUT est sur internet, faut juste faire la librairie soi-même :hap:
J'avais commencé d'ailleurs puis j'ai trouvé une lib à moitié entamée alors j'ai eu la flemme de continuer

Si le mec est callé en maths c'est jouable, sinon c'est impensable. :hap:

J'ai trouvé ça abordable pourtant. :(
Après j'avais un cours sous les yeux, c'est peut-être ça. Faut juste savoir faire du calcul matriciel

Ça dépend, pour faire une ACP tu peux faire un peu de calcul matriciel pour calculer ta matrice de variance covariance et il reste quand même à faire une décomposition spectrale.

Sinon tu peux faire une SVD directement sur tes données. Ça reste de l'algèbre linéaire c'est pas donné à tout le monde. :(

Le 25 janvier 2022 à 16:19:54 :

Le 25 janvier 2022 à 16:17:51 :

Le 25 janvier 2022 à 16:11:50 Mikicort a écrit :

Le 25 janvier 2022 à 16:07:32 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel language si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Ne fait pas de machine learning si tu n'as pas de Phd/doctorat c'est le meilleur conseil que tu puisse recevoir.
Tu va devenir Data analyste et faire du nettoyage de donnée h24 => pire boucle possible

Si tu veux vraiment faire du dev va faire du C#/Java dans une grosse boite ou du JS/Python/PHP dans une startup.

Ou encore mieux => dev ops/ cloud engineer.

Les data analyst font du Python dans les startups... :(

Cela dit je plussoie, data science si t'as pas PhD / Doctorat ou alors diplôme d'une bonne grosse école d'ingénieur c'est un coup à finir ses journées à faire des tableurs Excel ou du parsing de données en Python. :peur:

Je suis dans une grosse école d'ingé + master orienté recherche dans une grande université asiatique prévu, je fais tout ce que je peux pour pouvoir éviter le nettoyage de données sans passer par un doctorat :hap:

ça va être compliqué => les américains s'en foutent de ton école, ils ne jurent que par les Phd.

Et si tu reste en Europe ou en Asie tu aura un salaire de merde (a part en Suisse).

T'abuses un peu là, les Anglo-Saxons regardent beaucoup aux expériences plutôt qu'aux titres. Ça tombe bien que t'en parles j'ai eu un call avec un data scientist Australien mardi soir (il est data scientist assez haut placé dans une grosse boîte qui est depuis peu cliente de la startup dans laquelle je bosse). Le mec avait pas de PhD par contre niveau expériences professionnelles etc il avait bien géré son parcours. :hap:

Le 25 janvier 2022 à 16:17:51 :

Le 25 janvier 2022 à 16:11:50 Mikicort a écrit :

Le 25 janvier 2022 à 16:07:32 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel language si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Ne fait pas de machine learning si tu n'as pas de Phd/doctorat c'est le meilleur conseil que tu puisse recevoir.
Tu va devenir Data analyste et faire du nettoyage de donnée h24 => pire boucle possible

Si tu veux vraiment faire du dev va faire du C#/Java dans une grosse boite ou du JS/Python/PHP dans une startup.

Ou encore mieux => dev ops/ cloud engineer.

Les data analyst font du Python dans les startups... :(

Cela dit je plussoie, data science si t'as pas PhD / Doctorat ou alors diplôme d'une bonne grosse école d'ingénieur c'est un coup à finir ses journées à faire des tableurs Excel ou du parsing de données en Python. :peur:

Je suis dans une grosse école d'ingé + master orienté recherche dans une grande université asiatique prévu, je fais tout ce que je peux pour pouvoir éviter le nettoyage de données sans passer par un doctorat :hap:

Même combat. D'ailleurs suis en alternance dans une startup qui se fout de ma gueule (je dois faire le travail de data scientist cad développer les algos mais aussi celui de data analyst et je passe un temps fou à faire du tableur Excel et des trucs de merde). Mon directeur de formation est furieux et du coup là je cherche une nouvelle entreprise, c'est pas les offres qui manquent. :hap:

Le 25 janvier 2022 à 16:14:20 :

Le 25 janvier 2022 à 16:11:50 :

Le 25 janvier 2022 à 16:07:32 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel language si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Ne fait pas de machine learning si tu n'as pas de Phd/doctorat c'est le meilleur conseil que tu puisse recevoir.
Tu va devenir Data analyste et faire du nettoyage de donnée h24 => pire boucle possible

Si tu veux vraiment faire du dev va faire du C#/Java dans une grosse boite ou du JS/Python/PHP dans une startup.

Ou encore mieux => dev ops/ cloud engineer.

Les data analyst font du Python dans les startups... :(

Cela dit je plussoie, data science si t'as pas PhD / Doctorat ou alors diplôme d'une bonne grosse école d'ingénieur c'est un coup à finir ses journées à faire des tableurs Excel ou du parsing de données en Python. :peur:

Oui mais python est aussi utilisé pour la partie applicative parfois (flask, django, fast api) et pour les scripts d automatisation de déploiement donc pas uniquement pour du ML.

C'est vrai, mais d'ailleurs c'est pour ça que j'ai mis que Python avait des défauts mais c'est quand même super cool. Je trouve que c'est un langage à l'interface entre développement et calcul scientifique. Là où R et Julia sont vraiment pas pratiques pour faire des pipelines et où tous les autres langages sont horribles pour faire du calcul scientifique. :(

Le 25 janvier 2022 à 16:17:47 :

Le 25 janvier 2022 à 16:16:16 :

Le 25 janvier 2022 à 16:14:04 :

Le 25 janvier 2022 à 16:10:06 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel langage si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Python pour les algorithmes de machine learning, R pour faire les statistiques qui permettent de faire de la feature engineering (modifier les données pour donner à manger aux algos de machine learning le meilleur format possible).

Malheureusement pour l'instant il manque encore trop d'outils stats en Python pour se passer du R, ça viendra mais pas tout de suite. :(

C++ à part si tu veux coder tes propres couches de réseau de neurones ou tes propres descentes de gradient, ou alors que tu fais de l'embarqué (comme dab' avec le C++), j'en vois pas trop l'intérêt. :(

Autant R est viable dans l'industrie, autant je doute fortement qu'il y ait un intérêt à apprendre de nos jours. Tout se fait de plus en plus sous Python de nos jours.

Je sais bien mais le truc c'est qu'il y a beaucoup d'outils statistiques qui sont pas encore disponibles sous Python. Essaye de faire un graphe de projections de variables sur les composantes principales dans une ACP, en R tout est déjà fait, en Python faut tout faire soi-même avec matplotlib (et c'est super chronophage). Et encore je parle d'un truc aussi banal qu'une ACP, j'ai pas parlé tests statistiques ou autres outils exotiques comme ALD, AFCM, etc. :hap:

Ouais c'est sûr, mais bon, TOUT est sur internet, faut juste faire la librairie soi-même :hap:
J'avais commencé d'ailleurs puis j'ai trouvé une lib à moitié entamée alors j'ai eu la flemme de continuer

Si le mec est callé en maths c'est jouable, sinon c'est impensable. :hap:

Le 25 janvier 2022 à 16:14:04 :

Le 25 janvier 2022 à 16:10:06 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel langage si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Python pour les algorithmes de machine learning, R pour faire les statistiques qui permettent de faire de la feature engineering (modifier les données pour donner à manger aux algos de machine learning le meilleur format possible).

Malheureusement pour l'instant il manque encore trop d'outils stats en Python pour se passer du R, ça viendra mais pas tout de suite. :(

C++ à part si tu veux coder tes propres couches de réseau de neurones ou tes propres descentes de gradient, ou alors que tu fais de l'embarqué (comme dab' avec le C++), j'en vois pas trop l'intérêt. :(

Autant R est viable dans l'industrie, autant je doute fortement qu'il y ait un intérêt à apprendre de nos jours. Tout se fait de plus en plus sous Python de nos jours.

Je sais bien mais le truc c'est qu'il y a beaucoup d'outils statistiques qui sont pas encore disponibles sous Python. Essaye de faire un graphe de projections de variables sur les composantes principales dans une ACP, en R tout est déjà fait, en Python faut tout faire soi-même avec matplotlib (et c'est super chronophage). Et encore je parle d'un truc aussi banal qu'une ACP, j'ai pas parlé tests statistiques ou autres outils exotiques comme ALD, AFCM, etc. :hap:

Perso en Python j'ai développé moi-même une petite librairie pour l'ACP du coup, qui propose les graphes en plotly. C'est super cool mais ça demande de faire des maths (y'a une SVD sous le capot). :hap:

Le 25 janvier 2022 à 16:07:32 :

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel language si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Ne fait pas de machine learning si tu n'as pas de Phd/doctorat c'est le meilleur conseil que tu puisse recevoir.
Tu va devenir Data analyste et faire du nettoyage de donnée h24 => pire boucle possible

Si tu veux vraiment faire du dev va faire du C#/Java dans une grosse boite ou du JS/Python/PHP dans une startup.

Ou encore mieux => dev ops/ cloud engineer.

Les data analyst font du Python dans les startups... :(

Cela dit je plussoie, data science si t'as pas PhD / Doctorat ou alors diplôme d'une bonne grosse école d'ingénieur c'est un coup à finir ses journées à faire des tableurs Excel ou du parsing de données en Python. :peur:

Le 25 janvier 2022 à 16:03:22 :
Vous me conseillez d'apprendre quel langage si je veux faire du machine learning et que je connais juste Python et R ? C++ ?

Python pour les algorithmes de machine learning, R pour faire les statistiques qui permettent de faire de la feature engineering (modifier les données pour donner à manger aux algos de machine learning le meilleur format possible).

Malheureusement pour l'instant il manque encore trop d'outils stats en Python pour se passer du R, ça viendra mais pas tout de suite. :(

C++ à part si tu veux coder tes propres couches de réseau de neurones ou tes propres descentes de gradient, ou alors que tu fais de l'embarqué (comme dab' avec le C++), j'en vois pas trop l'intérêt. :(

Le 25 janvier 2022 à 15:59:56 :

Le 25 janvier 2022 à 15:51:57 :

Le 25 janvier 2022 à 15:49:30 :

Le 25 janvier 2022 à 15:44:44 :

Le 25 janvier 2022 à 15:40:47 :

Le 25 janvier 2022 à 15:38:54 :

Le 25 janvier 2022 à 14:54:29 :
Par contre si vous géré très bien le Ocaml vous pouvez postuler chez Jane Street ( hedge fund ) et a vous les $$$$.

C'est utilisé qu'en France OCaml, ça a été développé par l'INRIA.

Non.

C'est utilisé à mort par un Hedge Fund qui s'appel Jane Street.

C'est connu pour être les postes de dev les mieux payés au monde (plus que Google et Netflix).

Tu m'excuseras d'avoir eu cours très poussé d'OCaml avec des enseignants-chercheurs de l'INRIA (deux sortis de l'INP ENSEEIHT et un de l'X). Ça a été développé par l'INRIA, par le groupe "Formel" dans les années 80 d'après Wikipédia, et je réitère, c'est puissant mais c'est utilisé nul part et très difficile à intégrer.

Ah et c'est puissant parce que la manière de programmer demande de se griller les neurones aussi, faut bien l'admettre.

Pour ma part j'ai fait un générateur de sudoku avec solveur utilisant différentes heuristiques en OCaml. :(

"je l'ai utilisé a l'Inria donc personne d'autre ne l'utilise" :rire:

https://ocaml.org/learn/success.fr.html

Je t'ai jamais dit que c'était pas utilisé par JaneStreet, merci d'avoir cité une seule entreprise qui utilise ce langage et de confirmer que c'est un langage d'ultra niche, bien plus que le C++. :hap:

PS : ils sont biens payés parce que c'est du tradding, pas parce qu'ils codent en OCaml. N'importe quel dev dans cette boîte est sur-payé j'imagine. À côté de ça la majorité des gens qui font du OCaml sont des chercheurs Français payés au lance-pierre (en tous cas en comparaison de ce que tu me cites).

OCaml est introllable pour la vérification/certification. Il maintient tes petits Airbus en l'airhttps://image.noelshack.com/fichiers/2021/44/7/1636279598-chatlunette.png

Je bosse énormément en lien avec Airbus (suis à Toulouse en maths appliquées) et jamais entendu personne parler d'OCaml chez eux. De l'Ada à la limite et encore, ça se perd. :(

Bon après si tu le dis, pourquoi pas. :(

Le 25 janvier 2022 à 15:58:37 :

Le 25 janvier 2022 à 15:50:47 :
Ceux qui disent Python vous êtes à côté de la plaque. Ok ce langage est aberrant, pas de typage, interprété, m'enfin c'est clairement utilisé presque partout maintenant.

Et niveau performances la plupart des librairies à utiliser sont écrites en C, C++ ou Cython donc ça tourne très très bien. Après c'est sûr que quand on fait des boucles for à gogo au lieu de penser le problème en termes de vecteurs et de matrices. M'enfin faut pas trop en demander à des gens qui font pas de maths (mais se donnent quand même des titres prestigieux sur LinkedIn comme "data scientist" :rire:).

Pour moi c'est un excellent langage de prototyping / ML / datascience mais faut pas non plus dire que niveau perf parfait, malgré l'interopabilité des libs C etc, je trouve ça fou de faire un backend à fort iops en python

Et avant de me faire insulterr je connais ma graph theory, mes data structures et mes time complexity :ouch:

Rare sur ce forum mais je plussoie ta réponse. :(

Petits gang-bang hebdomadaires en sortie de boîte jusqu'à ses 30 ans. :)

Petite mariage avec un Célestin à 35 ans quand elle voudra se poser. :)

Petit vie paisible parce que Célestin est développeur Web bien payé. :)

Petite liaison extra-conjugale avec un collègue de travail quand Célestin consulte son médecin pour son Norwood 4. :)

Petite sodomie par un chad rencontré sur les réseaux sociaux pendant que les enfants sont à l'école et que Célestin consulte cette fois-ci pour ces soucis d'érection, sans comprendre que si l'oiseau ne sent pas les murs de son nid, c'est pas l'oiseau, c'est le nid devenu béant. :)

Le 25 janvier 2022 à 15:49:30 :

Le 25 janvier 2022 à 15:44:44 :

Le 25 janvier 2022 à 15:40:47 :

Le 25 janvier 2022 à 15:38:54 :

Le 25 janvier 2022 à 14:54:29 :
Par contre si vous géré très bien le Ocaml vous pouvez postuler chez Jane Street ( hedge fund ) et a vous les $$$$.

C'est utilisé qu'en France OCaml, ça a été développé par l'INRIA.

Non.

C'est utilisé à mort par un Hedge Fund qui s'appel Jane Street.

C'est connu pour être les postes de dev les mieux payés au monde (plus que Google et Netflix).

Tu m'excuseras d'avoir eu cours très poussé d'OCaml avec des enseignants-chercheurs de l'INRIA (deux sortis de l'INP ENSEEIHT et un de l'X). Ça a été développé par l'INRIA, par le groupe "Formel" dans les années 80 d'après Wikipédia, et je réitère, c'est puissant mais c'est utilisé nul part et très difficile à intégrer.

Ah et c'est puissant parce que la manière de programmer demande de se griller les neurones aussi, faut bien l'admettre.

Pour ma part j'ai fait un générateur de sudoku avec solveur utilisant différentes heuristiques en OCaml. :(

"je l'ai utilisé a l'Inria donc personne d'autre ne l'utilise" :rire:

https://ocaml.org/learn/success.fr.html

Je t'ai jamais dit que c'était pas utilisé par JaneStreet, merci d'avoir cité une seule entreprise qui utilise ce langage et de confirmer que c'est un langage d'ultra niche, bien plus que le C++. :hap:

PS : ils sont biens payés parce que c'est du tradding, pas parce qu'ils codent en OCaml. N'importe quel dev dans cette boîte est sur-payé j'imagine. À côté de ça la majorité des gens qui font du OCaml sont des chercheurs Français payés au lance-pierre (en tous cas en comparaison de ce que tu me cites).

Ceux qui disent Python vous êtes à côté de la plaque. Ok ce langage est aberrant, pas de typage, interprété, m'enfin c'est clairement utilisé presque partout maintenant.

Et niveau performances la plupart des librairies à utiliser sont écrites en C, C++ ou Cython donc ça tourne très très bien. Après c'est sûr que quand on fait des boucles for à gogo au lieu de penser le problème en termes de vecteurs et de matrices. M'enfin faut pas trop en demander à des gens qui font pas de maths (mais se donnent quand même des titres prestigieux sur LinkedIn comme "data scientist" :rire:).

Le 25 janvier 2022 à 15:40:47 :

Le 25 janvier 2022 à 15:38:54 :

Le 25 janvier 2022 à 14:54:29 :
Par contre si vous géré très bien le Ocaml vous pouvez postuler chez Jane Street ( hedge fund ) et a vous les $$$$.

C'est utilisé qu'en France OCaml, ça a été développé par l'INRIA.

Non.

C'est utilisé à mort par un Hedge Fund qui s'appel Jane Street.

C'est connu pour être les postes de dev les mieux payés au monde (plus que Google et Netflix).

Tu m'excuseras d'avoir eu cours très poussé d'OCaml avec des enseignants-chercheurs de l'INRIA (deux sortis de l'INP ENSEEIHT et un de l'X). Ça a été développé par l'INRIA, par le groupe "Formel" dans les années 80 d'après Wikipédia, et je réitère, c'est puissant mais c'est utilisé nul part et très difficile à intégrer.

Ah et c'est puissant parce que la manière de programmer demande de se griller les neurones aussi, faut bien l'admettre.

Pour ma part j'ai fait un générateur de sudoku avec solveur utilisant différentes heuristiques en OCaml. :(

Personnellement j'aurais dit :
  • R : parce que c'est vraiment pas performant, le seul avantage c'est tous les outils statistiques mais ils commencent à être tous implémentés en Python
  • OCaml : surement très puissant comme c'est multiparadigme mais pour en avoir fait pas mal à un haut niveau, j'en vois pas encore l'utilité. C'est utilisé pratiquement nul part et très difficile à intégrer.
  • Julia : soi-disant futur remplaçant de Python pour des questions de performances. Mais en pratique les librairies sont éclatées au sol et buguées au possible, il faut un temps d'initialisation incroyable faisant que pour des projets de science et de stats au final on perd plus de temps qu'en utilisant Python avec de bonnes librairies optimisées style numpy

Le 25 janvier 2022 à 14:54:29 :
Par contre si vous géré très bien le Ocaml vous pouvez postuler chez Jane Street ( hedge fund ) et a vous les $$$$.

C'est utilisé qu'en France OCaml, ça a été développé par l'INRIA.

Le 25 janvier 2022 à 15:32:10 :
Franchement ramener son tupperware à midi c'est vraiment bien, tu fais des économies de fou et t'es sûr de bien manger en plus

Petite quiche aux poireaux réchauffée au micro-onde.https://image.noelshack.com/fichiers/2017/18/1493840835-cimer-risitas-kebab.png

Le 25 janvier 2022 à 15:27:40 :
C'est pqs des équipements obligatoires d'ailleurs ?

Parmi les équipements obligatoires y'a : de quoi réchauffer, robinet d'eau potable, endroit où se restaurer sans risques au niveau conditions d'hygiènes et sécurités. Sinon en principes l'employeur est censé fournir des tickets restos. :hap:

Donc ma startup est dans la légalité. On m'a promis de quoi manger, j'ai un micro-onde pour réchauffer mes tupperware. :)

"Pays de la bouffe". :)