Le 08 septembre 2022 à 21:08:35 :
Le 08 septembre 2022 à 19:31:15 :
Le 08 septembre 2022 à 19:22:48 :
Je fais du NLP et du deep pour l'audio.
Aucun intérêt d'acheter quoi que ce soit, il faut avoir accès à des serveurs qui ont des noeuds de A100 en parallèle. Tu pourras rien faire de ton côté.
Aucun intérêt non plus d'avoir un ordi à plus de 500e. Je fais tout sur un thinkpad à 250e acheté sur LBC.
Un khey a parlé de Gradient Notebook, t’en penses quoi ?
C'est bien pour faire des trucs scolaires. Sinon aucun intérêt si c'est la version gratuite, on fait pas grand chose avec 8gb.
Perso sur de l'audio (pour du CV ou du NLP c'est pareil ou pire), c'est 32gb mini pour avoir des batch size correctes.
En plus le format notebook est pas adapté pour des projets plus gros je trouve. Je préfère un truc plus classique.
Perso je vois pas l'intérêt de faire du NLP de son côté en mode geek. Les technologies en question ne sont intéressantes que si tu as des moyens digne d'une université ou d'une entreprise. Voire même d'un géant. Les modèles en question (Transformers etc) n'ont pas vraiment d'intérêt théoriques, y a pas vraiment de maths derrière (go lire l'article wikipedia si tu veux t'en convaincre, elle contient quasiment tout et fait 1 page et demi ) ... Toute la puissance des modèles ne s'exprime que si tu as des datasets énormes. Bref si tu t'appelles Google/Facebook etc ...
Les trucs à la portée du geek moyen c'est du fine tuning de modèle pré existant (genre GPT) ou des modèles d'analyse du texte. Bref c'est pas vraiment ce qu'il y a de plus excitant ...
Si tu comptes vraiment te former sur des trucs qui passent à l'échelle en NLP, go TPU de google. Y a pas vraiment mieux à ma connaissance. Mais c'est pas un truc de débutant, et ça coûte 5x plus cher au tarif horaire.
Si t'es pas à l'aise go CPU+GPU classiques.
Dans tous les cas je te conseille de jeter un oeil à JAX. Perso j'ai abandonnée PyTorch et Tensorflow pour JAX car j'y gagne en performance dans quasi tous les cas et de toute façon à un moment donné, il faut savoir mettre les mains dans le cambouis pour faire des modèles rigolos.
Le 08 septembre 2022 à 21:10:39 :
J'ajouterai, si tu veux faire des maths et du deep, regarde du côté des modèles génératifs probabilistes. Les VAE, la modèles de diffusions etc ... c'est largement plus intéressant que les transformers
Merci beaucoup pour ces messages très détaillés.
Je pense utiliser la version à 8$ pour de petits projets persos, histoire de me faire la main.
Je vais regarder JAX, je ne connaissais pas du tout.
Je connais les VAE, un peu moins les modèles de diffusion, c’est passionnant comme techno.