je suis expert en IA/Deep Learning/Modèle génratif et je réponds aux questions

2024-11-02 19:11:47

Le 02 novembre 2024 à 19:08:47 :
Le 02 novembre 2024 à 19:06:07 :
comment c'est passe ton phd ? j'hesite a en faire un en reinforcement learning
éprouvant mentalement mais riche d'apprentissage. je pense qu'il faut y aller à fond et ne pas passer à côté de ces 3/4 années intenses, surtout dans un domaine aussi mouvant que celui la

est ce qu'en france le phd t'ouvre plus de porte? ou c'est surtout pour l'étranger, j'aimerai faire de RetD en entreprise (mieux paye)

tu faisais cb d'heure par semaine?

SuceurDeBonbon

2024-11-02 19:12:59

Le 02 novembre 2024 à 19:11:08 :
Peut ont se lancer dans ce domaine sans connaissance poussée en informatique au préalable ? Sur quels métiers ça pourrait déboucher ?https://image.noelshack.com/fichiers/2024/20/3/1715773000-new-project-9.jpg

je dis pas que c'est impossible, mais à choisir entre un gros bagage info et un gros bagage matheux, je dirais que le bagage info est à ce jour de loin le plus pertinent
les plus grosses avancées à ce jour peuvent se résumer à accélérer les débits d'entrainement, car la seule certitude que l'on a c'est que "données+sur paramétrisation >>> tout le reste"

SuceurDeBonbon

2024-11-02 19:14:18

Le 02 novembre 2024 à 19:11:47 :
Le 02 novembre 2024 à 19:08:47 :
Le 02 novembre 2024 à 19:06:07 :
comment c'est passe ton phd ? j'hesite a en faire un en reinforcement learning
éprouvant mentalement mais riche d'apprentissage. je pense qu'il faut y aller à fond et ne pas passer à côté de ces 3/4 années intenses, surtout dans un domaine aussi mouvant que celui la
est ce qu'en france le phd t'ouvre plus de porte? ou c'est surtout pour l'étranger, j'aimerai faire de RetD en entreprise (mieux paye)
tu faisais cb d'heure par semaine?

dans ce domaine oui c'est un gros point fort
après ca reste un domaine relativement moderne où chacun peut se faire une place s'il apporte une preuve de sa crédibilité
je dirais qu'un github bien fourni >>> un phd avec des publis moyennes

+ je travaillais tous les jours globalement

PrixDeMarche

2024-11-02 19:15:01

t'as manqué ma question en bas de page

SuceurDeBonbon

2024-11-02 19:16:41

Le 02 novembre 2024 à 19:15:01 :
t'as manqué ma question en bas de page

benchmark medQA du coup
je regarderai si c'est possible de faire du CoT avec des gros Llama, mais je dis ça au pif

Gracq2

2024-11-02 19:17:09

Est-ce que tu as utilisé un peu de matériel issu du transport optimal dans ta thèse ?

Qu’est-ce que tu pense de l’application du ML POUR les maths (génération de Théorèmes, résolution approximée d’EDPs, surrogate models)

InBigDespite5

2024-11-02 19:18:32

j'ai un fichier CSV de 8 Go avec une colonne question et une colonne réponse

comment je fais pour finetuner un modèle avec toutes ces dataent ?

Xiosrah

2024-11-02 19:19:05

Que manque t-il à l'advanced voice mode de chatgpt pour être encore plus réactif ? juste une amélioration du hardware ?

SuceurDeBonbon

2024-11-02 19:20:07

Le 02 novembre 2024 à 19:17:09 :
Est-ce que tu as utilisé un peu de matériel issu du transport optimal dans ta thèse ?

y a un an y a eu du buzz autour du flow matching + OT mais je suis globalement inculte sur la question
je ne saurais pas dire à quel point le parallèle est pertinent, si c'est juste de la com

Qu’est-ce que tu pense de l’application du ML POUR les maths (génération de Théorèmes, résolution approximée d’EDPs, surrogate models)

"génération de théorèmes" du genre assistant de preuves. franchement pourquoi pas, coupler un LLM, du CoT et Coq, ça peut être intéressant ponctuellement

par contre tout ce qui est modèle hybride, PINN, j'émets de sérieux doutes, je trouve ça bidon dans 95% des cas

PrixDeMarche

2024-11-02 19:20:27

Le 02 novembre 2024 à 19:16:41 :
Le 02 novembre 2024 à 19:15:01 :
t'as manqué ma question en bas de page
benchmark medQA du coup
je regarderai si c'est possible de faire du CoT avec des gros Llama, mais je dis ça au pif

Je parlais plus en concret. Pour l'instant je fais mes eval manuellement par exemple. Est-ce que t'as des libs ou autre à conseiller pour faciliter le process et éventuellement bouger ça sur un serv dédié (je peux le faire sur un droplet digitalocean mais je me demande si c'est ce qui se fait dans le monde pro vu que c'est un projet perso).

waeko

2024-11-02 19:21:24

tu as deja publie dans un bonne conf? neurips, cvpr ...
ton temps est split comment entre : rédaction article, recherche d'idée, code, lecture d'article...

a qu'elle point faire un article c'est 'juste' combine des idées d'autre articles ? des articles vraiment innovant qui propose une nouvelle architecture (par exemple alpha zero en RL, gan, transformer ...) il y en pas beaucoup

Silvomilie

2024-11-02 19:21:38

C'est quoi le meilleur modèle de UVR5 pour extraire une instru?

Deuxdossiers22

2024-11-02 19:22:38

Si t'avais une base d'adresses en textuel tu t'y prendrais comment pour géolocaliser ?

Chrysaor010

2024-11-02 19:22:46

Le 02 novembre 2024 à 19:05:21 :
a ton avis, combien de temps avant la singularité ?
Penses tu que l'IA nous permettra d'établir un paradis sur terre, ou un enfer ?
Est il vrai qu'on ne sait que très peu de chose de comment les IA les plus perfectionnées arrivent a leur résultat, et que beaucoup de choses nous échappent dans leur fonctionnement ?

SuceurDeBonbon

2024-11-02 19:23:26

Le 02 novembre 2024 à 19:18:32 :
j'ai un fichier CSV de 8 Go avec une colonne question et une colonne réponse
comment je fais pour finetuner un modèle avec toutes ces dataent ?

tu fais un LoRA du dernier Llama pour commencer, par exemple en utilisant PEFT de Huggingface

SuceurDeBonbon

2024-11-02 19:25:37

Le 02 novembre 2024 à 19:21:38 :
C'est quoi le meilleur modèle de UVR5 pour extraire une instru?

MDXNet pour séparer juste les vocals, HTDemucs pour les 4 stems

alphabravo2000

2024-11-02 19:26:16

Est-ce qu'il y a de la recherche (prometteuse) qui cherche comment améliorer les perfs des modèles génératifs sans juste augmenter le nb de paramètres ou est-ce que c'est juste une course à qui à la meilleure puissance de calcul ?

SuceurDeBonbon

2024-11-02 19:27:34

Le 02 novembre 2024 à 19:21:24 :
tu as deja publie dans un bonne conf? neurips, cvpr ...
ton temps est split comment entre : rédaction article, recherche d'idée, code, lecture d'article...

oui mais pas en premier auteur
le temps est archi variable, mais les évaluations sont de loin la partie la plus difficile (quand on est quelqu'un de consciencieux)

a qu'elle point faire un article c'est 'juste' combine des idées d'autre articles ? des articles vraiment innovant qui propose une nouvelle architecture (par exemple alpha zero en RL, gan, transformer ...) il y en pas beaucoup

faire de la recherche ça veut pas dire révolutionner à chaque publication

TRIPLEGOX3

2024-11-02 19:28:46

Comment tu t'informes ? Est-ce qu'il y a certaines sources qui permettent de bien se tenir au courant de ce qui se fait au quotidien ?

PrixDeMarche

2024-11-02 19:29:15

Le 02 novembre 2024 à 19:20:27 :
Le 02 novembre 2024 à 19:16:41 :
Le 02 novembre 2024 à 19:15:01 :
t'as manqué ma question en bas de page
benchmark medQA du coup
je regarderai si c'est possible de faire du CoT avec des gros Llama, mais je dis ça au pif
Je parlais plus en concret. Pour l'instant je fais mes eval manuellement par exemple. Est-ce que t'as des libs ou autre à conseiller pour faciliter le process et éventuellement bouger ça sur un serv dédié (je peux le faire sur un droplet digitalocean mais je me demande si c'est ce qui se fait dans le monde pro vu que c'est un projet perso).