Messages de UnDataScientist

Le 14 mars 2020 à 18:25:10 MrCrapulo a écrit :
L’appellation d'IA est clairement galvaudée et abusive non ? Ce sont justes des programmes qui trient plein de donnée selon un schéma prédéfinies

Ca dépend comment tu le vois. Pour moi c'est bien une intelligence dans la mesure où tu peux (dans certains cas) finir par faire quelque chose capable de réaliser une tâche bien précise sans aucune connaissance ni d'information sur les données. Mais la plupart du temps pour aider le modèle, on injecte la connaissance humaine/experte à travers la manipulation de données (quand tu split ton dataset, en faisant du weighting, en ajoutant des biais, à travers du feature engineering).

C'est plus des programmes qui vont essayer de trouver des fonctions f qui approximent bien f(input)=output. Mais oui en pratique c'est assez basique dans le principe de base. Et c'est bien normal, la magie n'existe pas.

Le 14 mars 2020 à 18:20:23 Kolitop45 a écrit :

Le 14 mars 2020 à 18:19:15 UnDataScientist a écrit :

Le 14 mars 2020 à 17:57:48 FrenchReveur a écrit :
En quoi consiste ton métier?https://image.noelshack.com/fichiers/2019/24/1/1560191784-talver-pc-peau-de-gnou.png

J'ai répondu un peu plus tôt déjà

Le 14 mars 2020 à 18:07:19 Kolitop45 a écrit :
C'est quoi le truc difficile en machine learning ?
Les stat, l'optimisation, l'algebre linéaire ?

En machine learning dans la discipline ou en tant que data scientist ?
En général c'est d'avoir des données, d'avoir les bonnes qui soient pertinentes pour le business case, d'avoir celles qui sont propres. Et concilier les besoin métiers avec ce qui est faisable techniquement (par exemple quand on fait une métrique custom).

Je parlais de la discipline, mais ce que tu dis est toujours bon à savoir

Pour la discipline, y'a un très gros enjeu sur l'optimisation dans la phase d'apprentissage (et parfois en prod) et l'explicabilité des modèles opaques.

Le 14 mars 2020 à 18:10:58 StationService a écrit :

Le 14 mars 2020 à 18:08:38 PinkHair--- a écrit :

Le 14 mars 2020 à 18:07:19 Kolitop45 a écrit :
C'est quoi le truc difficile en machine learning ?
Les stat, l'optimisation, l'algebre linéaire ?

L'optimisation, c'est pour ça que quasiment aucun data scientist n'en fait et que leurs librairies contiennent déjà quelques algoshttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Quand j'étais doctorant je faisais implémenter tous ces algos en NumPy aux étudiants en TP, ils détestaient ça, et moi ça me faisait marrer... :hap:

Ah mes profs de TP faisaient ça aussi. Sauf quand on est passé au chapitre réseau de neurones.
Mais je trouve que c'est une très bonne idée pour comprendre le mécanisme. C'est essentiel par la suite pour le tuning.

Le 14 mars 2020 à 17:57:48 FrenchReveur a écrit :
En quoi consiste ton métier?https://image.noelshack.com/fichiers/2019/24/1/1560191784-talver-pc-peau-de-gnou.png

J'ai répondu un peu plus tôt déjà

Le 14 mars 2020 à 18:07:19 Kolitop45 a écrit :
C'est quoi le truc difficile en machine learning ?
Les stat, l'optimisation, l'algebre linéaire ?

En machine learning dans la discipline ou en tant que data scientist ?
En général c'est d'avoir des données, d'avoir les bonnes qui soient pertinentes pour le business case, d'avoir celles qui sont propres. Et concilier les besoin métiers avec ce qui est faisable techniquement (par exemple quand on fait une métrique custom).

Le 14 mars 2020 à 17:55:24 -Fuyard a écrit :
C'est quoi une intelligence artificielle ?

C'est du code packagé.

Le 14 mars 2020 à 17:52:35 PinkHair--- a écrit :

Le 14 mars 2020 à 17:51:40 UnDataScientist a écrit :

Le 14 mars 2020 à 17:32:55 RoIIo a écrit :

Je trouve ça impressionnant et toi l'auteur ?

Moi aussi

Le 14 mars 2020 à 17:29:33 PinkHair--- a écrit :

Le 14 mars 2020 à 17:26:08 StationService a écrit :

Le 14 mars 2020 à 17:24:25 PinkHair--- a écrit :
Recherche opérationnelle maître coursehttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Mais vous avez quoi avec la recherche opérationnelle ? Pendant mes études je trouvais ça excessivement chiant :rire:

Dire que tu fais ton propre modèle mathématique et que tu l'optimises toi même, ça flatte plus l'ego que de dire que tu te contentes de tuner des layers.https://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Après je ne dis pas, tu as certainement des data scientist qui écrivent leurs propres fonctions d'optimisation (triplet loss, quantile loss etc); mais de manière générale la plupart des data scientist ne le font pas. Ensuite, bon courage pour résoudre des problèmes d'équilibre avec des réseaux de neurones :hap:

Y'a un truc qu'on finit par comprendre quand on passe de la théorie à la pratique c'est que c'est le résultat et le rendement qui compte. Sauf à faire de la recherche pure et dure.
Et très souvent on a bien plus à gagner à cleaner ses données, faire un peu de cuisine (data augmentation etc ..), bâtir un process de validation avec une metric custom pour refléter les besoins du business etc ...

On me chuchote dans l'oreille que vous êtes payés des fortunes pour finalement pas grand chosehttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Ca dépend des projets je pense. Typiquement sur la partie automatisation y'a du gain très visible, surtout quand c'est pour remplacer des opérateurs. Sur d'autres projets c'est plus difficile de voir la valeur ajoutée et même de l'évaluer, par exemple sur des études de sensibilité clients.

Le 14 mars 2020 à 17:51:10 PinkHair--- a écrit :

Le 14 mars 2020 à 17:49:08 JM_Jancovici a écrit :

[17:46:27] <SpringBoot>

Le 14 mars 2020 à 17:44:39 JM_Jancovici a écrit :

[17:41:05] <SpringBoot>
Putain les français vous mettez ingénieur à tout...

T'es juste dev AI

Si t'as un diplôme d'ingénieur, tu mets ingénieur, c'est pas compliqué

Et tu codes comme un dev.

Je réitère : vous aimez bien le sucre syntaxique en France.

Généralement si tu fais une école d'ingé c'est pas pour être que développeur. Tout l'aspect mathématiques/stats présent en DS, et compréhension des problématiques, qu'elles soient économiques, financières, scientifiques, un dev ne les a pas

Les fameuses maths en DShttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Le jour où je rencontrerai un DS qui ne se contente pas de prendre du code sur GitHub, j'aurais peut-être une bonne image de la professionhttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Il m'arrive de faire des maths, mais la plupart du temps c'est assez annexe voire déconnecté de la partie ML.
Et quand je dis faire des maths, c'est des applications de trucs (du genre test statistiques, vitesse de convergence d'estimateur, intervalle de confiance etc ... ). En général c'est surtout ça qui convainc les gens, et pas le "J'ai 0.95 d'AUC sur mon modèle".

Le 14 mars 2020 à 18:03:51 SpringBoot a écrit :

Le 14 mars 2020 à 18:01:47 TETSUYA_NOMURA a écrit :

Le 14 mars 2020 à 18:00:21 SpringBoot a écrit :

Le 14 mars 2020 à 17:58:17 UnDataScientist a écrit :

Le 14 mars 2020 à 17:41:05 SpringBoot a écrit :
Putain les français vous mettez ingénieur à tout...

T'es juste dev AI

Bah j'ai un diplome d'ingé avec une spé en IA :(

En Belgique ou au Pays-Bas, (pour ne citer qu'eux), tu aurais plutôt un simple master universitaire orienté IA.

Ce qui revient strictement au même.

En fance non, quand t'as un master t'es pas ingénieur :nonnon:
quand t'es ingénieur par contre t'as en plus le grade master qui va avec :oui:

Oui du sucre syntaxique quoi :hap:

Question formation, je peux t'assurer qu'ils sont autant pointus que vous.

Sinon GG l'op.
J'espère que t'aimes ce que tu fais.

Oui c'est l'essentiel!

Le 14 mars 2020 à 17:44:59 Abcefgiop a écrit :
C'est quoi le plus intéressant à faire en data science ? Je suis en Master et je veux pas être un "simple" data scientist

Je trouve que la partie théorie est la plus intéressante et j'ai bien aimé mon stage en R&D à lire des articles toute la journée et essayer d'en faire un truc. Mais la plupart du temps c'est pas les postes les mieux payés et c'est pas facile d'accès. Il te faut minimum un PhD sinon t'es même pas considéré. La boîte où j'avais fait mon stage m'a proposé une thèse CIFRE, mais au final j'ai fait le mercenaire et j'ai pris les sous. C'est pas plus mal non plus, j'ai du temps alloué sur mon planning pour faire de la veille technologique.

Le 14 mars 2020 à 17:48:17 SucksToBeYou a écrit :
La meilleure manière d'implémenter du LRI ?
On recommande souvent de fixer une valeur limite par le bas pour les probabilités de prendre les décisions, il y a un moyen de la choisir correctement ( sans devoir lancer 200 simulations pour trouver de bonnes valeurs, sachant qu'une phase d'apprentissage prend ~ 5-10 minutes )https://image.noelshack.com/fichiers/2020/11/6/1584202190-happy.jpg

D'autres choses à savoir sur l'implémentation ?https://image.noelshack.com/fichiers/2020/11/6/1584202190-happy.jpg

Connais pas

Le 14 mars 2020 à 17:48:24 bgsr----- a écrit :
Le MVA c'est bien ?

C'est très réputé oui.

Le 14 mars 2020 à 17:49:40 LiveReload a écrit :

Le 14 mars 2020 à 17:47:06 UnDataScientist a écrit :

Le 14 mars 2020 à 17:16:41 LiveReload a écrit :

Le 14 mars 2020 à 17:15:10 TETSUYA_NOMURA a écrit :
En vrai renseigne toi bien sur l'avenir du métier khey, j'ai bien peur que data scientist ca dur pas dans le temps
Il y a eu une grosse hype là mais ça se concrétise pas vraiment...
Assure toi un CDI et passe managerhttps://image.noelshack.com/fichiers/2016/50/1481647455-jesus-quintero-oklm.png

à l'époque c'était ingé big data, puis maintenant data scientist et data engineer. Bien avant on parlait de data mining... ça fera que changer de nom encore une fois :hap:

Ingé big data j'ai jamais entendu parlé de ça. Dans mon entourage, data scientist et data engineer c'est différent (on a des deux dans l'équipe). Et data miner aussi c'est différent et assez particulier.

J'ai pas dit que c'était la même chose. Il y a des spécialisations qui se créent. Un peu comme à l'époque webmaster, puis dev fullstack et maintenant des dév back-end et dev front-end.

Mais grosso modo, même si ça évolue et change de nom, ça reste le même domaine.

Bah avec ce raisonnement on pourrait aussi dire que médecin et infirmière c'est grosso modo pareil.

Le domaine est tellement vaste qu'il est nécessaire de se spécialiser. On peut pas tout savoir.

Le 14 mars 2020 à 17:41:05 SpringBoot a écrit :
Putain les français vous mettez ingénieur à tout...

T'es juste dev AI

Bah j'ai un diplome d'ingé avec une spé en IA :(

Le 14 mars 2020 à 17:41:44 PinkHair--- a écrit :

Le 14 mars 2020 à 17:41:05 SpringBoot a écrit :
Putain les français vous mettez ingénieur à tout...

T'es juste dev AI

Si tu as fait une filière maths, tu es statisticien.
Si tu as fait une filière info, tu es dev DL/ML.

https://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Ca tombe bien, j'ai fais les deux en parallèle, info en école d'ingé et maths à la fac

Le 14 mars 2020 à 17:43:43 Hysoka78 a écrit :
Est ce qu on est encore loin de développer une intelligence artificielle forte ?

De ce que j'en sais oui. Mais je ne sais rien.

Le 14 mars 2020 à 17:38:13 Inge-Calvitie a écrit :
Data science c'est quoi le salaire moyen autour de toi ?

Sortie d'école c'est entre 42k-46k dans ma promo sauf cas exceptionnel

Le 14 mars 2020 à 17:39:09 Inge-Calvitie a écrit :
T'as un site pour progresser en data science ?

Pour de la théorie, Elements of statistical learning. Sinon les cours de stanford sur youtube sont de bonnes qualités.
Pour de la pratique, kaggle.

Le 14 mars 2020 à 17:39:14 StationService a écrit :

Le 14 mars 2020 à 17:37:18 UnDataScientist a écrit :

Le 14 mars 2020 à 17:08:12 PinkHair--- a écrit :
D'ailleurs, autre question qui me passe par la tête, mais j'ai un devoir à rendre pour la semaine prochaine concernant la résolution de problèmes d'équilibre (équilibre de Cournot-Nash) à partir d'un réseau de neurones. Tu as une idée de comment je peux m'y prendre ? :(

Trouve un dataset d'abord. Ou fait une simulation pipeau

Ben pour ce genre de problèmes à vrai dire je vois mal comment on peut faire usage à bon escient de réseaux de neurones... :(

C'est un devoir étudiant hein. Nous aussi on a fait des TP où au final un réseau de neurone avec une couche un neurone marchait le mieux avec le dataset qu'on avait (oui je sais, ça revient à de la régression logistique, mais le but c'était d'apprendre à manier les outils).

Le 14 mars 2020 à 17:32:55 RoIIo a écrit :

Je trouve ça impressionnant et toi l'auteur ?

Moi aussi

Le 14 mars 2020 à 17:29:33 PinkHair--- a écrit :

Le 14 mars 2020 à 17:26:08 StationService a écrit :

Le 14 mars 2020 à 17:24:25 PinkHair--- a écrit :
Recherche opérationnelle maître coursehttps://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Mais vous avez quoi avec la recherche opérationnelle ? Pendant mes études je trouvais ça excessivement chiant :rire:

Dire que tu fais ton propre modèle mathématique et que tu l'optimises toi même, ça flatte plus l'ego que de dire que tu te contentes de tuner des layers.https://image.noelshack.com/fichiers/2016/51/1482448857-celestinrisitas.png

Après je ne dis pas, tu as certainement des data scientist qui écrivent leurs propres fonctions d'optimisation (triplet loss, quantile loss etc); mais de manière générale la plupart des data scientist ne le font pas. Ensuite, bon courage pour résoudre des problèmes d'équilibre avec des réseaux de neurones :hap:

Y'a un truc qu'on finit par comprendre quand on passe de la théorie à la pratique c'est que c'est le résultat et le rendement qui compte. Sauf à faire de la recherche pure et dure.
Et très souvent on a bien plus à gagner à cleaner ses données, faire un peu de cuisine (data augmentation etc ..), bâtir un process de validation avec une metric custom pour refléter les besoins du business etc ...

Le 14 mars 2020 à 17:16:41 LiveReload a écrit :

Le 14 mars 2020 à 17:15:10 TETSUYA_NOMURA a écrit :
En vrai renseigne toi bien sur l'avenir du métier khey, j'ai bien peur que data scientist ca dur pas dans le temps
Il y a eu une grosse hype là mais ça se concrétise pas vraiment...
Assure toi un CDI et passe managerhttps://image.noelshack.com/fichiers/2016/50/1481647455-jesus-quintero-oklm.png

à l'époque c'était ingé big data, puis maintenant data scientist et data engineer. Bien avant on parlait de data mining... ça fera que changer de nom encore une fois :hap:

Ingé big data j'ai jamais entendu parlé de ça. Dans mon entourage, data scientist et data engineer c'est différent (on a des deux dans l'équipe). Et data miner aussi c'est différent et assez particulier.

Le 14 mars 2020 à 17:08:13 JM_Jancovici a écrit :
Tu me conseilles de faire de la recherche sur des algos de ML chez Oracle à Zurich pour une solution propriétaire, ou d'être DS chez Amazon au Luxembourg pour optimiser les stocks en entrepôt

Les deux postes sont très bien, mais sont sûrement très différent. Tout dépend de ce que tu veux faire.

Le 14 mars 2020 à 17:08:34 StationService a écrit :

Les espaces en grande dimension on les a longtemps étudié en topologie. La descente de gradient qui s'appuie sur le chain rule, ça marche très bien. Après je doute pas qu'il puisse y'avoir d'autres méthodes d'optimisation.

1/ C'est le calcul du gradient par l'algorithme de rétropropagation du gradient qui s'appuie sur la "chain rule" (ou en français la formule de dérivation des fonctions composées), pas la descente de gradient.
2/ Il n'y a aucun rapport entre ta première et ta deuxième phrase.
3/ La descente de gradient ne fonctionne pas bien du tout, il faut effectivement utiliser au minimum des méthodes stochastiques pour obtenir de meilleurs résultats.

1/ Je voulais dire qu'on applique le principe de la descente de gradient et le chain rule.
2/ Je voulais commencer par faire un peu d'histoire des maths mais le temps presse donc j'écris ce qui me passe par la tête.
3/ Quand vous dites méthodes stochastiques vous parlez des SGD ? Si c'est bien ça, oui, c'est ce qu'on utilise le plus souvent avec un batch size en fonction du matos et de la taille des données. Je pensais à autre chose.
Théoriquement avec un batch size de 1 on obtient le meilleur résultat, mais ça serait trop lent pour la plupart des cas. Donc j'en reviens à l'histoire de compromis entre le temps et le score.

Le 14 mars 2020 à 17:08:12 PinkHair--- a écrit :
D'ailleurs, autre question qui me passe par la tête, mais j'ai un devoir à rendre pour la semaine prochaine concernant la résolution de problèmes d'équilibre (équilibre de Cournot-Nash) à partir d'un réseau de neurones. Tu as une idée de comment je peux m'y prendre ? :(

Trouve un dataset d'abord. Ou fait une simulation pipeau

Le 14 mars 2020 à 17:14:43 ilCommendatore a écrit :
je cherche un stage en IA base de donnée ou analyse de data, y'a moyen de passer MP ?

Pas dans ma boîte en ce moment (à cause du coronavirus). A l'époque j'avais trouvé mes stages sur linkedin et sur welcometothejungle. La meilleure façon de se démarquer des autres c'est d'avoir fait des projets perso.

Le 14 mars 2020 à 17:15:10 TETSUYA_NOMURA a écrit :
En vrai renseigne toi bien sur l'avenir du métier khey, j'ai bien peur que data scientist ca dur pas dans le temps
Il y a eu une grosse hype là mais ça se concrétise pas vraiment...
Assure toi un CDI et passe managerhttps://image.noelshack.com/fichiers/2016/50/1481647455-jesus-quintero-oklm.png

Je suis dans une COGIP, au pire on me met au placard et je finis pas faire que de la veille technologique. Parfois j'ai l'impression qu'on a engagé mes collègues et moi même pour faire saliver les actionnaires.
Mais bon je doute que ça finisse comme ça perso.

Le 14 mars 2020 à 17:07:04 E-TR0N a écrit :
ça m'intéresse beaucoup comme orientation :oui:
Ta journée typique de taff ça ressemble à quoi ?
Tu penses que ce métier va vraiment devenir de plus en plus demandé dans le futur ?
Tu penses qu'il y a encore moyen de faire de grosses améliorations dans le domaine ou on a déjà quand même déjà pas mal épuisé le potentiel ? Genre je sais que ça fait un peu SF etc mais genre tu crois qu'un jour une IA générale serait possible ?

Je vais au boulot, j'ouvre ma VM, je lance pycharm et notebook.
Je check si les scripts de la veille ont bien tournés et que l'IT n'a pas osé faire une maintenance à l'improviste.
Je track des bugs, je fais un peu de veille technologique, j'explore quelques sujets qui pourraient intéresser mon boss.
Si y'a un truc intéressant je lui en fait part, on fait de la tractation pour avoir l'attention des gens concernés (ceux qui détiennent et comprennent les data et ceux à qui le projet pourrait bénéficier). Il fait un retour à la direction, je fais une petite présentation/POC et on lance le sujet.
Bon la en période de coronavirus en télétravail, je regarde les cours de bourse chuter et je lance quelques training sur le côté. Tout est au ralenti, les gens sont pas dispo, le VPN pour accéder au réseau SI est saturé vu que tout le monde est en télétravail donc je fous pas grand chose.

Oui et non. La demande en data science va être plus forte, mais les outils seront de plus en plus sophistiqué au point où même quelqu'un de non initié pourra faire le boulot. Je ne me prononce donc pas.

Oui, les améliorations seront principalement du côté calculatoire. Y'a déjà un gros gap entre la théorie et la pratique, notamment lié à la taille des données, ce qui pourra changer dans le futur.

Je crois pas à l'IA de la SF.

Le 14 mars 2020 à 17:04:59 PinkHair--- a écrit :

Le 14 mars 2020 à 17:01:36 UnDataScientist a écrit :

Le 14 mars 2020 à 16:52:53 PapyCastor a écrit :
Quand est ce que les robots nous permettrons de faire baisser la durée du travail en france?

Ca a déjà commencé et c'est en pleine montée (bon après avec le coronavirus c'est une autre histoire).

Le 14 mars 2020 à 16:54:30 techcrunch a écrit :
L’auteur qui passe + de temps à la pause café à attendre que ses modèles ML finissent de compiler que de vraiment bosser.https://image.noelshack.com/fichiers/2018/27/4/1530827992-jesusreup.png

C'est en partie vraie selon le stade du projet.

Le 14 mars 2020 à 16:55:23 BiffIette a écrit :
Tu fais que des if imbriqués non?

Non :(

Le 14 mars 2020 à 16:55:45 PinkHair--- a écrit :
Question bête d'étudiant en L1 info, mais pourquoi les algos d'optimisation des réseaux de neurones reposent tous exclusivement sur des approches non-stochastiques alors qu'ils opèrent sur des espaces avec beaucoup de dimensions ?

Les espaces en grande dimension on les a longtemps étudié en topologie. La descente de gradient qui s'appuie sur le chain rule, ça marche très bien. Après je doute pas qu'il puisse y'avoir d'autres méthodes d'optimisation.

Justement, non :(

Si dans les espaces à haute dimension tu as peu de minimas locaux contrairement à la croyance populaire, et tu as beaucoup de motifs en forme de "selle" qui stoppent/ralentissent la descente de gradient. Un RS, par exemple, serait théoriquement plus adapté puisqu'il permet d'effectuer la descente en de multiples points :(

Y'a beaucoup de méthodes pour palier à ce problème, du learning rate decay, cyclic, ajout de bruit ... Y'a un aspect essentiel à prendre en compte c'est le temps de calcul, du coup on revient souvent à faire un compromis. La théorie c'est bien, mais dans la pratique on se résout tout le temps à prendre des raccourcis, des règles empirique ou des méthodes métaheuristiques.
Mais je doute pas qu'il y'a beaucoup de recherche de ce côté là et je suis loin d'être expert dessus.

Le 14 mars 2020 à 16:59:18 StationService a écrit :

Automatisation, algo de prediction, pricing, analyse statistique.

C'est très vague, concrètement quel genre de choses peut-on te demander, et comment tu fais pour répondre à ces demandes ?

C'est mon boss qui gère les projets (mais je reste force de proposition). On a parfois des demandes d'autres service "On a ça comme données, vous pensez que vous pouvez faire ... ? ". Parfois on fait des POC ou des trucs d'exploration, on présente ça à la direction et eux valident ou non les budgets.

Le 14 mars 2020 à 16:57:53 Maximum_loop a écrit :

Le 14 mars 2020 à 16:53:39 UnDataScientist a écrit :

Le 14 mars 2020 à 16:51:40 Maximum_loop a écrit :
Je suis testeur QA, t'as un taff pour moi ?

Non je suis en bas de l'échelle.

Je suis débutant QA, tu connais leur taf ? il est cool ?

Nope et j'ai pas eu une formation très axé info donc je sais pas.

Le 14 mars 2020 à 16:58:53 TETSUYA_NOMURA a écrit :
ah mais j'avais pas vue ...

en fait t'es data scientist quoi ... en français t'es statisticien... tu sais pas programmer quoi :(

python et R c'est pas de la programmation

Oui si tu veux

Le 14 mars 2020 à 17:02:30 Tract_opel0 a écrit :
Laurent Alexandre est-il un guignol ?

Surement

Le 14 mars 2020 à 16:59:24 PinkHair--- a écrit :
Autre question de L1 info un peu perdu (désolé, on a pas de très bons profs à l'université de Limosges), mais pourquoi les modèles d'attention sont peu utilisés pour les opérations de time-series? :(

A ce que je sache les attention models sont beaucoup utilisé en NLP, parfois avec des RNN, parfois en standalone. Les séries temporelles c'est une tout autre histoire, y'a pas vraiment de modèle de référence en ML pour traiter des time series. Très souvent ça part sur des modèles d'économétrie du type ARIMA.

Pour avoir travailler un peu sur le sujet, je dirais que c'est essentiellement du au fait qu'en série temporelle, on a plus cette notion d'échantillon indépendant et on arrive plus à faire quoique ce soit sans. Du coup c'est souvent les modèles très simple d'économistes qui marche le mieux, parfois même une simple régression linéaire.