[ALERTE] Possible RÉVOLUTION dans le MILIEU de l'IA
Claitbration
2024-02-28 11:19:00
Le 28 février 2024 à 11:17:48 :
Le 28 février 2024 à 11:04:34 :
Tous les français chient sur Mistral pendant qu'ils impressionnent tout le monde outre-atlantique et que Microsoft vient d'investir dans la boîte. Classiquehttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Les mêmes qui vont chouiner quand des américains et chinois vont racheter la boite, alors que le seul truc qu'il a cherché avec Mistral c'est "comment parler à une fille".
Il ne faut pas rater pas le train ?
Verinot
2024-02-28 11:20:08
Le 28 février 2024 à 11:18:09 :
Le 28 février 2024 à 11:16:51 :
Le 28 février 2024 à 11:14:41 :
Je regarde le papier (je comprends pas tout), mais globalement ils remplacent la matrice de poids de chaque neurones par des booléens, et ils multiplies ça à une matrice 1D ?
En gros ils remplacent le FP16 par leur méthode de ""bit"" ternairehttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Ok en gros y a plus de multiplications dans la sortie.
Je vois pas trop comment ils arrivent a garder la précisions, mais impressionnant en tout cas.
Je sais pas khey j'ai pas le niveau pour tout comprendre, je croise juste les doigtshttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Et n'oublions pas les nouvelles architectures à base de Mamba dans les tuyaux + Google qui vient de résoudre la context window avec RingAttention les progrès sont FULGURANTShttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
55Helau
2024-02-28 11:20:19
Le 28 février 2024 à 11:19:00 :
Le 28 février 2024 à 11:17:48 :
Le 28 février 2024 à 11:04:34 :
Tous les français chient sur Mistral pendant qu'ils impressionnent tout le monde outre-atlantique et que Microsoft vient d'investir dans la boîte. Classiquehttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Les mêmes qui vont chouiner quand des américains et chinois vont racheter la boite, alors que le seul truc qu'il a cherché avec Mistral c'est "comment parler à une fille".
Il ne faut pas rater pas le train ?
Mistral propose des choses très prometteuses et c'est la seule entreprise européenne qui n'a pas à rougir face à OpenAI. Le gap entre les deux se réduit très rapidement et ils sont largement à la hauteur.
Arabichat24
2024-02-28 11:20:28
Grosso modo, on pourra faire tourner Dalle-3 avec une Game Boy ! La même que pour aller sur Mars !
Colverito
2024-02-28 11:21:37
Le 28 février 2024 à 10:42:55 :
https://image.noelshack.com/fichiers/2024/09/3/1709113357-1482b9f7-fa3a-4140-ad50-91493f525a15.jpghttps://image.noelshack.com/fichiers/2024/09/3/1709113362-9c1ce20d-a773-4c09-b6c1-29128429603f.jpg
Bordel de merde cette FOLIEhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Ils se comportent à LLaMA.
Mais qu'en est-il par rapport à GPT et Gemini ?
Claitbration
2024-02-28 11:22:16
Le 28 février 2024 à 11:20:19 :
Le 28 février 2024 à 11:19:00 :
Le 28 février 2024 à 11:17:48 :
Le 28 février 2024 à 11:04:34 :
Tous les français chient sur Mistral pendant qu'ils impressionnent tout le monde outre-atlantique et que Microsoft vient d'investir dans la boîte. Classiquehttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Les mêmes qui vont chouiner quand des américains et chinois vont racheter la boite, alors que le seul truc qu'il a cherché avec Mistral c'est "comment parler à une fille".
Il ne faut pas rater pas le train ?
Mistral propose des choses très prometteuses et c'est la seule entreprise européenne qui n'a pas à rougir face à OpenAI. Le gap entre les deux se réduit très rapidement et ils sont largement à la hauteur.
J'achète
QiED23
2024-02-28 11:23:28
par 5 ou 6, tout en diminuant la latence, et sans perte de qualité !
J'en parler il y a quelques jours, si c'est aussi bien que ça, dans 3 mois l'IA aura complètement changéhttps://image.noelshack.com/fichiers/2024/04/1/1705880441-2024-01-21.jpg
Lunariata
2024-02-28 11:24:11
Je viens de tester Mistral et c'est vrai qu'il est convainquant
Verinot
2024-02-28 11:24:25
Le 28 février 2024 à 11:21:37 :
Le 28 février 2024 à 10:42:55 :
https://image.noelshack.com/fichiers/2024/09/3/1709113357-1482b9f7-fa3a-4140-ad50-91493f525a15.jpghttps://image.noelshack.com/fichiers/2024/09/3/1709113362-9c1ce20d-a773-4c09-b6c1-29128429603f.jpg
Bordel de merde cette FOLIEhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Ils se comportent à LLaMA.
Mais qu'en est-il par rapport à GPT et Gemini ?
Bah on sait pas, ils prennent LLaMA parce que c'est le seul gros modèle open sourcehttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Mais fondamentalement c'est la même structure, si ça marche pour LLaMA ça devrait fonctionner pour tous les LLMhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
-REDPILL-
2024-02-28 11:24:46
Si c’est open source depuis des mois pourquoi on en a pas entendu parler jusqu’à aujourd’hui ? Il y a des IA qui utilise déjà ce truc ?
Verinot
2024-02-28 11:25:59
Le 28 février 2024 à 11:24:46 :
Si c’est open source depuis des mois pourquoi on en a pas entendu parler jusqu’à aujourd’hui ? Il y a des IA qui utilise déjà ce truc ?
Non c'est une ancienne version sur le Github, ils ont pas encore publié la nouvelle dont parle le papierhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Mais ça montre que les gars sont sérieuxhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Claitbration
2024-02-28 11:26:10
Le 28 février 2024 à 11:24:11 :
Je viens de tester Mistral et c'est vrai qu'il est convainquant
Qu'est ce que tu lui a demandé ?
QiED23
2024-02-28 11:27:11
Le 28 février 2024 à 11:21:37 :
Le 28 février 2024 à 10:42:55 :
https://image.noelshack.com/fichiers/2024/09/3/1709113357-1482b9f7-fa3a-4140-ad50-91493f525a15.jpghttps://image.noelshack.com/fichiers/2024/09/3/1709113362-9c1ce20d-a773-4c09-b6c1-29128429603f.jpg
Bordel de merde cette FOLIEhttps://image.noelshack.com/fichiers/2021/25/1/1624307173-img-20210621-222603.jpg
Ils se comportent à LLaMA.
Mais qu'en est-il par rapport à GPT et Gemini ?
Tu peux pas la comparer à un model close source dont on ne connait pas la taille et la véritable latence sur une machine uniquement dédié que pour noushttps://image.noelshack.com/fichiers/2024/04/1/1705880441-2024-01-21.jpg
Ce qui va être intéressant c'est de voir si dans le futur une personne va trouver le moyen d'optimiser les MoE avec cette technologiehttps://image.noelshack.com/fichiers/2024/04/1/1705880441-2024-01-21.jpg
Ce qui veut dire que avec 16Gb de VRAM tu pourras avoir l'équivalent de 2 modèles 70B qui run en même temps et spécialisé dans leur domainehttps://image.noelshack.com/fichiers/2024/04/1/1705880441-2024-01-21.jpg
Lunariata
2024-02-28 11:27:16
Le 28 février 2024 à 11:26:10 :
Le 28 février 2024 à 11:24:11 :
Je viens de tester Mistral et c'est vrai qu'il est convainquant
Qu'est ce que tu lui a demandé ?
Sous Qt, comment lister tous les ports series COM disponibles.
C'est pas pointu, mais c'est pas non plus une question bateau. Il à parfaitement répondu.
Linkpa
2024-02-28 11:27:31
Mouais, je suis dubitatif
GoSollitude
2024-02-28 11:28:24
Seul le temps d'apprentissage diminue, mais faudra encore fournir des tonnes de données, c'est ça?
QiED23
2024-02-28 11:29:21
Le 28 février 2024 à 11:28:24 :
Seul le temps d'apprentissage diminue, mais faudra encore fournir des tonnes de données, c'est ça?
Oui car les LLM ne sont que des machines de traitement de texte très évolué, pas une intelligence capable d'inventer réellementhttps://image.noelshack.com/fichiers/2024/04/1/1705880441-2024-01-21.jpg