Ca exsiste un logiciel IA qui sépare les 2 voix d'un fichier AUDIO ?

lNeptune
2024-10-19 14:24:35

En gros j'ai un fichier audio entre 2 personne qui parle j'"aimerai un logiciel IA qui permet de séparé les 2 voix et de me donner chaque fichier audio cest possible ?

yamd
2024-10-19 14:27:14

Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

lNeptune
2024-10-19 14:29:06

Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

il le fait pas automatiquement

Lysgol
2024-10-19 14:29:45

Bonne question
Up

Can-01
2024-10-19 14:30:42

Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

t'es un bot pour répondre un truc aussi éclaté ?

lNeptune
2024-10-19 14:30:48

Le 19 octobre 2024 à 14:29:45 :
Bonne question
Up

:ok:

Maurice-Thorez
2024-10-19 14:31:15

https://www.lalal.ai/
edit : ah désolé j'avais pas compris non c'est pas ce que tu cherches du coup

celestinpoivre
2024-10-19 14:32:53

tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

lNeptune
2024-10-19 14:33:43

up

lNeptune
2024-10-19 14:34:00

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

celestinpoivre
2024-10-19 14:35:27

Le 19 octobre 2024 à 14:34:00 :

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

ça prend 10min

FionMignon
2024-10-19 14:36:15

Le 19 octobre 2024 à 14:34:00 :

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

:rire:
"Je veux un outil tout cuit ou rien" :rire:

AdamsBashforth
2024-10-19 14:37:19

Les golems au cerveau défoncé incapables de faire quelque chose par eux mêmes : "y'a pas un IA kipeufèreça?"https://image.noelshack.com/fichiers/2019/19/3/1557349167-sticker-debile.jpg

yamd
2024-10-19 14:37:44

Le 19 octobre 2024 à 14:29:06 :

Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

il le fait pas automatiquement

Non, pas d'IA integrée. Obligé de mettre le nez dedans avec ce logiciel.

lNeptune
2024-10-19 14:38:12

Le 19 octobre 2024 à 14:35:27 :

Le 19 octobre 2024 à 14:34:00 :

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

ça prend 10min

je compte faire bcp de videos 10min par si par la c'est pas rentable

FionMignon
2024-10-19 14:38:48

Le 19 octobre 2024 à 14:37:19 :
Les golems au cerveau défoncé incapables de faire quelque chose par eux mêmes : "y'a pas un IA kipeufèreça?"https://image.noelshack.com/fichiers/2019/19/3/1557349167-sticker-debile.jpg

Ca dépend, si il veut faire le truc pour 1h de conversation, il peut le faire à la main, mais si c'est 10 000h cumulé, c'est IA ou rien :rire:

FionMignon
2024-10-19 14:39:45

Le 19 octobre 2024 à 14:38:12 :

Le 19 octobre 2024 à 14:35:27 :

Le 19 octobre 2024 à 14:34:00 :

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

ça prend 10min

je compte faire bcp de videos 10min par si par la c'est pas rentable

Bah si, tu utilises un langage comme python et t'appelles les modules qu'il faut et tu prends autant de fichiers que tu veux une fois que tu as le bon mode opératoire :(

yamd
2024-10-19 14:40:17

t'es un bot pour répondre un truc aussi éclaté ?

Possible. Puis tu te relis et tu essayes d'evaluer ta contribution constructive sur le sujet ^^

fredo-
2024-10-19 14:40:37

tu veux prendre le train tiktok toihttps://image.noelshack.com/fichiers/2024/41/5/1728677454-img-20241011-220945-removebg-preview.png

lNeptune
2024-10-19 14:41:42

Le 19 octobre 2024 à 14:40:37 :
tu veux prendre le train tiktok toihttps://image.noelshack.com/fichiers/2024/41/5/1728677454-img-20241011-220945-removebg-preview.png

tu le fais toi ?

Infos
Gestion du forum

contact@geevey.com

API disponible. Utilisez le paramètre "api" en GET, peu importe le contenu, sur une page du site.

Notes

    ⚠️ Les archives de novembre sont désormais disponibles.
Non-assumage
    Personne n'a pas assumé de topic pour le moment.