Ca exsiste un logiciel IA qui sépare les 2 voix d'un fichier AUDIO ?

2024-10-19 14:24:35

En gros j'ai un fichier audio entre 2 personne qui parle j'"aimerai un logiciel IA qui permet de séparé les 2 voix et de me donner chaque fichier audio cest possible ?

yamd

2024-10-19 14:27:14

Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

lNeptune

2024-10-19 14:29:06

Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

il le fait pas automatiquement

Lysgol

2024-10-19 14:29:45

Bonne question
Up

Can-01

2024-10-19 14:30:42

Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity

t'es un bot pour répondre un truc aussi éclaté ?

lNeptune

2024-10-19 14:30:48

Le 19 octobre 2024 à 14:29:45 :
Bonne question
Up

:ok:

Maurice-Thorez

2024-10-19 14:31:15

https://www.lalal.ai/
edit : ah désolé j'avais pas compris non c'est pas ce que tu cherches du coup

celestinpoivre

2024-10-19 14:32:53

tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

lNeptune

2024-10-19 14:33:43

lNeptune

2024-10-19 14:34:00

Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio

cest trop long

celestinpoivre

2024-10-19 14:35:27

Le 19 octobre 2024 à 14:34:00 :
Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio
cest trop long

ça prend 10min

FionMignon

2024-10-19 14:36:15

Le 19 octobre 2024 à 14:34:00 :
Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio
cest trop long

:rire:
"Je veux un outil tout cuit ou rien" :rire:

AdamsBashforth

2024-10-19 14:37:19

Les golems au cerveau défoncé incapables de faire quelque chose par eux mêmes : "y'a pas un IA kipeufèreça?"https://image.noelshack.com/fichiers/2019/19/3/1557349167-sticker-debile.jpg

yamd

2024-10-19 14:37:44

Le 19 octobre 2024 à 14:29:06 :
Le 19 octobre 2024 à 14:27:14 :
Sans certitude par rapport a ton objectif, tu peux essayer le logiciel Audacity qui est plutot performant et gratuit
https://fr.wikipedia.org/wiki/Audacity
il le fait pas automatiquement

Non, pas d'IA integrée. Obligé de mettre le nez dedans avec ce logiciel.

lNeptune

2024-10-19 14:38:12

Le 19 octobre 2024 à 14:35:27 :
Le 19 octobre 2024 à 14:34:00 :
Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio
cest trop long
ça prend 10min

je compte faire bcp de videos 10min par si par la c'est pas rentable

FionMignon

2024-10-19 14:38:48

Le 19 octobre 2024 à 14:37:19 :
Les golems au cerveau défoncé incapables de faire quelque chose par eux mêmes : "y'a pas un IA kipeufèreça?"https://image.noelshack.com/fichiers/2019/19/3/1557349167-sticker-debile.jpg

Ca dépend, si il veut faire le truc pour 1h de conversation, il peut le faire à la main, mais si c'est 10 000h cumulé, c'est IA ou rien :rire:

FionMignon

2024-10-19 14:39:45

Le 19 octobre 2024 à 14:38:12 :
Le 19 octobre 2024 à 14:35:27 :
Le 19 octobre 2024 à 14:34:00 :
Le 19 octobre 2024 à 14:32:53 :
tu peux chercher un modèle de speech to text qui fait de la speaker diarization ça va te donner les timestamps de chaque speaker et après tu as juste à faire un petit coup de ffmpeg pour extract les segments de chaque speaker sur le fichier audio
cest trop long
ça prend 10min
je compte faire bcp de videos 10min par si par la c'est pas rentable

Bah si, tu utilises un langage comme python et t'appelles les modules qu'il faut et tu prends autant de fichiers que tu veux une fois que tu as le bon mode opératoire

yamd

2024-10-19 14:40:17

t'es un bot pour répondre un truc aussi éclaté ?

Possible. Puis tu te relis et tu essayes d'evaluer ta contribution constructive sur le sujet ^^

fredo-

2024-10-19 14:40:37

tu veux prendre le train tiktok toihttps://image.noelshack.com/fichiers/2024/41/5/1728677454-img-20241011-220945-removebg-preview.png

lNeptune

2024-10-19 14:41:42

Le 19 octobre 2024 à 14:40:37 :
tu veux prendre le train tiktok toihttps://image.noelshack.com/fichiers/2024/41/5/1728677454-img-20241011-220945-removebg-preview.png

tu le fais toi ?

Infos

Gestion du forum

contact@geevey.com

API disponible. Utilisez le paramètre "api" en GET, peu importe le contenu, sur une page du site.

Notes

⚠️ Les archives de novembre sont désormais disponibles.

Non-assumage

Personne n'a pas assumé de topic pour le moment.