Des podcast générés par AI, une réalité plus près qu'on pense?

Si on est capable de générer des images ultra réalistes d’être humains avec MidJourney

image

Prompt: Create an image of a beautiful woman with a warm, friendly expression, hair style long and lush braid, and wearing a casual outfit with a pop of color. The background should be a neutral, bright color, with soft, natural lighting. The girl should be positioned slightly off - center, looking directly at the camera with a slight smile. The image should be framed in a square, with a medium shot that shows the girl’s upper body and head. The overall mood should be cheerful and approachable.)

Que les AI sont maintenant capable de composer de la musique avec MusicLM

Prompt: A rising synth is playing an arpeggio with a lot of reverb. It is backed by pads, sub bass line and soft drums. This song is full of synth sounds creating a soothing and adventurous atmosphere. It may be playing at a festival during two songs for a buildup.

Pourquoi est-ce qu’un AI ne serait pas capable de générer des dialogues?!

Eh bien c’est exactement ce que le nouveau document de recherche publié par Google suggère!

Voici un exemple de cette technologie en action:

C’est vraiment très très impressionnant. Je vous recommande fortement d’aller jeter un coup d’œil sur le document de recherche.

Pour ceux qui veulent le TL;DR, voici comment ça marche:

On donne un prompt textuel: I didn’t sleep well last night. | Oh, no. What happened? | I don’t know. I I just couldn’t seem to uh to fall asleep somehow, I kept tossing and turning all night. | That’s too bad. Maybe you should uh try going to bed earlier tonight or uh maybe you could try reading a book. | Yeah, thanks for the suggestions, I hope you’re right. | No problem. I I hope you get a good night’s sleep.

Avec un prompt audio:

Et ça génère le reste:

Holy cow!

Midjourney Prompt: Holy Cow

Imaginez les applications:

  • Dialogues de films & jeux-vidéos.
  • Génération de la narration pour vos vidéos.
  • Robocall sur stéroïdes.
  • Podcasts générés par AI.
6 « J'aime »

Wow ! j’avoue que là ça devient creepy, c’est incroyable que les voix arrivent à imiter le bégaiement des humains et que ça ait l’air aussi réaliste ! Par contre pour MusicLM ça va énormément aider les créateurs de vidéos à ne pas passer 10 ans sur yt à chercher des soundtracks, c’est vraiment cool.

J’avoue que ça fait déjà un petit bout mais celui qui m’a le plus choqué comme un peu tout le monde c’était le « faux » beat de drake x the weeknd qui avait été créé par un gars sur TikTok avec un Ai et qui était hyper réaliste. C’était vraiment fou parce qu’elle était presque meilleur que les autres musiques que Drake sortait d’habitude. Évidemment elle s’est fait ban de partout :triumph:.

Vraiment hâte de voir les avancée de l’ia, ça serait pas étonnant que les podcasts les plus écoutés dans 5 ans ou moins soient faits entièrement par des ia. Ça commence déjà avec les extraits deepfake de Joe Rogan. En tous cas, très intéressant ton article !

1 « J'aime »

Exact! Fini les abonnements à 1000 services de royalties free music!!! :smiley:

Je pense (j’espère) que les gens vont préférer du contenu créé par de réels êtres humains. Mais je suis peut-être naïf!

Sans doute que les prochaines générations auront moins de réticences que moi à ce genre de contenu.

2 « J'aime »

J’ai regardé un peu les commentaires tiktok d’un gars qui mettait au montage un robot cartoon qui racontais les nouvelles avec un text-to-speech et le monde avaient pas l’air de trouver ça bizarre. Au contraire c’était plus fluide et ça permettait de comprendre plus facilement l’information.

Perso je pense que ça serait une bonne chose pour le monde gêné qui ont moins le goût de montrer leur face devant la caméra.

Il y a déjà pas mal de chaînes YouTubes qui sont générés entièrement pas AI. Ce sont des gens qui « farm » YouTube pour la monétisation.

Le problème, c’est que le contenu n’est vraiment pas très bon. Mais j’avoue que GPT8 risque d’être pas pire pour créer du contenu plus intéressant!

Sinon, le text-to-speech est quand même intéressant pour les gens qui désirent garder l’anonymat!

1 « J'aime »

Wow, Je me suis inscrit sur le google « Ai test kitchen » (il faut utiliser un vpn qui est basé aux EU)
https://aitestkitchen.withgoogle.com/tools/music-fx

C’est malade ça. Tu peux générer n’importe quoi avec cet outil, mais malheureusement on est limité à 70 secondes, mais tu peux demander que le clip soit une « loop »

voici un musique générée avec ce prompt:
feel good, surprising, funk, low fi, with saxophone

il combine funk et low fi et il le fait bien! je suis vraiment impressionné!

Au sujet des podcasts, je suis convaincu que ça ne sera pas long avant qu’on puisse entendre des AI discuter très éloquemment de plusieurs sujets dans des podcasts, mais j’ose encore espérer qu’il manquera un petit quelque chose d’expériences personnelles et humaines aux podcasts faits à partir d’algorithmes!

Bientôt, le label « Made by Human » fera la différence pour certaines personnes.

Le fait que cela soit fait avec une IA ne me dérange pas.
Ce qui me dérange c’est en effet la POLUTION que cela provoque / permet / incite.

Il faut de tout pour faire un monde ?!