Le Village [Travail commun] Vidéo Youtube - L'affaire
Rien ne se perd, tout doit se transformer.

granced :
Même si le script est plutôt pas mal, le "parler" IA c'est quand même pas encore ça 

Je suis toujours stupéfait par des réactions comme la tienne. A croire qu'une machine qui parle, c'est tellement banale...

Et qui parle un bon français sans accent qui plus est ... moi ça m'impressionne au plus haut point ! Edité par ericb59 Le 05/05/2025 à 19h38
ericb59 :
Je suis toujours stupéfait par des réactions comme la tienne. A croire qu'une machine qui parle, c'est tellement banale... 

Ah mais je ne dis pas le contraire, les progrès sont indéniables, pourtant c'est encore très perfectible. En tout cas, à mon oreille le côté artificiel se sent, dans certaines intonations, certaines prononciations, et même les hésitations supposées "humaniser" l'expression orale m'ont fait tiquer.
Après, l'IA c'est un vaste débat (qui aurait sa place sur un autre fil d'ailleurs), et même pour une personne comme moi, un peu geek et intéressé par les évolutions technologiques, j'ai la sensation qu'on a ouvert la boîte de Pandore... Fin du HS

MSX un jour, MSX toujours !


@granced : Tu as raison, ça n'est pas parfait. On sent bien le coté artificiel encore. Mais l'important c'est pas est-ce que c'est parfait ? Est-ce que ça sonne 100% humain ? Et est-ce que l'on souhaites au fond ?
J'ai l'impression qu'on ne sait plus s'émerveiller de rien, qu'on s'habitue tellement vite à tout...
Il y a 2 ans... juste deux ans... c'était juste un rêve de SF de faire ça.
Quand on pense qu'on avait des modules / Cartouches pour faire de la synthèse vocale syllabique sur nos MSX, et autres, avec le fort accent anglais, et qu'on en arrive là aujourd'hui.... Ahurissant !
Dans mon jeu Poker Brides, que je n'arrêtes pas de refaire avec les évolutions technologiques (MSX), j'avais prévu plusieurs 10aines de méga octets de samples audio dans 5 langues différentes. Je fais quoi moi maintenant avec tout ça ? Les samples ont été fait sur une solution pro d'il y a 5 ou 6 ans... et ca sonnes plus...
Alors je vais me connecter aux API de ChatGPT pour faire un jeu MSX en ligne avec IA ? Ca serait rigolo ça ...
V_fr_04.wav
V_fr_01.wav
V_en_06.wav
V_en_01.wav Edité par ericb59 Le 07/05/2025 à 10h31
J'ai l'impression qu'on ne sait plus s'émerveiller de rien, qu'on s'habitue tellement vite à tout...
Il y a 2 ans... juste deux ans... c'était juste un rêve de SF de faire ça.
Quand on pense qu'on avait des modules / Cartouches pour faire de la synthèse vocale syllabique sur nos MSX, et autres, avec le fort accent anglais, et qu'on en arrive là aujourd'hui.... Ahurissant !
Dans mon jeu Poker Brides, que je n'arrêtes pas de refaire avec les évolutions technologiques (MSX), j'avais prévu plusieurs 10aines de méga octets de samples audio dans 5 langues différentes. Je fais quoi moi maintenant avec tout ça ? Les samples ont été fait sur une solution pro d'il y a 5 ou 6 ans... et ca sonnes plus...
Alors je vais me connecter aux API de ChatGPT pour faire un jeu MSX en ligne avec IA ? Ca serait rigolo ça ...
V_fr_04.wav
V_fr_01.wav
V_en_06.wav
V_en_01.wav Edité par ericb59 Le 07/05/2025 à 10h31
J'ai écouté et je trouve la voix « homme » parfois un peu bizarre.
Ce qui est le plus étrange dans l'échange, c'est que ça ne fait pas vraiment « dialogue ». Il manque un certain rythme.
Mais si le rythme était là (et peut-être un peu d'égalisation dans les niveaux sonores), je serais le premier à m'y laisser prendre.
Quel générateur a été utilisé ? J'ai parcouru ce fil mais je n'ai pas trouvé de mention de celui-ci. Edité par zone Le 07/05/2025 à 19h40
Ce qui est le plus étrange dans l'échange, c'est que ça ne fait pas vraiment « dialogue ». Il manque un certain rythme.
Mais si le rythme était là (et peut-être un peu d'égalisation dans les niveaux sonores), je serais le premier à m'y laisser prendre.
Quel générateur a été utilisé ? J'ai parcouru ce fil mais je n'ai pas trouvé de mention de celui-ci. Edité par zone Le 07/05/2025 à 19h40

zone :
Quel générateur a été utilisé ? J'ai parcouru ce fil mais je n'ai pas trouvé de mention de celui-ci.
Quel générateur a été utilisé ? J'ai parcouru ce fil mais je n'ai pas trouvé de mention de celui-ci.
Parceque je ne l'ai pas indiqué

C'est NoteBookLM
Cette partie audio n'est qu'une fonctionnalité de l'Application, appelée Notebook Overview)
Sinon NoteBookLM est un outil redoutable.
On y balance des tas de documents, de liens , de PDF etc, ensuite on peut lui poser tout un tas de question sur cette documentation. Lui demander des résumés précis etc...
Dans le cadre du MSX je lui ai fournis toute la doc que j'ai trouvé et si j'ai une interrogation je peux lui poser des questions, pour par exemple coder tel ou tel chose, comment fonctionne tel registre, enfin bref... vous voyez l'idée
Merci pour l'info , je connaissais Gemini mais pas l'écosystème derrière.
Je lui ai passé un doc assez technique sur un langage de programmation confidentiel, et j'ai demandé un résumé « journalistique ». J'ai restreint le résumé à un point crucial, et pas évident à saisir, du langage
Ça donne un dialogue analogue à celui que tu as eu pour le reportage Infogrames.
C'est bien fait, mais pas très correct techniquement. Il faudrait que je lui donne des sources complémentaires (le sujet est difficile) pour voir si il s'en sort mieux.
Je le garde pour me résumer les réunions soporifiques
Edité par
zone
Le 08/05/2025 à 11h52
Je lui ai passé un doc assez technique sur un langage de programmation confidentiel, et j'ai demandé un résumé « journalistique ». J'ai restreint le résumé à un point crucial, et pas évident à saisir, du langage
Ça donne un dialogue analogue à celui que tu as eu pour le reportage Infogrames.
C'est bien fait, mais pas très correct techniquement. Il faudrait que je lui donne des sources complémentaires (le sujet est difficile) pour voir si il s'en sort mieux.
Je le garde pour me résumer les réunions soporifiques


L'idéal avec cet outils c'est de poser les question textuellement. Le mode "Notebook Overview" n'est pas spécialement fait pour obtenir un résultat précis à mon avis.

Citation :
Je le garde pour me résumer les réunions soporifiques
Pour ça il y a d'autres outils.
J'ai utilisé Plaud pendant plusieurs formations.
Ça enregistre de façon audio, et ça te ressort dés résumés avec le nom des intervenant (à préciser au début) , des transcriptions, ça te fait même des schéma relationnels.
https://fr.plaud.ai/products/plaud-note-ai-voice-recorder
Je n'en ai plus d'utilité , si ça intéresse quelqu'un il est à vendre !
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie