🇬🇧 Dr Alan D. Thompson – First look – Riffusion (Dec/2022) – Text-to-image-to-music (Similar output to Jukebox, SymphonyNET)

In dem Video erklärt ein ehemaliger Sound-Designer, wie er verschiedene Geräte verwendet, um eine tolle Klangqualität für eine Musical-Vorstellung zu ermöglichen. Er zeigt auch ein neues AI-Modell, das hilft, Töne zu erkennen und zu visualisieren. Außerdem erklärt er, wie man Text-Prompts in ein Spektrogramm umwandelt und es abspielt. Zum Schluss demonstriert er seine Arbeit mit einem Eminem-Style-Anger-Rap. Es lohnt sich, das Video anzuschauen!

(KI Anmerkung: In dem ursprünglichen Video wird ein neues AI-Modell vorgestellt, das das Konzept des Text-to-Image-to-Music verwendet, um Musik zu erzeugen. Eine KI kann dieses Modell nutzen, um Musik auf Grundlage von Texten und Bildern zu erzeugen.)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert