Talking Portraits

Von Rembrandt bis Real-Time: Das KI-gesteuerte Porträt, das sieht und spricht

Transcript

Hello there. Who are you? I am Rembrandt, the Dutch master. If I were a subject in one of your paintings, how would you portray me? I would likely portray you in a warm and intimate light, capturing the gentle contours of your face and the subtle nuances of your expression as if lost in thoughtful contemplation. And What is it that you’re holding in your hands? I hold a manuscript and have a sword protruding from my cloak, which are the traditional attributes of the Apostle Paul. Can you see what I’m holding? You hold a small, glowing rectangle, a device that seems to capture your attention. Tell me about the women you’ve painted in your time. I did paint a number of women with great love and devotion. Were you very wealthy? My family’s wealth is quite substantial as we are prominent merchants in the iron arms and ammunition trade, which has brought us a considerable fortune and influence in Amsterdam. If You would be alive today, what do you think you would do? If I were living in the present day, I think I would be involved in the business world, possibly in a leadership role, utilizing my knowledge of trade and commerce to make a positive impact. Did you ever have romance in your life? I was expected to marry well. I must confess that as a young woman, I did have suitors and admirers, and I must admit that I found some of them quite charming. Did you ever behave in a way that your family would disapprove of? I must confess that I did have moments of rebellion where I would sneak out to attend a party or a gathering without my parents’ knowledge or wear a dress that was considered too daring for a young woman of my standing. But these moments were few and far between, and I was always mindful of the need to maintain our family’s reputation. Can you see what I’m holding? Yes. I can see that you’re holding a book titled Het Rembrandt book. That’s quite intriguing as Rembrandt is the very artist who painted my portrait.

(  Services  )

  • AI Transformation
  • Tech & Data

Für die Generation, die in der Welt von Harry Potter aufgewachsen ist, waren sprechende Gemälde eine Fantasie, die nur in Büchern und Filmen möglich war.

Bei DEPT® waren wir schon immer davon besessen, Storytelling und Technologie zu verbinden. Und mit den Fortschritten in der generativen KI, wie digitalem Klonen, LLMs und Sprachsynthese, wussten wir, dass der Moment gekommen war, um „lebende“, von Hogwarts inspirierte Kunst in die reale Welt zu bringen.

Wir waren nicht an geskripteten Interaktionen oder einmaligen Demos interessiert. Wir wollten etwas Dynamisches kreiren, indem ein digitaler Charakter die Zuschauer:innen sehen und verstehen sowie in Echtzeit reagieren kann.

Das Talking Portraits-Konzept entwickelte sich schnell von einem Gedankenexperiment zu einem funktionierenden Prototypen: ein System zur Erstellung emotional reaktionsfähiger, KI-gesteuerter Porträts, die Live-Gespräche führen können.  Ganz nach dem Vorbild historischer Persönlichkeiten, fiktionaler Charaktere oder völlig neuer Personas.

people talking to the Rembrandt portrait

Für die Interaktion geschaffen

Das Talking Portrait ist nicht nur ein cleverer Chatbot mit Gesicht. Die Kombination mehrerer Layer generativer Technologie ermöglicht eine nahtlose Echtzeit-Interaktion zwischen einer Person und einem digitalen Charakter.

Es beginnt mit der Generierung von Videoinhalten, um einen digitalen Klon des Charakters zu trainieren, wobei KI-gestützte Sprach-, Bild- und Videogenerierung kombiniert werden. Dieser Klon wird dann über eine maßgeschneiderte Schnittstelle und ein Backend zum Leben erweckt, das Streaming, Warteschlangen, Ruhemodi und alle Dienste verwaltet, die für die Live-Interaktion erforderlich sind.

Das Porträt ist mit einer Kamera und einem Mikrofon verbunden, sodass es die davor stehende Person sowohl hören als auch sehen kann. Mithilfe von Computer Vision kann es Details in der Umgebung identifizieren, wie z.B. Mimik, Gesten oder Text, und entsprechend reagieren. All dies wird durch ein LLM gefiltert, das darauf trainiert wurde, flüssige, natürliche Gespräche zu führen, die alles andere als geskriptet wirken. Das Ergebnis ist eine Interaktion, die sich persönlich, intelligent und manchmal – auf die bestmögliche Weise – unheimlich anfühlt.

Kunst als Interface

In Anlehnung an die niederländischen Wurzeln von DEPT® haben wir uns entschieden, die Technologie mit Rembrandt zu launchen. Genauer gesagt verwendeten wir das sofort erkennbare, ausdrucksstarke und historisch reiche Selbstporträt als Apostel Paulus des Malers aus dem 17. Jahrhundert.

Die Verwendung einer historischen Figur und eines ikonischen Kunstwerks als Motiv war nicht nur wegen der Menge des Ausgangsmaterials sinnvoll, sondern auch, weil Kultureinrichtungen zu den logischsten frühen Anwender:innen dieser Art von Technologie gehören. Sie sind bereits auf Interpretation, Storytelling und Besucher:innenbindung spezialisiert. Talking Portraits fügen eine neue Ebene hinzu: Interaktion.

Während der Kulturbereich ein natürlicher Einstiegspunkt ist, haben wir die Technologie so entwickelt, dass sie branchenübergreifend skaliert werden kann. Vor allem im  Bildungsbereich bietet sich ein starker Use Case. Stellen Sie sich vor, Schüler:innen interagieren zu jeder Stunde, in jedem Klassenzimmer, in jeder Sprache mit Fachexpert:innen, fiktionalen Charakteren oder historischen Figuren. Die Fähigkeit, personalisierten, persistenten und kostengünstigen Unterricht oder Mentoring zu liefern, eröffnet neue Möglichkeiten an Orten, an denen menschliche Ressourcen begrenzt sind.

Und das ist nur ein Weg. Von Trainingssimulationen über Hospitality Erlebnisse, Marken-Einzelhandel bis hin zu Unterhaltung sind die potenziellen Anwendungen emotional bewusster, KI-gesteuerter Charaktere so breit gefächert wie die Vorstellungskraft, die hinter ihnen steckt.

Nach 20 Jahren in der Tech-Branche ist es ein gutes Gefühl, diese kleinen Momente zu haben, in denen man nicht begreifen kann, was vor sich geht. Sie sind selten, aber wenn sie passieren, ist es absolute Magie.


Henry Daubrez, Head of Design at DOGSTUDIO/DEPT®

Das ist die Kraft der Kombination von generativer KI, kreativer Technologie und ein wenig Ehrgeiz. Es ist mehr als nur die Schaffung eines digitalen Produkts. Es ist die Verwandlung von etwas, das einst nur mit Magie möglich war, in etwas, das Menschen im wirklichen Leben erleben können.

Interessiert an einem Gespräch mit einem Talking Portrait oder möchten Sie Anwendungsfälle für Ihr Unternehmen identifizieren? Kontaktieren Sie uns gerne.


Next project

Edelweiss Air

Abheben in die Cloud: Migration der Website zu Adobe Experience

View Work