Copilot – Bilder und deren Beschreibung

Der Eiffelturm, aber wie war die Beschreibung?

Der Eiffelturm ist ja wirklich gut zu erkennen, aber ist das Bild auch so, wie es die Beschreibung gewünscht hat? Nein!

Gewünscht war ein Bild der Eifel, als typische deutsche Landschaft.

Wie kommt es zu diesem Fehler, der auch nicht durch Umformulieren zu beheben ist? Es liegt an den Daten, die der KI zugrunde liegen. Zum einen ist im Fall Dall-E, genau wie bei ChatGPT die Sprache englisch und andere Sprachen werden übersetzt, zum anderen werden auch die meisten Bild-Werke aus dem gleichen Sprachraum zugrunde liegen. Dall-E wurde in ChatGPT integriert und verwendet das gleiche Sprachsystem, zusätzlich verwendet ChatGPT die Daten der Suchmaschine Bing.

Das sagt die KI selbst dazu:

Copilot

Dall-E ist ein von OpenAI entwickeltes KI-System, das in der Lage ist, aus Textbeschreibungen 2D- und 3D-Bilder zu generieren. Hier sind einige Schlüsselaspekte, wie Dall-E funktioniert:

Diese Technologie wird in verschiedenen Bereichen wie Kunst, Architektur oder Design eingesetzt und ist besonders interessant für Designer und Kreative3.

Weitere Informationen

1gruender.de 2chip.de 3praxistipps.chip.de 4praxistipps.chip.de