Ein Bot kann jetzt zeichnen, was ihr ihm beschreibt

In Sensationsmeldungen heißt es ja immer wieder, dass künstliche Intelligenz und Bots aller Art heute zum Beispiel Musik komponieren, so wie es Alex da Kid 2016 mit einem Programm und dem Song „Not Easy“ getan hat. Oder, dass sie Kurzgeschichten und wirre Harry-Potter-Fortsetzungen verfassen. Damit sei es nur noch eine Frage der Zeit, bis das Kreativitäts- und Kunstmonopol des Menschen Opfer der kapitalistischen Automatisierungsgeschichte wird. Jetzt, so heißt es aus Microsofts Research Labs, könne ein Bot realistische Bilder anhand von individuellen Texten erstellen, wie sie etwa in Captions verwendet werden.

Der „Drawing Bot“ hätte eine Bandbreite „from ordinary pastoral scenes, such as grazing livestock, to the absurd, such as a floating double-decker bus.“ Dabei würden die erstellten Bilder auch immer Inhalte aufweisen, die nicht aus dem Text generiert werden. Das bedeute, der Bot hätte eine „artificial imagination“. Der Projektleiter Xiaodong He sagt: „Wenn du auf Bing nach einem Vogel suchst, bekommst du ein Vogelbild. Aber hier sind die Bilder computergeneriert, Pixel für Pixel“.

Screenshot Research Paper
Screenshot Research Paper

Wie man sehen kann, sind die Ergebnisse des Research Papers recht beeindruckend. Mit dem Projekt wurde ein Forschungszyklus abgeschlossen, an dessen Anfang der Caption Bot stand – ein Programm, dass automatisch Captions zu Bildern verfasst. Der Bot ist bereits für User nutzbar und macht seine Sache ordentlich:

Ausschnitt aus einem Super-Bowl-Werbespot mit Morgan Freeman – so, wie Caption Bot ihn sieht

 

Jedoch hat auch dieses Programm an der einen oder anderen Stelle noch einiges zu lernen:

Das letzte Bild veranschaulicht auch beispielhaft, welches Problem beim Machine Learning immer noch immanent ist: Das Programm lernt zwar aus einem immer größer werdeneden Pool an Daten Zusammenhänge zwischen Objekt und Beschreibung. Fehler wie der obige werden also mit der Zeit immer geringer. Kognitive Prozesse aber, um etwa vielschichtige Kontexte zu erkennen, sind extrem komplex. Der Mensch steht also in den meisten dieser Sensationsmeldungen über kreative AI immer noch als kuratierendes Element dahinter.

Konkret: Ja, es gibt Programme, die zusammenhängende Sätze ausspucken können. Literaturpreise gewinnen sie jedoch erst, wenn ein Mensch sie in einen sinnvollen Zusammenhang bringt. Und auch beim Song „Not Easy“ zeigt sich bei näherem Hinsehen, dass es sich dabei eher um ein datengestütztes Songwriting da Kids handelte, als um tatsächlich datengeschriebenes.

Vielleicht mag es irgendwann soweit kommen, dass wir zwischen den Fähigkeiten von Maschinen oder Computern und Menschen nicht mehr unterscheiden können. Bis dahin aber sind unsere Jobs noch safe. Und selbst wenn nicht, das wäre vielleicht gar nicht so schlimm.


Business Punk Redaktion

Hier schreibt die Business-Punk-Redaktion. Mal er, mal sie, mal gar keiner. Ach und kauft unser Heft! Danke.

Zum Autor

Das können wir Dir auch empfehlen

placeholder
placeholder
placeholder