Neuronales Netz beschreibt Videomaterial in Echtzeit

Wacklige Videoaufnahmen von normalen alltäglichen Dinge – eine Tür wird ein Boot in einen Kanal, Fahrräder – angedockt während eines Mannes Spaziergang durch ein Amsterdam Straße gezeigt. In der linken oberen Ecke des Bildschirms wird Text angezeigt, die Bürgersteig Sehenswürdigkeiten beschreiben.

Der Text im Video von US-Künstler und Programmierer Kyle McDonald wurde durch ein neuronales Netzwerk in Echtzeit generiert. McDonalds-Netzwerk–die von einem System namens NeuralTalk entwickelt von Stanford-Doktorandin Andrej Karpathy beruhte–live-Webcam-Aufnahmen vom Laptop analysiert und dann überträgt, was es in Textform zu sehen ist.

Das EDV-System-Beschreibungen sind genauer als andere. Zum Beispiel beschrieben das Netzwerk einen Mann trägt einen Hut Baseball und einen Hot Dog Essen, als „Mann in Anzug und Krawatte ein Getränk halten.“

Trotz der Fehler macht, ist dieses Video-basierten System Teil einer Welle neuer Computer-Software, die Bilder mit Genauigkeit in der Nähe von Menschen interpretieren kann.

Was ist ein Beispiel, das meisten Menschen vertraut sein würde? Wenn Sie ein Foto in Facebook hochladen, hilft Gesichtserkennung-Software Ihnen, Ihre Freunde zu kennzeichnen.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *