Werbung

KI bringt sich selbst das Multitasking bei auf einem sich ständig weiterentwickelnden Spielplatz bei

Der Spielplatz ist eine riesige Spielumgebung namens XLand, die auch von KI verändert wird.

Künstliche Intelligenz KI hat schon geschlagendie weltbesten menschlichen Spieler bei Schach, Go und anderen Spielen. Jetzt ist DeepMindTraining der Systeme um viele verschiedene Spiele zu spielen, ohne menschliche Interaktionsdaten zu benötigen, verrät aneuer Blog von der Firma.

"Wir haben eine riesige Spielumgebung namens XLand geschaffen, die viele Multiplayer-Spiele in konsistenten, für den Menschen relevanten 3D-Welten umfasst. Diese Umgebung ermöglicht es, neue Lernalgorithmen zu formulieren, die dynamisch steuern, wie ein Agent trainiert und auf welchen Spielenes trainiert", schrieb DeepMind.

"Die Fähigkeiten des Agenten verbessern sich iterativ als Reaktion auf die Herausforderungen, die im Training auftreten, wobei der Lernprozess die Trainingsaufgaben ständig verfeinert, sodass der Agent nie aufhört zu lernen. Das Ergebnis ist ein Agent mit der Fähigkeit, in einem breiten Spektrum von Erfolgen zu bestehenAufgaben — von einfachen Objektfindungsproblemen bis hin zu komplexen Spielen wie Verstecken und Erobern der Flagge, die während des Trainings nicht aufgetreten sind."

Was bedeutet das für KI? Es bedeutet, dass neue Agenten geschaffen werden können, die Verhaltensweisen zeigen, die auf viele Aufgaben breit anwendbar sind und nicht auf eine einzelne Aufgabe spezialisiert sind, was bedeutet, dass sie sich schnell an sich ständig ändernde Umgebungen anpassen könnenein Mangel an Trainingsdaten und sagen hallo zu Agenten, die für sich selbst lernen, was Reinforcement Learning neu definiert.

Wie hat DeepMind das erreicht? Sie generierten dynamische Aufgaben, die weder zu schwer noch zu leicht, aber genau richtig zum Training. "Wir nutzen dann bevölkerungsbezogenes Training PBT, um die Parameter der dynamischen Aufgabengenerierung basierend auf einer Fitness anzupassen, die darauf abzielt, die allgemeine Fähigkeit der Agenten zu verbessern. Und schließlich Wir verketten mehrere Trainingsläufe, damit jede Agentengeneration die vorherige Generation booten kann", schrieb DeepMind.

Werbung

Die Studie heißt "Offenes Lernen führt zu allgemein fähigen Agenten" und ist in einer Vordruckversion verfügbar.

Folgen Sie uns auf

Bleiben Sie über die neuesten technischen Nachrichten auf dem Laufenden

Geben Sie einfach Ihre E-Mail ein und wir kümmern uns um den Rest :

Mit der Anmeldung stimmen Sie unseren zuNutzungsbedingungen und Datenschutzrichtlinie. Sie können sich jederzeit abmelden.