KI bringt sich selbst das Multitasking bei auf einem sich ständig weiterentwickelnden Spielplatz bei

Künstliche Intelligenz KI hat schon geschlagendie weltbesten menschlichen Spieler bei Schach, Go und anderen Spielen. Jetzt ist DeepMindTraining der Systeme um viele verschiedene Spiele zu spielen, ohne menschliche Interaktionsdaten zu benötigen, verrät aneuer Blog von der Firma.

"Wir haben eine riesige Spielumgebung namens XLand geschaffen, die viele Multiplayer-Spiele in konsistenten, für den Menschen relevanten 3D-Welten umfasst. Diese Umgebung ermöglicht es, neue Lernalgorithmen zu formulieren, die dynamisch steuern, wie ein Agent trainiert und auf welchen Spielenes trainiert", schrieb DeepMind.

"Die Fähigkeiten des Agenten verbessern sich iterativ als Reaktion auf die Herausforderungen, die im Training auftreten, wobei der Lernprozess die Trainingsaufgaben ständig verfeinert, sodass der Agent nie aufhört zu lernen. Das Ergebnis ist ein Agent mit der Fähigkeit, in einem breiten Spektrum von Erfolgen zu bestehenAufgaben — von einfachen Objektfindungsproblemen bis hin zu komplexen Spielen wie Verstecken und Erobern der Flagge, die während des Trainings nicht aufgetreten sind."

Was bedeutet das für KI? Es bedeutet, dass neue Agenten geschaffen werden können, die Verhaltensweisen zeigen, die auf viele Aufgaben breit anwendbar sind und nicht auf eine einzelne Aufgabe spezialisiert sind, was bedeutet, dass sie sich schnell an sich ständig ändernde Umgebungen anpassen könnenein Mangel an Trainingsdaten und sagen hallo zu Agenten, die für sich selbst lernen, was Reinforcement Learning neu definiert.

Wie hat DeepMind das erreicht? Sie generierten dynamische Aufgaben, die weder zu schwer noch zu leicht, aber genau richtig zum Training. "Wir nutzen dann bevölkerungsbezogenes Training PBT, um die Parameter der dynamischen Aufgabengenerierung basierend auf einer Fitness anzupassen, die darauf abzielt, die allgemeine Fähigkeit der Agenten zu verbessern. Und schließlich Wir verketten mehrere Trainingsläufe, damit jede Agentengeneration die vorherige Generation booten kann", schrieb DeepMind.

Die Studie heißt "Offenes Lernen führt zu allgemein fähigen Agenten" und ist in einer Vordruckversion verfügbar.

KI bringt sich selbst das Multitasking bei auf einem sich ständig weiterentwickelnden Spielplatz bei

Bleiben Sie über die neuesten technischen Nachrichten auf dem Laufenden

Gesponserte Geschichten

empfohlen

Air Force Veteran verwandelt Flugzeuge aus dem Zweiten Weltkrieg in ein Flugzeug RV

Es gibt eine Bitcoin-Party in El Salvador und alle sind eingeladen

Air-Taxi-Startup will Vororte und Städte mit neuen Starrflüglern verbinden

Mit Tieren sprechen: KI verwenden, um die Sprache der Wale zu entschlüsseln