Künstliche Intelligenz KI hat schon geschlagendie weltbesten menschlichen Spieler bei Schach, Go und anderen Spielen. Jetzt ist DeepMindTraining der Systeme um viele verschiedene Spiele zu spielen, ohne menschliche Interaktionsdaten zu benötigen, verrät aneuer Blog von der Firma.
"Wir haben eine riesige Spielumgebung namens XLand geschaffen, die viele Multiplayer-Spiele in konsistenten, für den Menschen relevanten 3D-Welten umfasst. Diese Umgebung ermöglicht es, neue Lernalgorithmen zu formulieren, die dynamisch steuern, wie ein Agent trainiert und auf welchen Spielenes trainiert", schrieb DeepMind.
"Die Fähigkeiten des Agenten verbessern sich iterativ als Reaktion auf die Herausforderungen, die im Training auftreten, wobei der Lernprozess die Trainingsaufgaben ständig verfeinert, sodass der Agent nie aufhört zu lernen. Das Ergebnis ist ein Agent mit der Fähigkeit, in einem breiten Spektrum von Erfolgen zu bestehenAufgaben — von einfachen Objektfindungsproblemen bis hin zu komplexen Spielen wie Verstecken und Erobern der Flagge, die während des Trainings nicht aufgetreten sind."
Was bedeutet das für KI? Es bedeutet, dass neue Agenten geschaffen werden können, die Verhaltensweisen zeigen, die auf viele Aufgaben breit anwendbar sind und nicht auf eine einzelne Aufgabe spezialisiert sind, was bedeutet, dass sie sich schnell an sich ständig ändernde Umgebungen anpassen könnenein Mangel an Trainingsdaten und sagen hallo zu Agenten, die für sich selbst lernen, was Reinforcement Learning neu definiert.
Wie hat DeepMind das erreicht? Sie generierten dynamische Aufgaben, die weder zu schwer noch zu leicht, aber genau richtig zum Training. "Wir nutzen dann bevölkerungsbezogenes Training PBT, um die Parameter der dynamischen Aufgabengenerierung basierend auf einer Fitness anzupassen, die darauf abzielt, die allgemeine Fähigkeit der Agenten zu verbessern. Und schließlich Wir verketten mehrere Trainingsläufe, damit jede Agentengeneration die vorherige Generation booten kann", schrieb DeepMind.
Die Studie heißt "Offenes Lernen führt zu allgemein fähigen Agenten" und ist in einer Vordruckversion verfügbar.