ALTO-Evolve: IBM Research entwickelt KI-Agenten, die im laufenden Betrieb dazulernen

KI-Agent lernt selbstständig neue Fähigkeiten im laufenden Betrieb

IBM Research setzt einen neuen Maßstab für adaptive KI-Systeme: Mit ALTK-Evolve lernen Agenten nicht vor dem Einsatz – sondern mittendrin. Das könnte die Art, wie Unternehmen KI-Agenten deployieren und warten, grundlegend verändern.

ALTK-Evolve: IBM Research entwickelt KI-Agenten, die im laufenden Betrieb dazulernen

IBM Research hat mit ALTK-Evolve einen Ansatz vorgestellt, bei dem KI-Agenten ihre Fähigkeiten nicht vorab durch aufwändiges Training erwerben, sondern während des produktiven Einsatzes kontinuierlich weiterentwickeln. Das Konzept adressiert eine der zentralen Schwachstellen heutiger Agentensysteme: die fehlende Anpassungsfähigkeit an neue oder unbekannte Aufgaben ohne menschliche Intervention.


Das Grundprinzip: Lernen aus dem laufenden Einsatz

Klassische KI-Agenten werden mit einem festen Werkzeugkasten und definierten Fähigkeiten ausgeliefert. Stoßen sie auf Aufgaben außerhalb dieses Rahmens, scheitern sie – oder benötigen kostspielige Nachtraining-Zyklen. ALTK-Evolve verfolgt einen anderen Weg:

Der Agent analysiert selbstständig, welche Fähigkeiten ihm für eine gegebene Aufgabe fehlen, entwickelt neue Tools oder Workflows – und speichert diese für künftige Einsätze ab.

Der Mechanismus basiert auf einem iterativen Prozess: Der Agent versucht eine Aufgabe, bewertet das Ergebnis, identifiziert Lücken in seinem Repertoire und generiert neuen Code oder neue Prozessketten, um diese Lücken zu schließen. Erfolgreiche Erweiterungen werden in einer Tool-Bibliothek persistiert und stehen fortan auch für andere Aufgaben zur Verfügung.


Automatisierte Tool-Generierung als Kernmechanismus

Technisch stützt sich ALTK-Evolve auf die Fähigkeit moderner Large Language Models, funktionsfähigen Code zu erzeugen. Der Agent nutzt diese Kapazität nicht nur zur Aufgabenlösung, sondern explizit zur Selbsterweiterung: Neu generierte Tools werden automatisch getestet, validiert und bei positiver Bewertung in den Agenten integriert.

Dieser Prozess läuft ohne menschliche Eingriffe ab – ein wesentlicher Unterschied zu herkömmlichen Deployment-Modellen, bei denen neue Fähigkeiten durch Entwickler implementiert und im nächsten Release-Zyklus ausgerollt werden müssen.

IBM Research bezeichnet das als „On-the-Job Learning” – in Anlehnung an das praktische Erfahrungslernen menschlicher Mitarbeiter im Arbeitsalltag.


Leistungsverbesserung über Zeit

Laut den Forschern zeigen frühe Evaluierungen, dass Agenten auf Basis von ALTK-Evolve ihre Erfolgsraten bei komplexen, mehrstufigen Aufgaben über successive Einsatzzyklen messbar verbessern. Je mehr unterschiedliche Aufgaben ein Agent bearbeitet, desto breiter wird seine Tool-Bibliothek – und desto seltener muss er auf Problemlösungen von Grund auf zurückgreifen.

Die Architektur legt besonderen Wert auf Sicherheitsmechanismen: Automatisch generierter Code durchläuft Sandbox-Tests, bevor er in die Agenten-Umgebung integriert wird. Unkontrolliertes Selbstmodifizieren – ein klassisches Bedenken bei adaptiven Systemen – soll dadurch eingegrenzt werden.


Einordnung für deutsche Unternehmen

Für Unternehmen, die KI-Agenten in operativen Prozessen einsetzen oder planen, ist der ALTK-Evolve-Ansatz aus mehreren Gründen relevant:

  • Weniger Entwicklungsaufwand: Ein Agent, der eigenständig neue Fähigkeiten erwirbt, bindet weniger IT-Ressourcen für Wartung und Erweiterung.
  • Praxisnähe: Das Modell adressiert direkt Betriebe, in denen Aufgabenspektren nicht vollständig vorab definierbar sind.
  • Governance-Pflicht: In regulierten Branchen – Finanzdienstleistungen, Gesundheitswesen, Industrie – stellen sich dringende Kontrollfragen: Welche Mechanismen greifen, wenn ein Agent eigenständig neue Werkzeuge entwickelt und einsetzt?

IBM Research hat hier erste Antworten geliefert – eine praxistaugliche Absicherung für den Enterprise-Einsatz erfordert jedoch weitere Arbeit.

Unternehmen sollten das Thema aktiv beobachten und erste Pilotprojekte mit klaren Audit- und Rollback-Mechanismen ausstatten.


Quelle: IBM Research / HuggingFace Blog

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *