Agenten im Einsatz
Was KI-Agenten heute schon in Unternehmen verändern.
Wenn Bedienoberflächen zu APIs werden
Wenn Sie nur eine Minute haben
Diese Woche wird sichtbar, wohin sich KI-Agenten real bewegen: weg vom „Chat“ und hin zur Ausführung. Nicht als nette Assistenz, sondern als operative Schicht, die sich durch bestehende Software klickt, Aufgabenketten abarbeitet und Ergebnisse zurückliefert.
Das ist mehr als ein Produkt-Update. Wenn „Computer Use“ nativ in ein Modell wandert, wird jede Benutzeroberfläche plötzlich zu einer Art API. Und wenn gleichzeitig Benchmarks entstehen, die reale Desktop-Aufgaben messen, und Cloud-Zertifizierungen von „AI Engineer“ auf „Apps and Agents“ umschwenken, dann ist klar: Der Markt rechnet mit Agenten als regulärem Bestandteil von Unternehmenssoftware.
Aufmerksam werden sollten jetzt vor allem Geschäftsführer, Revenue- und Service-Leader sowie Innovationsverantwortliche, die operative Durchlaufzeiten, Qualität und Compliance verantworten. Agenten sind dabei nicht primär ein Effizienzthema, sondern ein Ownership-Thema: Wer trägt Verantwortung, wenn Workflows teilautonom laufen?
Wer diese Entwicklung ignoriert, verpasst nicht nur Produktivität. Er riskiert, dass Agenten „inoffiziell“ in Teams Einzug halten, ohne messbare Qualität, ohne klare Grenzen und ohne Governance. Dann wird Automatisierung nicht zur Skalierung, sondern zur neuen Fehlerquelle.
Diese Entwicklungen sollten Sie nicht übersehen
Google integriert „Computer Use“ nativ in Gemini 3.5 Flash und öffnet damit eine Agenten-Plattform für Langzeit-Automation über Browser, Mobile und Desktop
Was passiert ist
Google kündigt „Computer Use“ als native Funktion in Gemini 3.5 Flash an. Der Kern: Das Modell kann Interaktionen über Computeroberflächen ausführen, also nicht nur antworten, sondern über Anwendungen hinweg handeln.
Warum das wichtig ist
Damit verschiebt sich die Integrationslogik. Unternehmen müssen nicht mehr darauf warten, dass jede Anwendung eine perfekte Schnittstelle anbietet. Agenten können sich prinzipiell durch bestehende Tools bewegen. Das senkt die Eintrittshürde für End-to-End-Automation, erhöht aber die Anforderungen an Kontrolle, Stabilität und Nachvollziehbarkeit.
Strategisch heißt das: Agenten werden zu einer neuen „Execution Layer“ über Ihrer Applikationslandschaft. Wer diese Schicht besitzt und steuert, kontrolliert Geschwindigkeit und Risiko der Automatisierung.
Wo der Einsatz konkret wird
Dort, wo Prozesse heute an UI-Schritten zerbrechen: wiederkehrende Prüfungen, Tests, Routine-Knowledge-Work, Zusammenführen von Informationen aus mehreren Systemen, Abarbeitung von Checklisten. Der entscheidende Punkt ist nicht die einzelne Aufgabe, sondern die Fähigkeit, längere Sequenzen über mehrere Oberflächen hinweg robust auszuführen.
Wer dadurch Hebel bekommt
Operations-Teams, die Durchlaufzeiten senken müssen. Produkt- und Engineering-Teams, die Automatisierung schneller pilotieren können, ohne monatelange Systemintegration. Und alle, die Prozessqualität messen können, weil sie die Ausführung instrumentieren.
Wer jetzt unter Druck gerät
Organisationen, die Automatisierung weiterhin als „ein paar Makros“ behandeln. Und alle Verantwortlichen, die glauben, ein Agent sei nur eine UI für ein Modell. Wenn Agenten handeln, brauchen Sie klare Regeln: Was darf autonom laufen, was muss freigegeben werden, und wie werden Abweichungen erkannt?
Microsoft ersetzt Azure AI Engineer Associate (AI-102) durch neue Azure AI Apps and Agents Developer Associate (AI-103) Zertifizierung
Was passiert ist
Microsoft richtet eine zentrale Azure-Zertifizierung neu aus: Aus „Azure AI Engineer Associate (AI-102)“ wird „Azure AI Apps and Agents Developer Associate (AI-103)“. Der Fokus verschiebt sich explizit auf Apps und Agenten.
Warum das wichtig ist
Das ist ein Signal für Industrialisierung. Zertifizierungen sind keine Spielerei, sondern ein Mechanismus, mit dem Skills, Rollenprofile und Qualitätsstandards in Unternehmen verankert werden. Wenn ein Hyperscaler „Agents“ als Kernkompetenz definiert, wird agentisches Bauen vom Spezialprojekt zur erwartbaren Fähigkeit in Teams.
Für Entscheider bedeutet das: Der Engpass verschiebt sich von „Haben wir ein Modell?“ zu „Haben wir die Fähigkeit, agentische Workflows sicher zu entwickeln, zu betreiben und zu auditieren?“
Wo der Einsatz konkret wird
In der Übersetzung von Business-Prozessen in agentenfähige Anwendungen: Workflows, die nicht nur Text generieren, sondern Systeme orchestrieren. Dazu gehören unternehmensnahe Aufgabenketten, die über mehrere Tools laufen und verlässliche Ergebnisse liefern müssen, damit sie produktiv werden.
Wer dadurch Hebel bekommt
IT- und Plattform-Teams, die Standards setzen können: Entwicklungsleitplanken, Freigabeprozesse, Monitoring. Und Business-Funktionen, die nicht nur „Anforderungen“ formulieren, sondern gemeinsam mit IT agentenfähige Prozessdesigns entwickeln.
Wer jetzt unter Druck gerät
Unternehmen, die Agenten als Shadow-IT tolerieren. Wenn Skills standardisiert werden, wird auch sichtbar, wer ohne Standards arbeitet. Ebenso geraten Rollenbilder unter Druck, die „AI“ als reines Data-Science-Thema behandeln, statt als Software- und Prozessdisziplin.
Neue Salesforce-Studie: Adoption von KI-Service-Agenten steigt in einem Jahr von 39 % auf 66 % und skaliert Kundenzufriedenheit
Was passiert ist
Salesforce berichtet, dass die Adoption von KI-Service-Agenten innerhalb eines Jahres von 39 % auf 66 % gestiegen ist und dass diese Agenten Kundenzufriedenheit (CSAT) skalieren.
Warum das wichtig ist
Service ist der Bereich, in dem Agenten den Sprung in die Fläche schaffen, weil drei Dinge zusammenkommen: hohe Volumina, klare Prozessschritte, messbare Outcomes. Wenn Adoption in dieser Geschwindigkeit wächst, ist das ein Reifegrad-Indikator: Agenten werden nicht mehr nur getestet, sie werden betrieben.
Und: Kundenzufriedenheit als Outcome ist ein härteres Kriterium als „Zeitersparnis“. Das zwingt zu besseren Workflows, besserer Wissensbasis und besserer Eskalationslogik.
Wo der Einsatz konkret wird
In Support-Prozessen mit wiederkehrenden Anliegen, Triage, Standardlösungen, Übergaben an Menschen. Entscheidend ist dabei nicht, dass ein Agent antwortet, sondern dass er den Fall bis zur sinnvollen Entscheidung vorantreibt: Informationen sammeln, Kontext herstellen, nächste Schritte vorbereiten.
Wer dadurch Hebel bekommt
Service-Leader, die erstmals skalierbar Qualität und Geschwindigkeit gleichzeitig adressieren können. Auch Revenue-Teams profitieren indirekt, weil Service-Erlebnis und Reaktionszeit in vielen B2B-Kontexten Renewal und Expansion beeinflussen.
Wer jetzt unter Druck gerät
Support-Organisationen, die weiterhin nur nach Headcount skalieren. Und Teams, die Wissensmanagement als nachgelagerte Dokumentation behandeln. Agenten machen Wissensqualität zur operativen Infrastruktur.
Nudge startet agentische Commerce-Plattform für Marken und sichert 1,1 Mio. USD Pre-Seed-Finanzierung
Was passiert ist
Nudge meldet den Launch einer agentischen Commerce-Plattform für Consumer Brands und kommuniziert eine Pre-Seed-Finanzierung über 1,1 Mio. USD.
Warum das wichtig ist
Hier entsteht eine neue Kanal-Logik: Agenten als Vermittler zwischen Marke und Kaufentscheidung. Nicht als Werbemittel, sondern als Empfehlungsschicht, die Sichtbarkeit, Auswahl und Conversion beeinflusst. Das ist für Marken strategisch, weil es den klassischen Funnel unter Druck setzt: Wenn Agenten entscheiden helfen, zählt nicht nur Kreativität, sondern Maschinenlesbarkeit und Angebotslogik.
Wo der Einsatz konkret wird
Im Handel und Marketing dort, wo Empfehlungen, Sortimentslogik und Umsatzoptimierung zusammenlaufen. Wenn eine Plattform agentisch arbeitet, geht es um automatisierte Interaktion mit Produktinformationen, Angebotsvarianten und Entscheidungskriterien, die nicht mehr ausschließlich über menschliche Klickpfade laufen.
Wer dadurch Hebel bekommt
Marketing- und E-Commerce-Teams, die früh lernen, ihre Produkt- und Markeninformationen so zu strukturieren, dass sie in agentischen Empfehlungssystemen bestehen. Wer seine Daten, Claims und Varianten sauber im Griff hat, erhöht die Wahrscheinlichkeit, „gewählt“ zu werden.
Wer jetzt unter Druck gerät
Organisationen, die Sichtbarkeit noch immer primär als Media-Budget-Problem betrachten. In agentischen Kanälen wird „Budget“ durch „Verständlichkeit und Entscheidungslogik“ ergänzt. Das ist unbequemer, weil es interne Daten- und Prozessarbeit erfordert.
Windows Agent Arena stellt skalierbare Open-Source-Benchmark-Plattform für Multi-Modal-Desktop-KI-Agenten im Windows-OS vor
Was passiert ist
Windows Agent Arena (WAA) wird als skalierbare, Open-Source-Plattform angekündigt, um Multi-Modal-Desktop-Agenten unter Windows zu testen und zu benchmarken, mit über 150 realen Desktop-Aufgaben und cloud-skalierten Auswertungen.
Warum das wichtig ist
Benchmarks klingen akademisch, sind aber operative Realität: Sie entscheiden, ob ein Agent im Unternehmen als „Pilot“ stecken bleibt oder produktionsfähig wird. Wenn reale Desktop-Aufgaben systematisch gemessen werden, wird Zuverlässigkeit vergleichbar. Und damit wird Governance möglich: Sie können definieren, welche Fehlerquoten akzeptabel sind, welche Aufgaben agentenfähig sind und wo menschliche Aufsicht zwingend bleibt.
Wo der Einsatz konkret wird
Überall, wo Windows-Desktops Teil der Wertschöpfung sind: administrative Prozesse, Tests, wiederkehrende Office-nahe Abläufe, toolübergreifende Tätigkeiten. Entscheidend ist der Fokus auf „reale Aufgaben“ statt künstliche Demos.
Wer dadurch Hebel bekommt
Teams, die Verantwortung für Qualität und Risiko tragen: IT, Security, Compliance, aber auch Prozessverantwortliche, die endlich belastbare Kriterien bekommen, wann „Autonomie“ vertretbar ist. Gleichzeitig profitieren Anbieter und interne Entwickler, die ihre Agenten gegen messbare Aufgaben verbessern können.
Wer jetzt unter Druck gerät
Alle, die Agenten nach Bauchgefühl freigeben oder ablehnen. Benchmarks machen Ausreden teuer: Entweder Sie messen, oder Sie steuern blind. Und blind heißt in agentischen Workflows: unklare Haftung, unklare Qualität, unklare Eskalation.
Was das für den Einsatz von KI-Agenten bedeutet
Das Wochenmuster ist eindeutig: Agenten werden als ausführende Systeme ernst genommen. „Computer Use“ bringt die Fähigkeit zur Interaktion mit Oberflächen näher an den Standard. Zertifizierungen verschieben Skills in Richtung „Apps und Agents“. Benchmarks versuchen, Desktop-Autonomie messbar zu machen. Und im Service zeigt eine Studie, dass Adoption bereits breit skaliert und mit CSAT verknüpft wird.
Dadurch werden drei Einsatzmöglichkeiten realistischer. Erstens: End-to-End-Workflows, die nicht an Tool-Grenzen scheitern, weil der Agent über die Oberfläche agieren kann. Zweitens: Service-Prozesse, in denen Agenten nicht nur antworten, sondern Fälle strukturiert voranbringen. Drittens: Commerce- und Marketing-Prozesse, in denen Agenten zu einem neuen Empfehlungskanal werden und damit die Mechanik von Sichtbarkeit verschieben.
Es zeichnet sich eine Plattformlogik ab: Agenten brauchen eine Ausführungsebene (wo handeln sie?), eine Qualitäts- und Testebene (wie gut handeln sie?), und eine Organisations- bzw. Skill-Ebene (wer baut und betreibt sie?). Diese drei Ebenen sind diese Woche in getrennten Nachrichten sichtbar geworden, aber sie gehören zusammen. Wer sie getrennt behandelt, bekommt entweder schöne Demos ohne Betrieb oder Betrieb ohne Kontrolle.
Die ersten Unternehmensprozesse, die getroffen werden, sind die mit hohem Volumen und klarer Messbarkeit: Service, standardisierte Ops-Aufgaben, wiederkehrende Desktop-Abläufe. Danach folgen funktionsübergreifende Ketten, in denen heute viele Übergaben und manuelle Checks existieren. Genau dort entsteht der größte Hebel, aber auch die größte Governance-Frage: Was passiert, wenn ein Agent eine Entscheidung vorbereitet oder sogar ausführt?
Agenten sind damit keine weitere KI-Funktion. Sie sind ein Systemdesign-Thema: Autonomiegrade, Freigabelogik, Monitoring, Nachvollziehbarkeit. Und sie sind eine Führungsaufgabe, weil Verantwortung neu verteilt wird: zwischen Fachbereich, IT, Security und den Menschen, die bisher „die letzten Klicks“ gemacht haben.
Achten Sie auf diese Signale in Ihrem Unternehmen
- Signal 1: Sie diskutieren Agenten wie ein Tool-Upgrade, nicht wie eine Ausführungsschicht über Ihre Prozesslandschaft.
- Signal 2: Piloten werden nach „funktioniert in der Demo“ bewertet, aber es gibt keine messbaren Kriterien für Zuverlässigkeit, Abbruchraten oder Eskalation.
- Signal 3: Service- und Ops-Teams wollen „mehr Automatisierung“, aber Wissensmanagement bleibt ungepflegt und ohne Owner.
- Signal 4: IT wird erst gefragt, wenn etwas produktiv gehen soll; bis dahin laufen agentische Experimente als Shadow-IT ohne Leitplanken.
- Signal 5: Sie planen Skalierung, aber haben nicht definiert, welche Aufgaben ein Agent autonom ausführen darf und welche zwingend menschliche Freigabe brauchen.
Der strategische Schritt der Woche
Wenn ich diese Woche ein Unternehmen beim Einsatz von KI-Agenten beraten würde, wäre mein Vorschlag:
Wählen Sie einen einzigen, geschäftskritischen End-to-End-Workflow, der heute über mehrere Tools und Oberflächen läuft (idealerweise Service oder eine wiederkehrende Ops-Kette), und bauen Sie dafür einen „agentenfähigen Betrieb“ bevor Sie den Agenten skalieren: klarer Autonomiegrad, definierte Eskalationspunkte, messbare Qualitätskriterien und ein Test-Setup, das reale Aufgaben abbildet.
Der Grund ist simpel und folgt direkt aus den Signalen dieser Woche: Wenn Ausführung über Oberflächen möglich wird, steigt die Versuchung, überall „schnell zu automatisieren“. Gleichzeitig zeigen Benchmark-Ansätze und Zertifizierungsverschiebungen, dass der Engpass Qualität, Betrieb und Verantwortung ist. Wer das zuerst löst, bekommt Geschwindigkeit ohne Chaos.
Schlussgedanke
Agenten markieren den Moment, in dem Software nicht nur bedient, sondern bedient wird. Das klingt bequem, ist aber eine Organisationsfrage: Wer definiert Ziele, Grenzen und Haftung, wenn Ausführung teilautonom läuft? Wer Agenten einführt, ohne Prozesse, Tests und Ownership zu redesignen, baut eine neue Schicht operativer Unsicherheit. Wer es richtig macht, baut eine neue Art von Betriebssystem für Wertschöpfung: nicht als Toolset, sondern als steuerbare, messbare Ausführungskompetenz.
All the best
Tim Cortinovis

