Der Artikel untersucht die entscheidenden Engpässe für die echte Autonomie von KI-Agenten – die nativen Zahlungsfähigkeiten – und analysiert die unterschiedlichen Wege großer Technologieunternehmen (wie Google AP2) und des Kryptobereichs (ERC-8004, x402) in Bezug auf Agenten-Zahlungen: Erstere betonen Bequemlichkeit und Schutz durch kontrollierte Ökosysteme und Benutzeranmeldeinformationen, während letztere durch NFT-Identitäten und intelligente Verträge Dezentralisierung und offene Interoperabilität in A2A-Transaktionen erreichen.
Artikelautor: Tiger Research
Quelle: MarsBit
Dieser Bericht wurde von Tiger Research verfasst. Um echte autonome Automatisierung zu erreichen, sind native Zahlungsfähigkeiten erforderlich. Der Markt hat bereits begonnen, aktiv auf diesen Wandel hinzuarbeiten.
Kernpunkte
Die Zahlungssubjekte wechseln von Menschen zu AI-Agenten, was die Zahlungsinfrastruktur zu einer zentralen Voraussetzung für echte Autonomie macht.
Große Technologieunternehmen (einschließlich Google AP2 und OpenAI Delegated Payment) entwerfen automatisierte Zahlungssysteme auf Genehmigungsbasis, die auf bestehenden Plattforminfrastrukturen basieren.
Kryptowährungen erreichen durch die Standards ERC-8004 und x402, unter Nutzung von NFT-basierten Identifikations- und Smart-Contract-Technologien, ein dezentralisiertes Zahlungssystem.
Große Technologieunternehmen priorisieren Bequemlichkeit und Verbraucherschutz, während Kryptowährungen Benutzerhoheit und umfassendere Agentenfähigkeit betonen.
Die zentrale Frage der Zukunft wird sein: Werden Zahlungen von Plattformen kontrolliert oder durch offene Protokolle ausgeführt?
1. Zahlungen sind nicht mehr nur dem Menschen vorbehalten.

Quelle: macstories (Feder1C0 Viticci)
Kürzlich erregte "OpenClaw" große Aufmerksamkeit. Im Gegensatz zu AI-Systemen wie ChatGPT oder Gemini, die hauptsächlich für das Abrufen und Organisieren von Informationen verantwortlich sind, ermöglicht OpenClaw AI-Agenten, Aufgaben direkt auf dem lokalen PC oder Server des Nutzers auszuführen.
Über Instant Messaging-Plattformen wie WhatsApp, Telegram und Slack können Nutzer Anweisungen geben, die der Agent anschließend autonom ausführt, einschließlich E-Mail-Verwaltung, Kalenderkoordination und Web-Browsing.
Da es als Open-Source-Software betrieben wird und nicht an eine bestimmte Plattform gebunden ist, ähnelt die Funktion von OpenClaw einem persönlichen AI-Assistenten. Diese Architektur ist aufgrund ihrer Flexibilität und Benutzerkontrolle sehr beliebt.
Dennoch besteht eine entscheidende Einschränkung. Um vollständige Autonomie für AI-Agenten zu erreichen, müssen sie in der Lage sein, Zahlungen durchzuführen. Momentan können Agenten Produkte suchen, Optionen vergleichen und Artikel in den Warenkorb legen, doch die endgültige Zahlungsautorisierung benötigt nach wie vor menschliche Genehmigung.
Historisch gesehen wurden Zahlungssysteme um menschliche Subjekte herum entworfen. In einer von AI-Agenten betriebenen Umgebung ist diese Annahme nicht mehr gültig. Wenn Automatisierung vollständig autonom werden soll, müssen Agenten in der Lage sein, innerhalb definierter Einschränkungen unabhängig zu bewerten, zu autorisieren und Transaktionen abzuschließen.
In Erwartung dieser Veränderung haben große Technologieunternehmen und kryptonative Projekte im vergangenen Jahr technische Rahmenbedingungen für die Erreichung von Agenten-Zahlungen eingeführt.
2. Große Technologieunternehmen: Agenten-Zahlungen auf bestehenden Infrastrukturen aufbauen
Im Januar 2025 führte Google AP2 (Agent Payment Protocol 2.0) ein, das die Zahlungsinfrastruktur für AI-Agenten erweiterte. Während OpenAI und Amazon ähnliche Initiativen skizzierten, ist Google derzeit das einzige große Unternehmen mit einem strukturierten Implementierungsrahmen.
AP2 unterteilt den Transaktionsprozess in drei Autorisierungsebenen (Mandate Layers). Diese Struktur ermöglicht eine unabhängige Überwachung und Prüfung jeder Phase.
Absichtsermächtigung (Intent Mandate): Dokumentation der Aktionen, die der Nutzer ausführen möchte.
Warenkorb-Ermächtigung (Cart Mandate): Definiert, wie Käufe unter festgelegten Regeln durchgeführt werden sollen.
Zahlungsermächtigung (Payment Mandate): Durchführung der tatsächlichen Geldtransfers.

Beispiel: Angenommen, Ekko weist den AI-Agenten auf Google Shopping an, "eine Winterjacke unter 200 US-Dollar zu finden und zu kaufen".
Absichtsermächtigung: Ekko weist den AI-Agenten an, eine "Winterjacke mit einem Höchstbudget von 200 US-Dollar" zu kaufen. Diese Information wird als digitales Vertragsdokument in der Blockchain aufgezeichnet, also als Absichtsermächtigung.
Warenkorb-Ermächtigung: Der AI-Agent folgt der Absicht, sucht bei Partnerhändlern nach passenden Artikeln und fügt qualifizierte Produkte dem Warenkorb hinzu. Preisüberprüfung (199 US-Dollar, im Budget ✓), Bestätigung der Lieferadresse.
Zahlungsermächtigung: Ekko sieht sich die ausgewählten Artikel an und klickt auf Genehmigen. 199 US-Dollar werden über Google Pay verarbeitet. Alternativ kann der AI-Agent die Zahlung innerhalb vorgegebener Parameter automatisch abwickeln.
Im gesamten Prozess müssen die Nutzer keine zusätzlichen Informationen eingeben. Google AP2 nutzt bestehende Benutzeranmeldeinformationen (vorgemeldete Karten und Adressen), was die Zugangsschwelle senkt und den Adoptionsprozess vereinfacht.

Quelle: Google
Derzeit unterstützt Google jedoch nur Unternehmen innerhalb seines Partnernetzwerks für Agenten-Zahlungen. Daher ist sein Nutzungsspektrum auf ein kontrolliertes Ökosystem beschränkt, was die breitere Interoperabilität und den offenen Zugang einschränkt.
3. Kryptowährung: Selbstverwaltung und offene Tauschbörsen
Der Kryptobereich entwickelt ebenfalls Zahlungsinfrastrukturen für AI-Agenten, verfolgt jedoch einen vollkommen anderen Ansatz als große Technologieunternehmen. Große Plattformen bauen Vertrauen in einem kontrollierten Ökosystem auf, während der Kryptobereich mit einer anderen Frage beginnt: Können AI-Agenten Vertrauen gewinnen, ohne von zentralisierten Plattformen abhängig zu sein?
Zwei Kernstandards zielen darauf ab, dieses Ziel zu erreichen: Ethereum's ERC-8004 und Coinbase's x402.

Zuerst ist die Identitätsschicht. AI-Agenten, die auf der Blockchain operieren, müssen identifizierbar sein. ERC-8004 erfüllt diese Funktion. Es wird in Form von NFTs ausgegeben, jedoch nicht als Kunstsammlerstücke, sondern als Zertifikate, die strukturierte Identitätsdaten enthalten. Jeder Token besteht aus drei Teilen:
Identität (Identity)
Ruf (Reputation)
Validierung (Validation)
Diese Elemente bilden gemeinsam ein verifiziertes On-Chain-Identitätszertifikat.
In Bezug auf die Zahlungsmethoden fungiert x402 als Zahlungsweg. x402, entwickelt von Coinbase, ist der kryptonative Zahlungsstandard für AI-Agenten. Er ermöglicht es Agenten, Stablecoins für autonome Transaktionen zu verwenden. Sein Kernelement ist die automatisierte Ausführung von Smart Contracts, wobei die bedingte Logik direkt im Code eingebettet ist, sodass die Abrechnung ohne menschliches Eingreifen erfolgt, sobald die Bedingungen erfüllt sind.
Wenn ERC-8004 (Identität) mit x402 (Zahlung) kombiniert wird, können AI-Agenten Gegenparteien verifizieren und Transaktionen durchführen, ohne von zentralisierten Plattformen abhängig zu sein.

Beispiel: Ekko weist seinen Agenten A an, einen gebrauchten Laptop mit einem Höchstbudget von 800 US-Dollar zu kaufen. Der Agent B des Verkäufers kommuniziert direkt mit ihm.
Gegenseitige Überprüfung: Durch ERC-8004 NFT werden Identität und Rufpunktzahl (z. B.: Ruf 72, Guthabenbestätigung) überprüft.
Smart Contract Treuhand: 800 US-Dollar werden aus der Brieftasche in einen Treuhand-Smart-Contract (Escrow) transferiert, die Mittel werden bis zur Bestätigung des Empfangs gesperrt.
Abrechnung und Rufaktualisierung: Nach Abschluss der Transaktion wird x402 automatisch abgerechnet, und die Rufaufzeichnungen beider Parteien werden automatisch aktualisiert und in ihre jeweiligen ERC-8004 NFTs geschrieben.
Im gesamten Prozess sind keine Vermittler beteiligt. Zwei AI-Agenten führen Transaktionen direkt durch, basierend auf Blockchain-Überprüfung und -Abrechnung, was das kryptonative Modell von Agent zu Agent (A2A) verkörpert.
4. Große Technologie vs Kryptowährung: Unterschiede im Betrieb von AI-Agenten

Google AP2 stellt ein kontrolliertes Modell dar, das für verifizierte Partner entwickelt wurde. Google schränkt die Marktteilnehmer ein, um die Verbraucher zu schützen. Da die Ausführung durch AI-Agenten probabilistische Ergebnisse und keine vollständige Determiniertheit aufweist, könnte die Verantwortung im Falle eines Transaktionsfehlers letztendlich beim Zahlungsinfrastrukturanbieter liegen. Um die Fehlerwahrscheinlichkeit zu verringern, hat Google ein Interesse daran, sein Ökosystem zu verkleinern.
Ein eingeschränktes Ökosystem erhöht die Stabilität, schränkt jedoch auch die Fähigkeit der Agenten ein, autonom in einem breiteren Markt zu operieren und Auswahlmöglichkeiten zu optimieren.
Im Vergleich dazu spiegeln ERC-8004 und x402 eine offenere Architektur wider. Das Kryptomodell zielt darauf ab, Genehmigungsfreiheit (Permissionless) und Interoperabilität zu erreichen.
Obwohl die End-to-End-Ausführung derzeit nicht perfekt ist, ist die langfristige Vision, dass Agenten alltägliche Ausgaben selbst verwalten. Große Plattformen könnten versuchen, bedeutende Einzelhandelskanäle zu integrieren, während offene Kryptostandards bei der Verarbeitung von kleinen, häufigen, programmatischen Zahlungen (Mikrozahlungen) strukturelle Vorteile bieten. Zum Beispiel kauft der Agent 1000 Stockfotos zu einem Einzelpreis von 0,01 US-Dollar, was effizienter ist als der Betrieb über einen kryptonativen Pfad.
Natürlich bringt das Fehlen zentralisierter Institutionen auch Kompromisse mit sich: Identitätsbewertungskriterien müssen dezentralisiert aufgebaut werden, und es gibt keine einzige Einheit, die die endgültige Verantwortung für Misserfolge trägt.
Zusammenfassung
Sowohl große Technologieunternehmen als auch der Kryptobereich verfolgen dasselbe Ziel: die Schaffung autonomer AI-Agenten im Geschäft. Der Unterschied liegt in der Architektur: Große Technologieunternehmen bevorzugen geschlossene, kontrollierte Systeme, während der Kryptobereich offene, protokollbasierte Modelle vorantreibt.
Zukünftige Trends werden wahrscheinlich auf die Interoperabilität beider Ansätze abzielen, anstatt auf ein Nullsummenspiel.
