Browser-Automatisierung mit OpenClaw verwenden
Geben Sie Ihrem KI-Agenten einen echten Browser, um Websites zu navigieren, Formulare auszufüllen, auf Schaltflächen zu klicken und Daten aus beliebigen Webseiten zu extrahieren.
Einführung
Browser-Automatisierung gibt Ihrem OpenClaw-Agenten einen echten Webbrowser. Anstatt nur HTML zu fetchen, kann der Agent Seiten navigieren, auf Schaltflächen klicken, Formulare ausfüllen, mit JavaScript gerendertem Inhalt umgehen und mit Webanwendungen interagieren -- genau wie ein menschlicher Benutzer.
Voraussetzungen
- Ein KiwiClaw-Konto mit einem aktiven Agenten (Anleitung zum Einrichten)
- Standard- oder Enterprise-Plan (Browser-Automatisierung erfordert Sandbox-Zugriff)
Schritt-für-Schritt-Anleitung
Schritt 1: Aktivieren Sie die Browser-Automatisierung
Stellen Sie in Ihren Agent-Einstellungen sicher, dass der Sandbox-Modus aktiviert ist. Browser-Automatisierung läuft in einer sicheren Sandbox-Umgebung auf Ihrer dedizierten Maschine.
Schritt 2: Testen Sie die grundlegende Navigation
Bitten Sie Ihren Agenten, eine Website zu besuchen: „Gehe zu news.ycombinator.com und sage mir die Top 5 Stories." Der Agent öffnet die Seite in seinem Browser, liest den Inhalt und antwortet.
Schritt 3: Versuchen Sie interaktive Aufgaben
Der Agent kann mit Web-Apps interagieren:
„Gehe zu Google Flights, suche nach Hin- und Rückflügen von Houston nach Tokio im April 2026 und zeige mir die 5 günstigsten Optionen."
Schritt 4: Verwenden Sie es zur Datenextraktion
Browser-Automatisierung eignet sich hervorragend zur Extraktion von Daten aus JavaScript-lastigen Sites, die einfache HTTP-Anfragen nicht bewältigen können. Weitere Details finden Sie in unserem Web-Scraping-Leitfaden.
Schritt 5: Kombinieren Sie mit anderen Fähigkeiten
Browser-Automatisierung funktioniert neben anderen Fähigkeiten. Der Agent kann eine Website durchsuchen, Daten extrahieren, diese mit Python analysieren und Ergebnisse an Slack posten -- alles in einer Aufgabe.
Professionelle Tipps
- Seien Sie spezifisch bei dem, was Sie anklicken möchten -- Beschreiben Sie Schaltflächen und Links präzise, damit der Agent korrekt navigiert.
- Verwenden Sie es zum Ausfüllen von Formularen -- Der Agent kann Webformulare ausfüllen, Anwendungen einreichen und mit webgestützten Tools interagieren.
- Screenshot-Funktion -- Der Agent kann Screenshots von Webseiten für visuelle Referenzen machen.
- Respektieren Sie Website-Richtlinien -- Browser-Automatisierung sollte die Nutzungsbedingungen und Ratenlimits von Websites respektieren.
Häufig gestellte Fragen
Ist Browser-Automatisierung dasselbe wie Web-Scraping?
Browser-Automatisierung ist leistungsfähiger als einfaches Web-Scraping. Während Scraping typischerweise statisches HTML abruft, rendert Browser-Automatisierung JavaScript, interagiert mit Seitenelementen, verwaltet Authentifizierung und navigiert durch mehrstufige Abläufe. Es ist ein echter Browser, der von Ihrem KI-Agenten gesteuert wird.
Kann sich der Agent bei Websites anmelden?
Ja. Der Agent kann Anmeldeformulare ausfüllen und authentifizierte Seiten navigieren. Speichern Sie Anmeldedaten sicher in Ihrer Agent-Konfiguration. Für Websites mit 2FA müssen Sie möglicherweise den Authentifizierungsschritt manuell durchführen oder stattdessen API-basierten Zugriff verwenden.
Wie schnell ist Browser-Automatisierung?
Browser-Aktionen dauern mehrere Sekunden pro Seite, ähnlich wie beim manuellen Browsing. Für die Massenextrahierung von Daten sollten Sie Browser-Automatisierung mit direkten API-Aufrufen kombinieren, wo verfügbar, um bessere Leistung zu erzielen.