OpenClaw के साथ ब्राउज़र ऑटोमेशन का उपयोग कैसे करें
अपनी AI एजेंट को वेबसाइटों को नेविगेट करने, फॉर्म भरने, बटन क्लिक करने और किसी भी वेब पेज से डेटा निकालने के लिए एक वास्तविक ब्राउज़र दें।
परिचय
ब्राउज़र ऑटोमेशन आपके OpenClaw एजेंट को एक वास्तविक वेब ब्राउज़र देता है। केवल HTML लाने के बजाय, एजेंट पेज नेविगेट कर सकता है, बटन क्लिक कर सकता है, फॉर्म भर सकता है, जावास्क्रिप्ट-प्रतिपादित सामग्री को संभाल सकता है, और वेब एप्लिकेशन के साथ इंटरैक्ट कर सकता है -- ठीक वैसे ही जैसे एक मानव उपयोगकर्ता करेगा।
आवश्यक शर्तें
- सक्रिय एजेंट के साथ एक KiwiClaw खाता (सेटअप गाइड)
- मानक या एंटरप्राइज़ योजना (ब्राउज़र ऑटोमेशन के लिए सैंडबॉक्स एक्सेस की आवश्यकता होती है)
चरण-दर-चरण निर्देश
चरण 1: ब्राउज़र ऑटोमेशन सक्षम करें
अपनी एजेंट सेटिंग्स में, सुनिश्चित करें कि सैंडबॉक्स मोड सक्षम है। ब्राउज़र ऑटोमेशन आपकी समर्पित मशीन पर एक सुरक्षित सैंडबॉक्स्ड वातावरण में चलता है।
चरण 2: बुनियादी नेविगेशन का परीक्षण करें
अपने एजेंट को एक वेबसाइट पर जाने के लिए कहें: "news.ycombinator.com पर जाएं और मुझे शीर्ष 5 कहानियां बताएं।" एजेंट अपने ब्राउज़र में पेज खोलता है, सामग्री पढ़ता है और प्रतिक्रिया करता है।
चरण 3: इंटरैक्टिव कार्य आज़माएं
एजेंट वेब ऐप्स के साथ इंटरैक्ट कर सकता है:
"Google Flights पर जाएं, अप्रैल 2026 में ह्यूस्टन से टोक्यो के लिए राउंड-ट्रिप उड़ानें खोजें, और मुझे 5 सबसे सस्ते विकल्प दिखाएं।"
चरण 4: डेटा एक्सट्रेक्शन के लिए उपयोग करें
ब्राउज़र ऑटोमेशन जावास्क्रिप्ट-भारी साइटों से डेटा निकालने में उत्कृष्टता प्राप्त करता है जिसे सरल HTTP अनुरोध संभाल नहीं सकते हैं। विवरण के लिए हमारी वेब स्क्रैपिंग गाइड देखें।
चरण 5: अन्य कौशल के साथ मिलाएं
ब्राउज़र ऑटोमेशन अन्य कौशलों के साथ मिलकर काम करता है। एजेंट एक वेबसाइट ब्राउज़ कर सकता है, डेटा निकाल सकता है, पायथन के साथ इसका विश्लेषण कर सकता है और Slack पर परिणाम पोस्ट कर सकता है - यह सब एक ही कार्य में।
प्रो टिप्स
- क्या क्लिक करना है इसके बारे में विशिष्ट रहें -- बटन और लिंक को सटीक रूप से बताएं ताकि एजेंट सही ढंग से नेविगेट कर सके।
- फॉर्म भरने के लिए उपयोग करें -- एजेंट वेब फॉर्म भर सकता है, एप्लिकेशन सबमिट कर सकता है और वेब-आधारित टूल के साथ इंटरैक्ट कर सकता है।
- स्क्रीनशॉट क्षमता -- एजेंट दृश्य संदर्भ के लिए वेब पेजों के स्क्रीनशॉट ले सकता है।
- साइट नीतियों का सम्मान करें -- ब्राउज़र ऑटोमेशन को वेबसाइट की सेवा की शर्तों और दर सीमाओं का सम्मान करना चाहिए।
अक्सर पूछे जाने वाले प्रश्न
क्या ब्राउज़र ऑटोमेशन वेब स्क्रैपिंग के समान है?
ब्राउज़र ऑटोमेशन बुनियादी वेब स्क्रैपिंग से अधिक शक्तिशाली है। जबकि स्क्रैपिंग आमतौर पर स्टैटिक HTML लाता है, ब्राउज़र ऑटोमेशन जावास्क्रिप्ट प्रस्तुत करता है, पेज तत्वों के साथ इंटरैक्ट करता है, प्रमाणीकरण को संभालता है और बहु-चरणीय प्रवाह के माध्यम से नेविगेट करता है। यह एक वास्तविक ब्राउज़र है जो आपके AI एजेंट द्वारा नियंत्रित होता है।
क्या एजेंट वेबसाइटों में लॉग इन कर सकता है?
हाँ। एजेंट लॉग इन फ़ॉर्म भर सकता है और प्रमाणित पृष्ठों को नेविगेट कर सकता है। अपने एजेंट कॉन्फ़िगरेशन में क्रेडेंशियल्स को सुरक्षित रूप से संग्रहीत करें। 2FA वाली साइटों के लिए, आपको प्रमाणीकरण चरण को मैन्युअल रूप से संभालने या इसके बजाय API-आधारित एक्सेस का उपयोग करने की आवश्यकता हो सकती है।
ब्राउज़र ऑटोमेशन कितनी तेज़ है?
ब्राउज़र क्रियाएं प्रति पृष्ठ कुछ सेकंड लेती हैं, जो एक मानव ब्राउज़िंग के समान है। बल्क डेटा एक्सट्रेक्शन के लिए, बेहतर प्रदर्शन के लिए जहां उपलब्ध हो, सीधे API कॉल के साथ ब्राउज़र ऑटोमेशन को संयोजित करने पर विचार करें।