วิธีใช้ Browser Automation กับ OpenClaw
มอบเบราว์เซอร์จริงให้กับเอเจนต์ AI ของคุณเพื่อนนำทางเว็บไซต์ กรอกแบบฟอร์ม คลิกปุ่ม และดึงข้อมูลจากหน้าเว็บใดก็ได้
บทนำ
Browser automation ช่วยให้เอเจนต์ OpenClaw ของคุณมีเว็บเบราว์เซอร์จริง แทนที่จะเพียงแค่ดึง HTML เอเจนต์สามารถนำทางหน้าต่างๆ คลิกปุ่ม กรอกแบบฟอร์ม จัดการเนื้อหาที่แสดงผลด้วย JavaScript และโต้ตอบกับเว็บแอปพลิเคชัน เช่นเดียวกับที่ผู้ใช้ที่เป็นมนุษย์จะทำ
สิ่งที่ต้องมี
- บัญชี KiwiClaw ที่มีเอเจนต์ที่ใช้งานอยู่ (คู่มือการตั้งค่า)
- แผน Standard หรือ Enterprise (browser automation ต้องมีการเข้าถึง sandbox)
คำแนะนำทีละขั้นตอน
ขั้นตอนที่ 1: เปิดใช้งาน Browser Automation
ในการตั้งค่าเอเจนต์ของคุณ ตรวจสอบให้แน่ใจว่าได้เปิดใช้งานโหมด sandbox แล้ว Browser automation ทำงานในสภาพแวดล้อม sandbox ที่ปลอดภัยบนเครื่องเฉพาะของคุณ
ขั้นตอนที่ 2: ทดสอบการนำทางพื้นฐาน
ขอให้เอเจนต์ของคุณเยี่ยมชมเว็บไซต์: "ไปที่ news.ycombinator.com และบอกฉันถึง 5 เรื่องเด่น" เอเจนต์จะเปิดหน้าในเบราว์เซอร์ อ่านเนื้อหา และตอบกลับ
ขั้นตอนที่ 3: ลองงานแบบโต้ตอบ
เอเจนต์สามารถโต้ตอบกับเว็บแอปได้:
"ไปที่ Google Flights ค้นหาเที่ยวบินไปกลับจากฮิวสตันไปโตเกียวในเดือนเมษายน 2026 และแสดงตัวเลือกที่ถูกที่สุด 5 ตัวเลือกให้ฉันดู"
ขั้นตอนที่ 4: ใช้สำหรับการดึงข้อมูล
Browser automation มีความเป็นเลิศในการดึงข้อมูลจากไซต์ที่เน้น JavaScript ซึ่งคำขอ HTTP อย่างง่ายไม่สามารถจัดการได้ ดู คู่มือการขูดเว็บ ของเราสำหรับรายละเอียด
ขั้นตอนที่ 5: รวมกับทักษะอื่นๆ
Browser automation ทำงานควบคู่ไปกับทักษะอื่นๆ เอเจนต์สามารถเรียกดูเว็บไซต์ ดึงข้อมูล วิเคราะห์ด้วย Python และโพสต์ผลลัพธ์ไปยัง Slack ทั้งหมดในงานเดียว
เคล็ดลับมือโปร
- ระบุสิ่งที่ต้องคลิกให้ชัดเจน -- อธิบายปุ่มและลิงก์อย่างแม่นยำเพื่อให้เอเจนต์นำทางได้อย่างถูกต้อง
- ใช้สำหรับการกรอกแบบฟอร์ม -- เอเจนต์สามารถกรอกแบบฟอร์มบนเว็บ ส่งใบสมัคร และโต้ตอบกับเครื่องมือบนเว็บ
- ความสามารถในการจับภาพหน้าจอ -- เอเจนต์สามารถจับภาพหน้าจอของหน้าเว็บเพื่อใช้อ้างอิงภาพได้
- เคารพนโยบายของไซต์ -- Browser automation ควรรักษากฎเกณฑ์ในการให้บริการและอัตราการจำกัดของเว็บไซต์
คำถามที่พบบ่อย
Browser automation เหมือนกับการขูดเว็บหรือไม่
Browser automation มีประสิทธิภาพมากกว่าการขูดเว็บขั้นพื้นฐาน ในขณะที่การขูดโดยทั่วไปจะดึง HTML แบบคงที่ browser automation จะแสดง JavaScript โต้ตอบกับองค์ประกอบของหน้า จัดการการพิสูจน์ตัวตน และนำทางผ่านโฟลว์แบบหลายขั้นตอน มันคือเบราว์เซอร์จริงที่ควบคุมโดยเอเจนต์ AI ของคุณ
เอเจนต์สามารถล็อกอินเข้าสู่เว็บไซต์ได้หรือไม่
ได้ เอเจนต์สามารถกรอกแบบฟอร์มเข้าสู่ระบบและนำทางหน้าที่มีการตรวจสอบสิทธิ์ จัดเก็บข้อมูลรับรองอย่างปลอดภัยในการกำหนดค่าเอเจนต์ของคุณ สำหรับไซต์ที่มี 2FA คุณอาจต้องจัดการขั้นตอนการตรวจสอบสิทธิ์ด้วยตนเองหรือใช้การเข้าถึงผ่าน API แทน
Browser automation เร็วแค่ไหน
การดำเนินการของเบราว์เซอร์ใช้เวลาไม่กี่วินาทีต่อหน้า คล้ายกับการเรียกดูของมนุษย์ สำหรับการดึงข้อมูลจำนวนมาก ให้พิจารณาการรวม browser automation กับการเรียก API โดยตรงเมื่อมี เพื่อประสิทธิภาพที่ดีขึ้น