วิธีใช้ Browser Automation กับ OpenClaw

มอบเบราว์เซอร์จริงให้กับเอเจนต์ AI ของคุณเพื่อนนำทางเว็บไซต์ กรอกแบบฟอร์ม คลิกปุ่ม และดึงข้อมูลจากหน้าเว็บใดก็ได้

บทนำ

Browser automation ช่วยให้เอเจนต์ OpenClaw ของคุณมีเว็บเบราว์เซอร์จริง แทนที่จะเพียงแค่ดึง HTML เอเจนต์สามารถนำทางหน้าต่างๆ คลิกปุ่ม กรอกแบบฟอร์ม จัดการเนื้อหาที่แสดงผลด้วย JavaScript และโต้ตอบกับเว็บแอปพลิเคชัน เช่นเดียวกับที่ผู้ใช้ที่เป็นมนุษย์จะทำ

สิ่งที่ต้องมี

  • บัญชี KiwiClaw ที่มีเอเจนต์ที่ใช้งานอยู่ (คู่มือการตั้งค่า)
  • แผน Standard หรือ Enterprise (browser automation ต้องมีการเข้าถึง sandbox)

คำแนะนำทีละขั้นตอน

ขั้นตอนที่ 1: เปิดใช้งาน Browser Automation

ในการตั้งค่าเอเจนต์ของคุณ ตรวจสอบให้แน่ใจว่าได้เปิดใช้งานโหมด sandbox แล้ว Browser automation ทำงานในสภาพแวดล้อม sandbox ที่ปลอดภัยบนเครื่องเฉพาะของคุณ

ขั้นตอนที่ 2: ทดสอบการนำทางพื้นฐาน

ขอให้เอเจนต์ของคุณเยี่ยมชมเว็บไซต์: "ไปที่ news.ycombinator.com และบอกฉันถึง 5 เรื่องเด่น" เอเจนต์จะเปิดหน้าในเบราว์เซอร์ อ่านเนื้อหา และตอบกลับ

ขั้นตอนที่ 3: ลองงานแบบโต้ตอบ

เอเจนต์สามารถโต้ตอบกับเว็บแอปได้:

"ไปที่ Google Flights ค้นหาเที่ยวบินไปกลับจากฮิวสตันไปโตเกียวในเดือนเมษายน 2026 และแสดงตัวเลือกที่ถูกที่สุด 5 ตัวเลือกให้ฉันดู"

ขั้นตอนที่ 4: ใช้สำหรับการดึงข้อมูล

Browser automation มีความเป็นเลิศในการดึงข้อมูลจากไซต์ที่เน้น JavaScript ซึ่งคำขอ HTTP อย่างง่ายไม่สามารถจัดการได้ ดู คู่มือการขูดเว็บ ของเราสำหรับรายละเอียด

ขั้นตอนที่ 5: รวมกับทักษะอื่นๆ

Browser automation ทำงานควบคู่ไปกับทักษะอื่นๆ เอเจนต์สามารถเรียกดูเว็บไซต์ ดึงข้อมูล วิเคราะห์ด้วย Python และโพสต์ผลลัพธ์ไปยัง Slack ทั้งหมดในงานเดียว

เคล็ดลับมือโปร

  • ระบุสิ่งที่ต้องคลิกให้ชัดเจน -- อธิบายปุ่มและลิงก์อย่างแม่นยำเพื่อให้เอเจนต์นำทางได้อย่างถูกต้อง
  • ใช้สำหรับการกรอกแบบฟอร์ม -- เอเจนต์สามารถกรอกแบบฟอร์มบนเว็บ ส่งใบสมัคร และโต้ตอบกับเครื่องมือบนเว็บ
  • ความสามารถในการจับภาพหน้าจอ -- เอเจนต์สามารถจับภาพหน้าจอของหน้าเว็บเพื่อใช้อ้างอิงภาพได้
  • เคารพนโยบายของไซต์ -- Browser automation ควรรักษากฎเกณฑ์ในการให้บริการและอัตราการจำกัดของเว็บไซต์

คำถามที่พบบ่อย

Browser automation เหมือนกับการขูดเว็บหรือไม่

Browser automation มีประสิทธิภาพมากกว่าการขูดเว็บขั้นพื้นฐาน ในขณะที่การขูดโดยทั่วไปจะดึง HTML แบบคงที่ browser automation จะแสดง JavaScript โต้ตอบกับองค์ประกอบของหน้า จัดการการพิสูจน์ตัวตน และนำทางผ่านโฟลว์แบบหลายขั้นตอน มันคือเบราว์เซอร์จริงที่ควบคุมโดยเอเจนต์ AI ของคุณ

เอเจนต์สามารถล็อกอินเข้าสู่เว็บไซต์ได้หรือไม่

ได้ เอเจนต์สามารถกรอกแบบฟอร์มเข้าสู่ระบบและนำทางหน้าที่มีการตรวจสอบสิทธิ์ จัดเก็บข้อมูลรับรองอย่างปลอดภัยในการกำหนดค่าเอเจนต์ของคุณ สำหรับไซต์ที่มี 2FA คุณอาจต้องจัดการขั้นตอนการตรวจสอบสิทธิ์ด้วยตนเองหรือใช้การเข้าถึงผ่าน API แทน

Browser automation เร็วแค่ไหน

การดำเนินการของเบราว์เซอร์ใช้เวลาไม่กี่วินาทีต่อหน้า คล้ายกับการเรียกดูของมนุษย์ สำหรับการดึงข้อมูลจำนวนมาก ให้พิจารณาการรวม browser automation กับการเรียก API โดยตรงเมื่อมี เพื่อประสิทธิภาพที่ดีขึ้น

มอบเว็บเบราว์เซอร์ให้กับเอเจนต์ของคุณ

นำทางเว็บไซต์ กรอกแบบฟอร์ม และโต้ตอบกับเว็บแอป ทั้งหมดเป็นไปโดยอัตโนมัติ