OpenClawでブラウザ自動化を使用する方法
AIエージェントに実際のブラウザを与えて、ウェブサイトのナビゲート、フォームへの入力、ボタンのクリック、あらゆるウェブページからのデータ抽出を行わせます。
はじめに
ブラウザ自動化により、OpenClawエージェントは実際のウェブブラウザを利用できます。HTMLを取得するだけでなく、エージェントはページのナビゲート、ボタンのクリック、フォームへの入力、JavaScriptでレンダリングされたコンテンツの処理、およびウェブアプリケーションとの対話を行うことができます。これは、人間が操作するのとまったく同じです。
前提条件
- アクティブなエージェントを持つKiwiClawアカウント(セットアップガイド)
- StandardまたはEnterpriseプラン(ブラウザ自動化にはサンドボックスアクセスが必要です)
ステップバイステップ手順
ステップ1:ブラウザ自動化を有効にする
エージェントの設定で、サンドボックスモードが有効になっていることを確認します。ブラウザ自動化は、専用マシンの安全なサンドボックス環境で実行されます。
ステップ2:基本的なナビゲーションをテストする
エージェントにウェブサイトにアクセスするように依頼します。「news.ycombinator.comにアクセスして、トップ5の記事を教えてください。」エージェントはブラウザでページを開き、コンテンツを読み取って応答します。
ステップ3:インタラクティブなタスクを試す
エージェントはウェブアプリを操作できます:
「Google Flightsにアクセスし、2026年4月にヒューストンから東京への往復便を検索し、最も安い5つのオプションを表示してください。」
ステップ4:データ抽出に使用する
ブラウザ自動化は、単純なHTTPリクエストでは処理できないJavaScriptを多用するサイトからのデータ抽出に優れています。詳細については、ウェブスクレイピングガイドをご覧ください。
ステップ5:他のスキルと組み合わせる
ブラウザ自動化は、他のスキルと連携して動作します。エージェントはウェブサイトを閲覧し、データを抽出し、Pythonで分析し、Slackに結果を投稿することができます。これらすべてを1つのタスクで行います。
プロのヒント
- クリックする内容を具体的にする -- エージェントが正しくナビゲートできるように、ボタンとリンクを正確に説明します。
- フォームへの入力に使用する -- エージェントはウェブフォームに入力し、アプリケーションを送信し、ウェブベースのツールを操作できます。
- スクリーンショット機能 -- エージェントは、視覚的な参照のためにウェブページのスクリーンショットを撮ることができます。
- サイトポリシーを尊重する -- ブラウザの自動化は、ウェブサイトの利用規約とレート制限を尊重する必要があります。
よくある質問
ブラウザの自動化はウェブスクレイピングと同じですか?
ブラウザの自動化は、基本的なウェブスクレイピングよりも強力です。スクレイピングは通常、静的なHTMLを取得しますが、ブラウザの自動化はJavaScriptをレンダリングし、ページ要素を操作し、認証を処理し、複数のステップフローをナビゲートします。これは、AIエージェントによって制御される実際のブラウザです。
エージェントはウェブサイトにログインできますか?
はい。エージェントはログインフォームに入力し、認証されたページをナビゲートできます。エージェントの設定で資格情報を安全に保存します。2FAを使用するサイトでは、認証ステップを手動で処理するか、代わりにAPIベースのアクセスを使用する必要がある場合があります。
ブラウザの自動化はどのくらいの速さですか?
ブラウザのアクションは、人間が閲覧するのと同様に、ページごとに数秒かかります。大量のデータ抽出の場合は、パフォーマンスを向上させるために、可能な場合はブラウザの自動化と直接API呼び出しを組み合わせることを検討してください。