OpenClawでブラウザ自動化を使用する方法

AIエージェントに実際のブラウザを与えて、ウェブサイトのナビゲート、フォームへの入力、ボタンのクリック、あらゆるウェブページからのデータ抽出を行わせます。

はじめに

ブラウザ自動化により、OpenClawエージェントは実際のウェブブラウザを利用できます。HTMLを取得するだけでなく、エージェントはページのナビゲート、ボタンのクリック、フォームへの入力、JavaScriptでレンダリングされたコンテンツの処理、およびウェブアプリケーションとの対話を行うことができます。これは、人間が操作するのとまったく同じです。

前提条件

  • アクティブなエージェントを持つKiwiClawアカウント(セットアップガイド
  • StandardまたはEnterpriseプラン(ブラウザ自動化にはサンドボックスアクセスが必要です)

ステップバイステップ手順

ステップ1:ブラウザ自動化を有効にする

エージェントの設定で、サンドボックスモードが有効になっていることを確認します。ブラウザ自動化は、専用マシンの安全なサンドボックス環境で実行されます。

ステップ2:基本的なナビゲーションをテストする

エージェントにウェブサイトにアクセスするように依頼します。「news.ycombinator.comにアクセスして、トップ5の記事を教えてください。」エージェントはブラウザでページを開き、コンテンツを読み取って応答します。

ステップ3:インタラクティブなタスクを試す

エージェントはウェブアプリを操作できます:

「Google Flightsにアクセスし、2026年4月にヒューストンから東京への往復便を検索し、最も安い5つのオプションを表示してください。」

ステップ4:データ抽出に使用する

ブラウザ自動化は、単純なHTTPリクエストでは処理できないJavaScriptを多用するサイトからのデータ抽出に優れています。詳細については、ウェブスクレイピングガイドをご覧ください。

ステップ5:他のスキルと組み合わせる

ブラウザ自動化は、他のスキルと連携して動作します。エージェントはウェブサイトを閲覧し、データを抽出し、Pythonで分析し、Slackに結果を投稿することができます。これらすべてを1つのタスクで行います。

プロのヒント

  • クリックする内容を具体的にする -- エージェントが正しくナビゲートできるように、ボタンとリンクを正確に説明します。
  • フォームへの入力に使用する -- エージェントはウェブフォームに入力し、アプリケーションを送信し、ウェブベースのツールを操作できます。
  • スクリーンショット機能 -- エージェントは、視覚的な参照のためにウェブページのスクリーンショットを撮ることができます。
  • サイトポリシーを尊重する -- ブラウザの自動化は、ウェブサイトの利用規約とレート制限を尊重する必要があります。

よくある質問

ブラウザの自動化はウェブスクレイピングと同じですか?

ブラウザの自動化は、基本的なウェブスクレイピングよりも強力です。スクレイピングは通常、静的なHTMLを取得しますが、ブラウザの自動化はJavaScriptをレンダリングし、ページ要素を操作し、認証を処理し、複数のステップフローをナビゲートします。これは、AIエージェントによって制御される実際のブラウザです。

エージェントはウェブサイトにログインできますか?

はい。エージェントはログインフォームに入力し、認証されたページをナビゲートできます。エージェントの設定で資格情報を安全に保存します。2FAを使用するサイトでは、認証ステップを手動で処理するか、代わりにAPIベースのアクセスを使用する必要がある場合があります。

ブラウザの自動化はどのくらいの速さですか?

ブラウザのアクションは、人間が閲覧するのと同様に、ページごとに数秒かかります。大量のデータ抽出の場合は、パフォーマンスを向上させるために、可能な場合はブラウザの自動化と直接API呼び出しを組み合わせることを検討してください。

エージェントにウェブブラウザを提供

ウェブサイトのナビゲート、フォームへの入力、ウェブアプリの操作をすべて自動化します。