Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw browser
จัดการพื้นผิวควบคุมเบราว์เซอร์ของ OpenClaw และเรียกใช้การทำงานของเบราว์เซอร์ (วงจรชีวิต, โปรไฟล์, แท็บ, สแนปช็อต, ภาพหน้าจอ, การนำทาง, อินพุต, การจำลองสถานะ และการดีบัก)
ที่เกี่ยวข้อง:
- เครื่องมือเบราว์เซอร์ + API: เครื่องมือเบราว์เซอร์
แฟล็กทั่วไป
--url <gatewayWsUrl>: URL WebSocket ของ Gateway (ค่าเริ่มต้นมาจากการกำหนดค่า)--token <token>: โทเค็นของ Gateway (ถ้าจำเป็น)--timeout <ms>: ระยะหมดเวลาของคำขอ (มิลลิวินาที)--expect-final: รอการตอบกลับสุดท้ายจาก Gateway--browser-profile <name>: เลือกโปรไฟล์เบราว์เซอร์ (ค่าเริ่มต้นมาจากการกำหนดค่า)--json: เอาต์พุตที่เครื่องอ่านได้ (เมื่อรองรับ)
เริ่มใช้งานอย่างรวดเร็ว (ภายในเครื่อง)
browser({ action: "doctor" })
การแก้ปัญหาอย่างรวดเร็ว
ถ้าstart ล้มเหลวด้วย not reachable after start ให้แก้ปัญหาความพร้อมของ CDP ก่อน ถ้า start และ tabs สำเร็จ แต่ open หรือ navigate ล้มเหลว ระนาบควบคุมเบราว์เซอร์ถือว่าปกติ และความล้มเหลวมักเป็นนโยบาย SSRF สำหรับการนำทาง
ลำดับขั้นต่ำ:
วงจรชีวิต
doctor --deepเพิ่มการตรวจสอบสแนปช็อตแบบสด มีประโยชน์เมื่อความพร้อมพื้นฐานของ CDP เป็นสีเขียว แต่คุณต้องการหลักฐานว่าแท็บปัจจุบันสามารถตรวจสอบได้- สำหรับโปรไฟล์
attachOnlyและ CDP ระยะไกลopenclaw browser stopจะปิด เซสชันควบคุมที่ใช้งานอยู่และล้างการแทนที่การจำลองชั่วคราว แม้เมื่อ OpenClaw ไม่ได้เปิดโปรเซสเบราว์เซอร์เอง - สำหรับโปรไฟล์ภายในเครื่องที่จัดการโดยระบบ
openclaw browser stopจะหยุดโปรเซสเบราว์เซอร์ ที่ถูกสร้างขึ้น openclaw browser start --headlessมีผลเฉพาะกับคำขอเริ่มนั้น และ เฉพาะเมื่อ OpenClaw เปิดเบราว์เซอร์ภายในเครื่องที่จัดการโดยระบบเท่านั้น คำสั่งนี้จะไม่เขียนทับbrowser.headlessหรือการกำหนดค่าโปรไฟล์ และจะไม่มีผลกับเบราว์เซอร์ ที่กำลังทำงานอยู่แล้ว- บนโฮสต์ Linux ที่ไม่มี
DISPLAYหรือWAYLAND_DISPLAYโปรไฟล์ภายในเครื่อง ที่จัดการโดยระบบจะทำงานแบบ headless โดยอัตโนมัติ เว้นแต่OPENCLAW_BROWSER_HEADLESS=0,browser.headless=falseหรือbrowser.profiles.<name>.headless=falseจะขอเบราว์เซอร์แบบมองเห็นได้อย่างชัดเจน
ถ้าไม่มีคำสั่งนี้
ถ้าopenclaw browser เป็นคำสั่งที่ไม่รู้จัก ให้ตรวจสอบ plugins.allow ใน
~/.openclaw/openclaw.json
เมื่อมี plugins.allow ให้ระบุ Plugin เบราว์เซอร์ที่มาพร้อมระบบอย่างชัดเจน
เว้นแต่การกำหนดค่าจะมีบล็อก browser ที่รากอยู่แล้ว:
browser ที่รากแบบชัดเจน เช่น browser.enabled=true หรือ
browser.profiles.<name> จะเปิดใช้งาน Plugin เบราว์เซอร์ที่มาพร้อมระบบภายใต้
รายการอนุญาต Plugin ที่จำกัดด้วยเช่นกัน
ที่เกี่ยวข้อง: เครื่องมือเบราว์เซอร์
โปรไฟล์
โปรไฟล์คือการกำหนดค่าการกำหนดเส้นทางเบราว์เซอร์ที่มีชื่อ ในทางปฏิบัติ:openclaw: เปิดหรือแนบกับอินสแตนซ์ Chrome เฉพาะที่ OpenClaw จัดการ (ไดเรกทอรีข้อมูลผู้ใช้แยกต่างหาก)user: ควบคุมเซสชัน Chrome ที่ลงชื่อเข้าใช้แล้วของคุณผ่าน Chrome DevTools MCP- โปรไฟล์ CDP แบบกำหนดเอง: ชี้ไปยังปลายทาง CDP ภายในเครื่องหรือระยะไกล
แท็บ
tabs จะส่งคืน suggestedTargetId ก่อน จากนั้นจึงเป็น tabId ที่เสถียร เช่น t1,
ป้ายกำกับเสริม และ targetId ดิบ เอเจนต์ควรส่ง
suggestedTargetId กลับไปยัง focus, close, สแนปช็อต และการทำงานต่างๆ คุณสามารถ
กำหนดป้ายกำกับด้วย open --label, tab new --label หรือ tab label; ป้ายกำกับ,
รหัสแท็บ, รหัสเป้าหมายดิบ และคำนำหน้า target-id ที่ไม่ซ้ำกันล้วนใช้ได้
เมื่อ Chromium แทนที่เป้าหมายดิบพื้นฐานระหว่างการนำทางหรือการส่งฟอร์ม
OpenClaw จะรักษา tabId/ป้ายกำกับที่เสถียรให้ติดกับแท็บทดแทน
เมื่อพิสูจน์การจับคู่ได้ รหัสเป้าหมายดิบยังคงเปลี่ยนแปลงได้; ควรใช้
suggestedTargetId
สแนปช็อต / ภาพหน้าจอ / การทำงาน
สแนปช็อต:--full-pageใช้สำหรับการจับภาพหน้าเท่านั้น; ไม่สามารถใช้ร่วมกับ--refหรือ--elementได้- โปรไฟล์
existing-session/userรองรับภาพหน้าจอของหน้าและภาพหน้าจอ--refจากเอาต์พุตสแนปช็อต แต่ไม่รองรับภาพหน้าจอ--elementของ CSS --labelsซ้อนทับ ref ของสแนปช็อตปัจจุบันบนภาพหน้าจอsnapshot --urlsเพิ่มปลายทางลิงก์ที่ค้นพบต่อท้ายสแนปช็อต AI เพื่อให้ เอเจนต์เลือกเป้าหมายการนำทางโดยตรงได้ แทนที่จะเดาจากข้อความลิงก์เพียงอย่างเดียว
targetId ดิบปัจจุบันหลังจากมีการแทนที่หน้า
ที่ถูกกระตุ้นโดยการทำงาน เมื่อ OpenClaw พิสูจน์แท็บทดแทนได้ สคริปต์ยังควร
จัดเก็บและส่ง suggestedTargetId/ป้ายกำกับสำหรับเวิร์กโฟลว์ระยะยาว
ตัวช่วยไฟล์ + กล่องโต้ตอบ:
/tmp/openclaw/downloads เป็นค่าเริ่มต้น หรือราก temp ที่กำหนดค่าไว้)
ใช้ waitfordownload หรือ download เมื่อเอเจนต์จำเป็นต้องรอไฟล์
เฉพาะและส่งคืนพาธของไฟล์; ตัวรอแบบชัดเจนเหล่านี้จะเป็นเจ้าของการดาวน์โหลดถัดไป
สถานะและที่เก็บข้อมูล
Viewport + การจำลอง:การดีบัก
Chrome ที่มีอยู่ผ่าน MCP
ใช้โปรไฟล์user ในตัว หรือสร้างโปรไฟล์ existing-session ของคุณเอง:
- การทำงานที่ขับเคลื่อนด้วยสแนปช็อตใช้ ref ไม่ใช่ตัวเลือก CSS
browser.actionTimeoutMsตั้งค่าเริ่มต้นให้คำขอactที่รองรับเป็น 60000 ms เมื่อ ผู้เรียกละtimeoutMs;timeoutMsต่อครั้งยังคงมีผลเหนือกว่าclickเป็นการคลิกซ้ายเท่านั้นtypeไม่รองรับslowly=truepressไม่รองรับdelayMshover,scrollintoview,drag,select,fillและevaluateปฏิเสธ การแทนที่ระยะหมดเวลาต่อครั้งselectรองรับค่าเดียวเท่านั้น- ไม่รองรับ
wait --load networkidle - การอัปโหลดไฟล์ต้องใช้
--ref/--input-ref, ไม่รองรับ CSS--elementและปัจจุบันรองรับครั้งละหนึ่งไฟล์ - ฮุกกล่องโต้ตอบไม่รองรับ
--timeout - ภาพหน้าจอรองรับการจับภาพหน้าและ
--refแต่ไม่รองรับ CSS--element responsebody, การดักจับการดาวน์โหลด, การส่งออก PDF และการทำงานแบบแบตช์ยังคง ต้องใช้เบราว์เซอร์ที่จัดการโดยระบบหรือโปรไฟล์ CDP ดิบ
การควบคุมเบราว์เซอร์ระยะไกล (พร็อกซีโฮสต์โหนด)
ถ้า Gateway ทำงานบนเครื่องคนละเครื่องกับเบราว์เซอร์ ให้เรียกใช้ โฮสต์โหนด บนเครื่องที่มี Chrome/Brave/Edge/Chromium Gateway จะพร็อกซีการทำงานของเบราว์เซอร์ไปยังโหนดนั้น (ไม่ต้องมีเซิร์ฟเวอร์ควบคุมเบราว์เซอร์แยกต่างหาก) ใช้gateway.nodes.browser.mode เพื่อควบคุมการกำหนดเส้นทางอัตโนมัติ และใช้ gateway.nodes.browser.node เพื่อปักหมุดโหนดเฉพาะถ้ามีหลายโหนดเชื่อมต่ออยู่
ความปลอดภัย + การตั้งค่าระยะไกล: เครื่องมือเบราว์เซอร์, การเข้าถึงระยะไกล, Tailscale, ความปลอดภัย