Nodes and media
Przechwytywanie obrazu z kamery
OpenClaw obsługuje przechwytywanie z kamery dla przepływów pracy agentów:
- węzeł iOS (sparowany przez Gateway): przechwyć zdjęcie (
jpg) lub krótki klip wideo (mp4, opcjonalnie z dźwiękiem) przeznode.invoke. - węzeł Android (sparowany przez Gateway): przechwyć zdjęcie (
jpg) lub krótki klip wideo (mp4, opcjonalnie z dźwiękiem) przeznode.invoke. - aplikacja macOS (węzeł przez Gateway): przechwyć zdjęcie (
jpg) lub krótki klip wideo (mp4, opcjonalnie z dźwiękiem) przeznode.invoke.
Cały dostęp do kamery jest ograniczony przez ustawienia kontrolowane przez użytkownika.
węzeł iOS
Ustawienie użytkownika (domyślnie włączone)
- Karta ustawień iOS → Camera → Allow Camera (
camera.enabled)- Domyślnie: włączone (brakujący klucz jest traktowany jako włączony).
- Gdy wyłączone: polecenia
camera.*zwracająCAMERA_DISABLED.
Polecenia (przez Gateway node.invoke)
-
camera.list- Ładunek odpowiedzi:
devices: tablica{ id, name, position, deviceType }
- Ładunek odpowiedzi:
-
camera.snap- Parametry:
facing:front|back(domyślnie:front)maxWidth: liczba (opcjonalnie; domyślnie1600w węźle iOS)quality:0..1(opcjonalnie; domyślnie0.9)format: obecniejpgdelayMs: liczba (opcjonalnie; domyślnie0)deviceId: ciąg znaków (opcjonalnie; zcamera.list)
- Ładunek odpowiedzi:
format: "jpg"base64: "<...>"width,height
- Ograniczenie ładunku: zdjęcia są ponownie kompresowane, aby utrzymać ładunek base64 poniżej 5 MB.
- Parametry:
-
camera.clip- Parametry:
facing:front|back(domyślnie:front)durationMs: liczba (domyślnie3000, ograniczana do maksymalnie60000)includeAudio: wartość logiczna (domyślnietrue)format: obecniemp4deviceId: ciąg znaków (opcjonalnie; zcamera.list)
- Ładunek odpowiedzi:
format: "mp4"base64: "<...>"durationMshasAudio
- Parametry:
Wymóg pierwszego planu
Podobnie jak canvas.*, węzeł iOS zezwala na polecenia camera.* tylko na pierwszym planie. Wywołania w tle zwracają NODE_BACKGROUND_UNAVAILABLE.
Pomocnik CLI
Najłatwiejszym sposobem uzyskania plików multimedialnych jest pomocnik CLI, który zapisuje zdekodowane media do pliku tymczasowego i wypisuje zapisaną ścieżkę.
Przykłady:
openclaw nodes camera snap --node <id> # default: both front + back (2 MEDIA lines)openclaw nodes camera snap --node <id> --facing frontopenclaw nodes camera clip --node <id> --duration 3000openclaw nodes camera clip --node <id> --no-audioUwagi:
nodes camera snapdomyślnie używa obu kierunków, aby dać agentowi oba widoki.- Pliki wyjściowe są tymczasowe (w katalogu tymczasowym systemu operacyjnego), chyba że zbudujesz własny wrapper.
węzeł Android
Ustawienie użytkownika Android (domyślnie włączone)
- Arkusz ustawień Android → Camera → Allow Camera (
camera.enabled)- Domyślnie: włączone (brakujący klucz jest traktowany jako włączony).
- Gdy wyłączone: polecenia
camera.*zwracająCAMERA_DISABLED.
Uprawnienia
- Android wymaga uprawnień w czasie działania:
CAMERAdlacamera.snapicamera.clip.RECORD_AUDIOdlacamera.clip, gdyincludeAudio=true.
Jeśli brakuje uprawnień, aplikacja wyświetli monit, gdy będzie to możliwe; jeśli zostaną odrzucone, żądania camera.* zakończą się błędem
*_PERMISSION_REQUIRED.
Wymóg pierwszego planu Android
Podobnie jak canvas.*, węzeł Android zezwala na polecenia camera.* tylko na pierwszym planie. Wywołania w tle zwracają NODE_BACKGROUND_UNAVAILABLE.
Polecenia Android (przez Gateway node.invoke)
camera.list- Ładunek odpowiedzi:
devices: tablica{ id, name, position, deviceType }
- Ładunek odpowiedzi:
Ograniczenie ładunku
Zdjęcia są ponownie kompresowane, aby utrzymać ładunek base64 poniżej 5 MB.
aplikacja macOS
Ustawienie użytkownika (domyślnie wyłączone)
Aplikacja towarzysząca macOS udostępnia pole wyboru:
- Settings → General → Allow Camera (
openclaw.cameraEnabled)- Domyślnie: wyłączone
- Gdy wyłączone: żądania kamery zwracają „Camera disabled by user”.
Pomocnik CLI (wywołanie węzła)
Użyj głównego CLI openclaw, aby wywołać polecenia kamery w węźle macOS.
Przykłady:
openclaw nodes camera list --node <id> # list camera idsopenclaw nodes camera snap --node <id> # prints saved pathopenclaw nodes camera snap --node <id> --max-width 1280openclaw nodes camera snap --node <id> --delay-ms 2000openclaw nodes camera snap --node <id> --device-id <id>openclaw nodes camera clip --node <id> --duration 10s # prints saved pathopenclaw nodes camera clip --node <id> --duration-ms 3000 # prints saved path (legacy flag)openclaw nodes camera clip --node <id> --device-id <id>openclaw nodes camera clip --node <id> --no-audioUwagi:
openclaw nodes camera snapdomyślnie używamaxWidth=1600, chyba że zostanie to nadpisane.- W macOS
camera.snapczeka przezdelayMs(domyślnie 2000 ms) po rozgrzaniu/ustabilizowaniu ekspozycji przed przechwyceniem. - Ładunki zdjęć są ponownie kompresowane, aby utrzymać base64 poniżej 5 MB.
Bezpieczeństwo i praktyczne limity
- Dostęp do kamery i mikrofonu uruchamia zwykłe monity o uprawnienia systemu operacyjnego (i wymaga ciągów użycia w Info.plist).
- Klipy wideo są ograniczane (obecnie
<= 60s), aby uniknąć zbyt dużych ładunków węzła (narzut base64 + limity wiadomości).
Wideo ekranu macOS (na poziomie systemu operacyjnego)
Dla wideo ekranu (nie kamery) użyj aplikacji towarzyszącej macOS:
openclaw nodes screen record --node <id> --duration 10s --fps 15 # prints saved pathUwagi:
- Wymaga uprawnienia macOS Screen Recording (TCC).