Capture caméra (agent)
OpenClaw prend en charge la capture caméra pour les workflows d’agent :- Nœud iOS (jumelé via la gateway) : capturer une photo (
jpg) ou un court clip vidéo (mp4, avec audio facultatif) vianode.invoke. - Nœud Android (jumelé via la gateway) : capturer une photo (
jpg) ou un court clip vidéo (mp4, avec audio facultatif) vianode.invoke. - Application macOS (nœud via la gateway) : capturer une photo (
jpg) ou un court clip vidéo (mp4, avec audio facultatif) vianode.invoke.
Nœud iOS
Paramètre utilisateur (activé par défaut)
- Onglet Réglages iOS → Camera → Allow Camera (
camera.enabled)- Par défaut : activé (une clé manquante est traitée comme activée).
- Lorsqu’il est désactivé : les commandes
camera.*renvoientCAMERA_DISABLED.
Commandes (via node.invoke de la gateway)
-
camera.list- Charge utile de réponse :
devices: tableau de{ id, name, position, deviceType }
- Charge utile de réponse :
-
camera.snap- Paramètres :
facing:front|back(par défaut :front)maxWidth: nombre (facultatif ; valeur par défaut1600sur le nœud iOS)quality:0..1(facultatif ; valeur par défaut0.9)format: actuellementjpgdelayMs: nombre (facultatif ; valeur par défaut0)deviceId: chaîne (facultatif ; à partir decamera.list)
- Charge utile de réponse :
format: "jpg"base64: "<...>"width,height
- Garde-fou de charge utile : les photos sont recompressées pour maintenir la charge utile base64 en dessous de 5 Mo.
- Paramètres :
-
camera.clip- Paramètres :
facing:front|back(par défaut :front)durationMs: nombre (par défaut3000, limité à un maximum de60000)includeAudio: booléen (par défauttrue)format: actuellementmp4deviceId: chaîne (facultatif ; à partir decamera.list)
- Charge utile de réponse :
format: "mp4"base64: "<...>"durationMshasAudio
- Paramètres :
Exigence de premier plan
Commecanvas.*, le nœud iOS n’autorise les commandes camera.* qu’au premier plan. Les invocations en arrière-plan renvoient NODE_BACKGROUND_UNAVAILABLE.
Assistant CLI (fichiers temporaires + MEDIA)
Le moyen le plus simple d’obtenir des pièces jointes est d’utiliser l’assistant CLI, qui écrit le média décodé dans un fichier temporaire et afficheMEDIA:<path>.
Exemples :
nodes camera snaputilise par défaut les deux orientations afin de fournir les deux vues à l’agent.- Les fichiers de sortie sont temporaires (dans le répertoire temporaire du système d’exploitation), sauf si vous créez votre propre wrapper.
Nœud Android
Paramètre utilisateur Android (activé par défaut)
- Feuille Réglages Android → Camera → Allow Camera (
camera.enabled)- Par défaut : activé (une clé manquante est traitée comme activée).
- Lorsqu’il est désactivé : les commandes
camera.*renvoientCAMERA_DISABLED.
Autorisations
- Android nécessite des autorisations d’exécution :
CAMERApourcamera.snapetcamera.clip.RECORD_AUDIOpourcamera.cliplorsqueincludeAudio=true.
camera.* échouent avec une erreur *_PERMISSION_REQUIRED.
Exigence de premier plan sur Android
Commecanvas.*, le nœud Android n’autorise les commandes camera.* qu’au premier plan. Les invocations en arrière-plan renvoient NODE_BACKGROUND_UNAVAILABLE.
Commandes Android (via node.invoke de la gateway)
camera.list- Charge utile de réponse :
devices: tableau de{ id, name, position, deviceType }
- Charge utile de réponse :
Garde-fou de charge utile
Les photos sont recompressées pour maintenir la charge utile base64 en dessous de 5 Mo.Application macOS
Paramètre utilisateur (désactivé par défaut)
L’application compagnon macOS expose une case à cocher :- Settings → General → Allow Camera (
openclaw.cameraEnabled)- Par défaut : désactivé
- Lorsqu’il est désactivé : les requêtes caméra renvoient « Camera disabled by user ».
Assistant CLI (node invoke)
Utilisez la CLI principaleopenclaw pour invoquer des commandes caméra sur le nœud macOS.
Exemples :
openclaw nodes camera snaputilisemaxWidth=1600par défaut, sauf remplacement.- Sur macOS,
camera.snapattenddelayMs(2000 ms par défaut) après la phase de préchauffage/stabilisation de l’exposition avant de capturer. - Les charges utiles photo sont recompressées pour maintenir le base64 en dessous de 5 Mo.
Sécurité + limites pratiques
- L’accès à la caméra et au microphone déclenche les invites d’autorisation habituelles du système d’exploitation (et nécessite des chaînes d’utilisation dans Info.plist).
- Les clips vidéo sont limités (actuellement
<= 60s) pour éviter des charges utiles de nœud trop volumineuses (surcharge base64 + limites de message).
Vidéo d’écran macOS (niveau système)
Pour la vidéo d’écran (et non la caméra), utilisez l’application compagnon macOS :- Nécessite l’autorisation macOS Screen Recording (TCC).