相机捕获(Agent)
OpenClaw 支持用于 Agent 工作流程的相机捕获:- iOS 节点(通过网关配对):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。 - Android 节点(通过网关配对):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。 - macOS 应用(通过网关的节点):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。
iOS 节点
用户设置(默认开启)
- iOS 设置标签页 → 相机 → 允许相机 (
camera.enabled)- 默认:开启(缺少键被视为启用)。
- 关闭时:
camera.*命令返回CAMERA_DISABLED。
命令(通过 Gateway node.invoke)
-
camera.list- 响应负载:
devices:{ id, name, position, deviceType }的数组
- 响应负载:
-
camera.snap- 参数:
facing:front|back(默认:front)maxWidth:数字(可选;iOS 节点默认1600)quality:0..1(可选;默认0.9)format:当前为jpgdelayMs:数字(可选;默认0)deviceId:字符串(可选;来自camera.list)
- 响应负载:
format: "jpg"base64: "<...>"width、height
- 负载保护:照片会被重新压缩以保持 base64 负载在 5 MB 以下。
- 参数:
-
camera.clip- 参数:
facing:front|back(默认:front)durationMs:数字(默认3000,最大限制为60000)includeAudio:布尔值(默认true)format:当前为mp4deviceId:字符串(可选;来自camera.list)
- 响应负载:
format: "mp4"base64: "<...>"durationMshasAudio
- 参数:
前台要求
与canvas.* 类似,iOS 节点仅在前台允许 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE。
CLI 辅助工具(临时文件 + MEDIA)
获取附件的最简单方式是通过 CLI 辅助工具,它将解码后的媒体写入临时文件并打印MEDIA:<path>。
示例:
nodes camera snap默认为前后双摄,以便为 Agent 提供两个视角。- 输出文件是临时的(在 OS 临时目录中),除非您构建自己的包装器。
Android 节点
用户设置(默认开启)
- Android 设置面板 → 相机 → 允许相机 (
camera.enabled)- 默认:开启(缺少键被视为启用)。
- 关闭时:
camera.*命令返回CAMERA_DISABLED。
权限
- Android 需要运行时权限:
CAMERA用于camera.snap和camera.clip。- 当
includeAudio=true时,camera.clip需要RECORD_AUDIO。
camera.* 请求将失败并返回 *_PERMISSION_REQUIRED 错误。
前台要求
与canvas.* 类似,Android 节点仅在前台允许 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE。
负载保护
照片会被重新压缩以保持 base64 负载在 5 MB 以下。macOS 应用
用户设置(默认关闭)
macOS 配套应用暴露一个复选框:- 设置 → 通用 → 允许相机 (
openclaw.cameraEnabled)- 默认:关闭
- 关闭时:相机请求返回”用户已禁用相机”。
CLI 辅助工具(节点调用)
使用主openclaw CLI 在 macOS 节点上调用相机命令。
示例:
openclaw nodes camera snap默认使用maxWidth=1600,除非被覆盖。- 在 macOS 上,
camera.snap在预热/曝光稳定后等待delayMs(默认 2000ms)再捕获。 - 照片负载会被重新压缩以保持 base64 在 5 MB 以下。
安全 + 实际限制
- 相机和麦克风访问会触发常规的 OS 权限提示(并需要在 Info.plist 中使用说明字符串)。
- 视频片段有上限(目前
<= 60s)以避免过大的节点负载(base64 开销 + 消息限制)。
macOS 屏幕视频(OS 级别)
对于屏幕视频(非相机),使用 macOS 配套应用:- 需要 macOS 屏幕录制权限(TCC)。