跳转到主要内容

日志

OpenClaw 有两个主要的日志表面:
  • 文件日志(JSON 行),由 Gateway 网关写入。
  • 控制台输出,显示在终端和 Gateway 网关调试 UI 中。
Control UI 的 Logs 标签页会跟随 Gateway 网关文件日志。本页说明 日志存放位置、如何读取它们,以及如何配置日志级别和格式。

日志存放位置

默认情况下,Gateway 网关会将滚动日志文件写入: /tmp/openclaw/openclaw-YYYY-MM-DD.log 日期使用 Gateway 网关宿主机的本地时区。 你可以在 ~/.openclaw/openclaw.json 中覆盖此设置:
{
  "logging": {
    "file": "/path/to/openclaw.log"
  }
}

如何读取日志

CLI:实时跟随输出(推荐)

使用 CLI 通过 RPC 跟随 Gateway 网关日志文件:
openclaw logs --follow
当前实用选项:
  • --local-time:使用你的本地时区渲染时间戳
  • --url <url> / --token <token> / --timeout <ms>:标准 Gateway 网关 RPC 标志
  • --expect-final:由智能体支持的 RPC 最终响应等待标志(这里通过共享客户端层接受)
输出模式:
  • TTY 会话:美观、带颜色、结构化的日志行。
  • 非 TTY 会话:纯文本。
  • --json:行分隔 JSON(每行一个日志事件)。
  • --plain:在 TTY 会话中强制使用纯文本。
  • --no-color:禁用 ANSI 颜色。
当你传入显式 --url 时,CLI 不会自动应用配置或 环境变量凭证;如果目标 Gateway 网关 需要鉴权,请自行传入 --token 在 JSON 模式下,CLI 会输出带 type 标签的对象:
  • meta:流元数据(文件、cursor、大小)
  • log:解析后的日志条目
  • notice:截断/轮转提示
  • raw:未解析的日志行
如果本地 loopback Gateway 网关要求配对,openclaw logs 会自动回退到 已配置的本地日志文件。显式 --url 目标不会 使用此回退。 如果 Gateway 网关不可访问,CLI 会打印一个简短提示,建议运行:
openclaw doctor

Control UI(Web)

Control UI 的 Logs 标签页会使用 logs.tail 跟随同一个文件。 有关如何打开它,请参见 /web/control-ui

仅渠道日志

若要过滤渠道活动(WhatsApp/Telegram 等),请使用:
openclaw channels logs --channel whatsapp

日志格式

文件日志(JSONL)

日志文件中的每一行都是一个 JSON 对象。CLI 和 Control UI 会解析这些 条目,以渲染结构化输出(时间、级别、子系统、消息)。

控制台输出

控制台日志是TTY 感知的,并为可读性进行格式化:
  • 子系统前缀(例如 gateway/channels/whatsapp
  • 级别着色(info/warn/error)
  • 可选紧凑模式或 JSON 模式
控制台格式由 logging.consoleStyle 控制。

Gateway WebSocket 日志

openclaw gateway 还提供用于 RPC 流量的 WebSocket 协议日志:
  • 普通模式:仅显示值得关注的结果(错误、解析错误、慢调用)
  • --verbose:显示所有请求/响应流量
  • --ws-log auto|compact|full:选择详细渲染样式
  • --compact--ws-log compact 的别名
示例:
openclaw gateway
openclaw gateway --verbose --ws-log compact
openclaw gateway --verbose --ws-log full

配置日志

所有日志配置都位于 ~/.openclaw/openclaw.jsonlogging 下。
{
  "logging": {
    "level": "info",
    "file": "/tmp/openclaw/openclaw-YYYY-MM-DD.log",
    "consoleLevel": "info",
    "consoleStyle": "pretty",
    "redactSensitive": "tools",
    "redactPatterns": ["sk-.*"]
  }
}

日志级别

  • logging.level文件日志(JSONL)级别。
  • logging.consoleLevel控制台详细程度级别。
你可以通过 OPENCLAW_LOG_LEVEL 环境变量覆盖这两个值(例如 OPENCLAW_LOG_LEVEL=debug)。该环境变量优先于配置文件,因此你可以在不编辑 openclaw.json 的情况下,仅为单次运行提高详细程度。你也可以传入全局 CLI 选项 --log-level <level>(例如,openclaw --log-level debug gateway run),它会在该命令中覆盖环境变量。 --verbose 只影响控制台输出和 WS 日志详细程度;不会改变 文件日志级别。

控制台样式

logging.consoleStyle
  • pretty:适合人类阅读,带颜色和时间戳。
  • compact:更紧凑的输出(最适合长会话)。
  • json:每行一个 JSON(适合日志处理器)。

脱敏

工具摘要可以在输出到控制台前对敏感 token 进行脱敏:
  • logging.redactSensitiveoff | tools(默认:tools
  • logging.redactPatterns:用于覆盖默认集合的正则字符串列表
脱敏仅影响控制台输出,不会修改文件日志。

诊断 + OpenTelemetry

诊断是面向模型运行以及 消息流遥测(webhook、排队、会话状态)的结构化、机器可读事件。它们不会 替代日志;它们的存在是为了向指标、追踪和其他导出器提供数据。 诊断事件会在进程内发出,但只有在启用了 diagnostics + 导出器插件时,导出器才会附加。

OpenTelemetry 与 OTLP

  • OpenTelemetry(OTel):用于追踪、指标和日志的数据模型 + SDK。
  • OTLP:将 OTel 数据导出到 collector/后端所使用的线协议。
  • OpenClaw 当前通过 OTLP/HTTP(protobuf) 进行导出。

导出的信号

  • 指标:计数器 + 直方图(token 使用量、消息流、排队)。
  • 追踪:模型使用情况 + webhook/消息处理的 span。
  • 日志:当启用 diagnostics.otel.logs 时通过 OTLP 导出。日志 量可能很大;请留意 logging.level 和导出器过滤器。

诊断事件目录

模型使用情况:
  • model.usage:token、成本、时长、上下文、provider/model/channel、session id。
消息流:
  • webhook.received:按渠道记录的 webhook 入站。
  • webhook.processed:webhook 已处理 + 耗时。
  • webhook.error:webhook 处理器错误。
  • message.queued:消息已入队等待处理。
  • message.processed:结果 + 耗时 + 可选错误。
队列 + 会话:
  • queue.lane.enqueue:命令队列 lane 入队 + 深度。
  • queue.lane.dequeue:命令队列 lane 出队 + 等待时间。
  • session.state:会话状态转换 + 原因。
  • session.stuck:会话卡住警告 + 持续时间。
  • run.attempt:运行重试/尝试元数据。
  • diagnostic.heartbeat:聚合计数器(webhook/队列/会话)。

启用诊断(无导出器)

如果你希望诊断事件可供插件或自定义 sink 使用,请这样设置:
{
  "diagnostics": {
    "enabled": true
  }
}

诊断标志(定向日志)

使用标志可以打开额外的定向调试日志,而无需提高 logging.level。 标志不区分大小写,并支持通配符(例如 telegram.**)。
{
  "diagnostics": {
    "flags": ["telegram.http"]
  }
}
环境变量覆盖(一次性):
OPENCLAW_DIAGNOSTICS=telegram.http,telegram.payload
说明:
  • 标志日志会写入标准日志文件(与 logging.file 相同)。
  • 输出仍然会按照 logging.redactSensitive 进行脱敏。
  • 完整指南:/diagnostics/flags

导出到 OpenTelemetry

可以通过 diagnostics-otel 插件(OTLP/HTTP)导出诊断。这 适用于任何接受 OTLP/HTTP 的 OpenTelemetry collector/后端。
{
  "plugins": {
    "allow": ["diagnostics-otel"],
    "entries": {
      "diagnostics-otel": {
        "enabled": true
      }
    }
  },
  "diagnostics": {
    "enabled": true,
    "otel": {
      "enabled": true,
      "endpoint": "http://otel-collector:4318",
      "protocol": "http/protobuf",
      "serviceName": "openclaw-gateway",
      "traces": true,
      "metrics": true,
      "logs": true,
      "sampleRate": 0.2,
      "flushIntervalMs": 60000
    }
  }
}
说明:
  • 你也可以用 openclaw plugins enable diagnostics-otel 启用该插件。
  • protocol 当前仅支持 http/protobufgrpc 会被忽略。
  • 指标包括 token 使用量、成本、上下文大小、运行时长,以及消息流 计数器/直方图(webhook、排队、会话状态、队列深度/等待)。
  • 追踪/指标可以通过 traces / metrics 开关控制(默认:开启)。追踪 包括模型使用 span,以及在启用时的 webhook/消息处理 span。
  • 当你的 collector 需要鉴权时,请设置 headers
  • 支持的环境变量:OTEL_EXPORTER_OTLP_ENDPOINTOTEL_SERVICE_NAMEOTEL_EXPORTER_OTLP_PROTOCOL

导出的指标(名称 + 类型)

模型使用情况:
  • openclaw.tokens(计数器,属性:openclaw.tokenopenclaw.channelopenclaw.provideropenclaw.model
  • openclaw.cost.usd(计数器,属性:openclaw.channelopenclaw.provideropenclaw.model
  • openclaw.run.duration_ms(直方图,属性:openclaw.channelopenclaw.provideropenclaw.model
  • openclaw.context.tokens(直方图,属性:openclaw.contextopenclaw.channelopenclaw.provideropenclaw.model
消息流:
  • openclaw.webhook.received(计数器,属性:openclaw.channelopenclaw.webhook
  • openclaw.webhook.error(计数器,属性:openclaw.channelopenclaw.webhook
  • openclaw.webhook.duration_ms(直方图,属性:openclaw.channelopenclaw.webhook
  • openclaw.message.queued(计数器,属性:openclaw.channelopenclaw.source
  • openclaw.message.processed(计数器,属性:openclaw.channelopenclaw.outcome
  • openclaw.message.duration_ms(直方图,属性:openclaw.channelopenclaw.outcome
队列 + 会话:
  • openclaw.queue.lane.enqueue(计数器,属性:openclaw.lane
  • openclaw.queue.lane.dequeue(计数器,属性:openclaw.lane
  • openclaw.queue.depth(直方图,属性:openclaw.laneopenclaw.channel=heartbeat
  • openclaw.queue.wait_ms(直方图,属性:openclaw.lane
  • openclaw.session.state(计数器,属性:openclaw.stateopenclaw.reason
  • openclaw.session.stuck(计数器,属性:openclaw.state
  • openclaw.session.stuck_age_ms(直方图,属性:openclaw.state
  • openclaw.run.attempt(计数器,属性:openclaw.attempt

导出的 span(名称 + 关键属性)

  • openclaw.model.usage
    • openclaw.channelopenclaw.provideropenclaw.model
    • openclaw.sessionKeyopenclaw.sessionId
    • openclaw.tokens.*(input/output/cache_read/cache_write/total)
  • openclaw.webhook.processed
    • openclaw.channelopenclaw.webhookopenclaw.chatId
  • openclaw.webhook.error
    • openclaw.channelopenclaw.webhookopenclaw.chatIdopenclaw.error
  • openclaw.message.processed
    • openclaw.channelopenclaw.outcomeopenclaw.chatIdopenclaw.messageIdopenclaw.sessionKeyopenclaw.sessionIdopenclaw.reason
  • openclaw.session.stuck
    • openclaw.stateopenclaw.ageMsopenclaw.queueDepthopenclaw.sessionKeyopenclaw.sessionId

采样 + 刷新

  • 追踪采样:diagnostics.otel.sampleRate(0.0–1.0,仅根 span)。
  • 指标导出间隔:diagnostics.otel.flushIntervalMs(最小 1000ms)。

协议说明

  • OTLP/HTTP 端点可以通过 diagnostics.otel.endpointOTEL_EXPORTER_OTLP_ENDPOINT 设置。
  • 如果端点已包含 /v1/traces/v1/metrics,则按原样使用。
  • 如果端点已包含 /v1/logs,则会按原样用于日志。
  • diagnostics.otel.logs 会为主日志输出启用 OTLP 日志导出。

日志导出行为

  • OTLP 日志使用与写入 logging.file 相同的结构化记录。
  • 遵循 logging.level(文件日志级别)。控制台脱敏适用于 OTLP 日志。
  • 高流量安装应优先使用 OTLP collector 侧的采样/过滤。

故障排除提示

  • Gateway 网关不可访问? 先运行 openclaw doctor
  • 日志为空? 检查 Gateway 网关是否正在运行,并且正在向 logging.file 中的文件路径写入。
  • 需要更多细节?logging.level 设置为 debugtrace,然后重试。

相关内容