OpenClaw 2026.4.23 Beta 5 发布:5大新功能详解与配置指南
——
OpenClaw 2026.4.23 Beta 5 发布:5大新功能详解与配置指南
OpenClaw 2026.4.23 Beta 5 版本聚焦于图像生成能力扩展、Agent 上下文管理精细化以及多平台集成稳定性提升。本次更新让开发者无需 API Key 即可通过 OAuth 使用 OpenAI 图像模型,同时为复杂 AI 工作流提供了更灵活的子代理隔离机制。无论你是构建多模态应用还是优化本地部署性能,这篇指南将帮助你快速掌握关键变更。
—
一、免 API Key 图像生成:OpenAI 与 OpenRouter 双支持
OpenAI Codex OAuth 集成
最显著的改进是 OpenAI 图像生成 和 参考图编辑 现在支持通过 Codex OAuth 完成认证,无需配置 OPENAI_API_KEY 环境变量即可使用 openai/gpt-image-2 模型。
配置 Codex OAuth(无需 OPENAI_API_KEY)
在 OpenClaw 设置中启用 Codex 集成后,直接调用:
openclaw tools image_generate --model openai/gpt-image-2 --prompt "a futuristic cityscape"
OpenRouter 图像模型支持
OpenRouter 用户同样获得完整图像生成能力。配置 OPENROUTER_API_KEY 后,所有支持的图像模型均可通过统一的 image_generate 工具调用。
环境变量配置
export OPENROUTER_API_KEY="your_key_here"
调用示例
openclaw tools image_generate \
--provider openrouter \
--model "anthropic/claude-sonnet-4-20250514" \
--prompt "technical diagram of microservices architecture"
> 提示:首次使用 OpenRouter 图像功能需确认模型支持 image_generate 能力,详见 OpenClaw 文档 – 图像生成。
—
二、图像生成参数精细化控制
Beta 5 允许 AI Agent 在调用图像生成工具时传递更多 provider 特定参数,实现输出质量的细粒度控制:
| 参数类别 | OpenAI 专属参数 | 用途 |
|———|————–|——|
| 质量与格式 | quality, output_format | 控制生成质量与文件格式 |
| 背景处理 | background | 指定透明/纯色背景 |
| 内容安全 | moderation | 启用内容审核级别 |
| 压缩优化 | compression | 调整输出文件大小 |
| 用户标识 | user | 传递用户标识用于追踪 |
// Agent 调用 image_generate 时的完整参数示例
const result = await agent.tools.image_generate({
prompt: "product photo of wireless earbuds",
quality: "hd", // 高清质量
output_format: "png", // PNG 格式保留透明度
background: "transparent",
moderation: "strict", // 严格内容审核
compression: 80, // 80% 质量压缩
timeoutMs: 60000 // 60秒超时(见下文)
});
—
三、Agent 子进程上下文隔离:forked context 机制
默认行为 vs 继承模式
sessions_spawn 原生运行现在支持可选的 forked context 模式,解决了一个常见痛点:子代理是否需要继承父代理的对话历史?
| 模式 | 行为 | 适用场景 |
|—–|——|———|
| 默认(隔离) | 子代理获得干净会话 | 独立任务、安全沙箱 |
| forked context | 继承请求者完整对话记录 | 需要上下文的连续工作流 |
// 启用 forked context 的 Agent 配置
{
"name": "research_subagent",
"type": "subagent",
"sessions_spawn": {
"forked_context": true, // 继承父代理上下文
"inherit_transcript": true
},
"prompt_guidance": "基于上述讨论继续深入分析..."
}
该功能包含完整的 context-engine hook 元数据 支持,确保复杂调用链的可观测性。
—
四、生成工具超时精细化配置
图像、视频、音乐和 TTS(文本转语音) 生成工具现在支持 单次调用级别的 timeoutMs 参数,避免全局超时设置导致的灵活性不足:
// 不同生成任务的差异化超时配置
// 快速图像生成
await tools.image_generate({ prompt: "icon", timeoutMs: 15000 });
// 复杂视频生成(需要更长时间)
await tools.video_generate({
prompt: "3D animation of molecular structure",
timeoutMs: 300000 // 5分钟
});
// 高保真音乐生成
await tools.music_generate({
prompt: "orchestral soundtrack, 4 minutes",
timeoutMs: 180000,
quality: "master"
});
—
五、本地嵌入优化与 Pi 依赖升级
可配置的上下文窗口
本地嵌入模型 的上下文大小现在可通过 memorySearch.local.contextSize 配置,默认 4096 tokens,方便在资源受限主机上调整:
openclaw.config.yaml
memory:
local:
embeddings:
contextSize: 2048 # 降低以节省内存
# 或提升至 8192 以获得更高精度
Pi 包升级至 0.70.0
- 同步 Pi 上游
gpt-5.5目录元数据 - OpenAI 和 OpenAI Codex 模型配置自动对齐
- 本地仅保留
gpt-5.5-pro前向兼容处理
—
关键修复速览
| 问题领域 | 修复内容 | 影响 |
|———|———|——|
| Codex harness | request_user_input 正确路由回源聊天 | 交互式 Agent 体验提升 |
| WhatsApp 初始化 | 分离 Baileys 运行时依赖与首次设置 | QuickStart 安装更顺畅 |
| Slack 集成 | MPIM 群组 DM 正确分类,抑制工具进度泄露 | 企业协作场景更专业 |
| Windows 支持 | 自动解析 codex.cmd npm shim | 无需手动 .exe 包装 |
| 块流式传输 | 防止部分中止后的重复回复 | 消息可靠性提升 |
—
常见问题 FAQ
Q1: 没有 OPENAI_API_KEY 如何使用 gpt-image-2?
通过 Codex OAuth 认证。在 OpenClaw 设置中连接你的 OpenAI 账户,系统会自动处理 OAuth 流程,无需手动管理 API Key。配置完成后直接调用 openai/gpt-image-2 模型即可。
Q2: forked context 和默认隔离模式如何选择?
默认隔离模式 适合独立任务(如并行数据分析),确保子代理不受父对话干扰;forked context 适合需要连续上下文的场景(如多轮深度研究)。可通过 sessions_spawn.forked_context 参数动态切换。
Q3: 如何为特定生成任务设置不同的超时时间?
在调用 image_generate、video_generate、music_generate 或 TTS 工具时,直接添加 timeoutMs 参数覆盖全局设置。建议复杂视频生成设为 180-300 秒,快速图像生成保持 15-30 秒。
Q4: 本地嵌入的 contextSize 应该设置多少?
4096(默认) 适合大多数场景。如果主机内存 < 8GB,可降至 2048;如需处理长文档且内存充足,可尝试 8192。修改后需重启 OpenClaw 服务生效。
Q5: WhatsApp 集成在 Beta 5 有何改进?
首次设置流程现在与 Baileys 运行时依赖分离,意味着你可以在完成依赖安装前就开始配置 WhatsApp 账户。这对 Docker 部署和 CI/CD 流水线特别友好。
—
总结与下一步
OpenClaw 2026.4.23 Beta 5 的核心价值在于:降低图像生成门槛(OAuth 免 Key)、提升 Agent 架构灵活性(上下文隔离)、优化资源受限部署(可配置嵌入)。建议开发者:
1. 测试 Codex OAuth 图像生成工作流
2. 评估现有 Agent 是否需要迁移至 forked context 模式
3. 根据硬件资源调整 memorySearch.local.contextSize
—
相关阅读
—