OpenClaw 三大 AI 提供商文档重写:Cerebras、Groq、SGLang 代码级验证配置指南
—# OpenClaw 三大 AI 提供商文档重写:Cerebras、Groq、SGLang 代码级验证配置指南
OpenClaw 最新版本对三大高性能 AI 推理提供商的文档进行了全面重构,实现了代码级验证的配置流程。本文将详细介绍 Cerebras、Groq 和 SGLang 的新特性,包括扩展的模型目录、推理能力标识、以及更精确的 onboarding 引导,帮助开发者快速接入这些前沿 AI 服务。
—
为什么这次更新很重要?
在 AI Agent 开发中,配置准确性直接影响模型调用成功率。本次更新将文档与实际代码(openclaw.plugin.json)进行严格对齐,消除了文档与实现之间的信息差,确保开发者看到的每一个参数、每一个模型 ID 都能在真实环境中生效。
—
Cerebras 更新详解:推理能力一目了然
完整属性摘要与多路径配置
Cerebras 文档现在包含完整的 properties summary,清晰列出所有可配置参数:
| 属性 | 说明 | 示例值 |
|:—|:—|:—|
| apiKey | Z.ai 平台 API 密钥 | sk-cbr-... |
| baseURL | 自定义端点(可选) | https://api.cerebras.ai/v1 |
| defaultModel | 默认调用模型 | cerebras/llama-3.1-8b |
配置方式支持三种路径,通过 CodeGroup 呈现:
方式一:交互式引导(推荐新手)
openclaw onboard cerebras
方式二:直接指定 API 密钥
openclaw onboard --auth-choice cerebras-api-key
方式三:环境变量注入
export CEREBRAS_API_KEY="sk-cbr-xxx"
openclaw onboard cerebras --env
四模型目录与推理能力标识
Cerebras 当前提供 4 个核心模型,新增 Reasoning 列明确标识推理能力:
| 模型名称 | 上下文窗口 | 推理能力 | 适用场景 |
|:—|:—|:—|:—|
| Z.ai GLM 4.7 | 128K | ✅ 支持 | 复杂逻辑推理、数学证明 |
| GPT OSS 120B | 128K | ✅ 支持 | 开源替代方案、长文本推理 |
| Qwen 3 235B | 128K | ❌ 不支持 | 通用对话、代码生成 |
| Llama 3.1 8B | 128K | ❌ 不支持 | 低延迟场景、边缘部署 |
> 关键洞察:GLM 4.7 和 GPT OSS 120B 明确支持 reasoning 模式,在需要多步逻辑的任务中优先选用。
—
Groq 重大扩展:从 4 个到 18 个模型
完整模型目录与元数据
Groq 文档实现了最大规模的扩展,模型条目从 4 个精选模型 扩展到 18 个全量捆绑模型,每个条目包含:
- Model Ref:精确的模型引用标识符
- Reasoning Flag:是否支持推理模式
- Input Modalities:支持的输入类型(text / audio / image)
- Context Window:上下文窗口大小
// 示例:Groq 模型配置片段(来自 extensions/groq/openclaw.plugin.json)
{
"id": "llama-3.3-70b-versatile",
"name": "Llama 3.3 70B",
"contextWindow": 128000,
"supportsReasoning": false,
"inputModalities": ["text"]
}
清理过时信息
重要修正:移除了已不存在的 Mixtral 8x7B 模型条目,避免开发者配置错误。
音频理解合约详解
Groq 独特的音频媒体理解能力现在通过属性表完整呈现:
| 音频模型 | 优先级 | 自动触发条件 |
|:—|:—|:—|
| whisper-large-v3-turbo | 20 | 输入包含音频 URL 或 base64 |
启用音频理解(自动路由到 whisper-large-v3-turbo)
openclaw chat --provider groq --input "https://example.com/audio.mp3"
推理力度映射(reasoning_effort)
针对不同模型的推理控制策略:
| 模型 | reasoning_effort 映射 | 说明 |
|:—|:—|:—|
| qwen/qwen3-32b | 支持 low/medium/high | 显式分级控制 |
| GPT OSS 推理系列 | 固定最大推理深度 | 自动优化,不可调节 |
修正 Onboarding 流程
关键修复:确保 API 密钥步骤不跳过完整的交互流程:
✅ 正确的完整引导(更新后)
openclaw onboard --auth-choice groq-api-key
系统将依次提示:
1. 确认 provider 选择
2. 输入 API 密钥
3. 选择默认模型
4. 验证连接状态
—
SGLang 更新:自托管部署更清晰
顶部属性摘要表
SGLang 文档新增属性摘要表,关键配置一目了然:
| 属性 | 值 | 来源 |
|:—|:—|:—|
| 默认模型 | Qwen/Qwen3-8B | extensions/sglang/defaults.ts |
| 流式使用统计 | ✅ supportsStreamingUsage: true | 运行时标志 |
| 外部定价 | ❌ modelPricing.external: false | 配置项 |
特殊的 Onboarding 标识
重要区别:SGLang 使用裸 sglang 作为 choice ID,不带 -api-key 后缀:
✅ SGLang 正确配置
openclaw onboard sglang
❌ 错误(其他 provider 的惯例)
openclaw onboard sglang-api-key # 将报错!
这与 extensions/sglang/openclaw.plugin.json 中的 manifest 定义严格一致。
自托管端点配置
连接到本地 SGLang 实例
openclaw onboard sglang --base-url http://localhost:30000/v1
—
快速对比:三大提供商选型指南
| 维度 | Cerebras | Groq | SGLang |
|:—|:—|:—|:—|
| 部署模式 | 云端托管 | 云端托管 | 自托管/本地 |
| 模型数量 | 4 个精选 | 18 个全量 | 自定义 |
| 特色能力 | 超快推理速度 | 音频理解、多模态 | 完全可控 |
| 推理标识 | ✅ 明确标注 | ✅ 详细分级 | 依赖自定义配置 |
| 配置复杂度 | 低 | 中 | 高(需自建) |
| 适用场景 | 生产环境快速接入 | 多模态 AI 应用 | 隐私敏感/合规场景 |
—
常见问题 FAQ
Q1: 如何判断我的任务是否需要 reasoning 能力的模型?
A: 如果任务涉及多步逻辑推导、数学证明、复杂决策分析,选择标注 ✅ 支持推理 的模型(如 Cerebras 的 GLM 4.7 或 GPT OSS 120B)。对于简单问答、代码补全等场景,普通模型性价比更高。
Q2: Groq 的音频理解如何计费?
A: 音频输入通过 whisper-large-v3-turbo 自动处理,优先级为 20(高于普通文本模型)。具体定价请参考 Groq 官方定价页,音频转录按秒计费。
Q3: 为什么 SGLang 的 onboarding 命令不带 -api-key?
A: SGLang 是自托管方案,认证方式由部署者自定义(可能使用 API 密钥、JWT 或无认证)。OpenClaw 通过裸 sglang ID 匹配 manifest 中的 custom 认证方法,保持灵活性。
Q4: 更新后现有的 Groq 配置会失效吗?
A: 不会。已配置的 API 密钥和参数仍然有效。但建议运行 openclaw provider update groq 同步最新模型目录,以访问新增的 14 个模型。
Q5: 如何验证我的配置与代码完全一致?
A: 使用 OpenClaw 的验证命令:
openclaw doctor --provider cerebras # 或 groq, sglang
该命令会比对本地配置与 extensions/*/openclaw.plugin.json 的代码定义。
—
总结与下一步
本次更新实现了 OpenClaw 文档的代码级可信度:
1. Cerebras:4 模型清晰标注推理能力,三路径配置覆盖全场景
2. Groq:18 模型全目录 + 音频合约 + 推理力度分级
3. SGLang:自托管配置规范化,特殊 onboarding 逻辑明确
推荐行动:
- 新用户:运行
openclaw onboard [provider]体验更新后的引导流程 - 现有用户:执行
openclaw provider list --updates检查配置同步状态 - 进阶开发者:直接查阅 OpenClaw 扩展源码 验证文档准确性
—
相关阅读
—
参考来源
- OpenClaw GitHub Commit 58c7064 – 本次更新的完整代码变更
- Cerebras 官方文档 – Z.ai 平台技术参考
- Groq 开发者中心 – API 与模型详情
- SGLang 项目主页 – 自托管推理引擎
- 阅读原文:OpenClaw 教学小站