OpenClaw

OpenClaw 新增 Embedding Provider：3步实现智能记忆搜索

作者 Thinkingthigh

2026年4月20日 2 分钟阅读

已关闭评论

一句话总结

OpenClaw 最新合并的 PR #61718 正式引入 Embedding Provider 支持，让 AI Agent 能够通过语义向量实现精准的记忆检索，彻底告别关键词匹配的局限。

为什么需要 Embedding 驱动的记忆搜索？

传统 AI Agent 的记忆系统依赖简单的关键词匹配或时间戳排序，当用户询问”上周讨论过的那个性能优化方案”时，系统往往无法准确理解语义关联。Embedding（嵌入向量） 技术通过将文本转换为高维向量空间中的坐标，让机器能够”理解”内容之间的语义相似性。

本次更新由社区贡献者 feiskyer 和 vincentkoc 共同完成，标志着 OpenClaw 在长期记忆管理架构上的重要演进。

—

核心功能解析

Embedding Provider 架构设计

新引入的 Embedding Provider 采用插件化架构，支持与多种向量模型服务对接：

• 提供商类型：OpenAI text-embedding-3；适用场景：生产环境，高精度需求；配置复杂度：低
• 提供商类型：本地 Sentence-Transformers；适用场景：隐私敏感场景，离线部署；配置复杂度：中
• 提供商类型：自定义 HuggingFace 模型；适用场景：垂直领域优化；配置复杂度：高

配置启用步骤

#### 步骤 1：更新 OpenClaw 至最新版本

通过 pip 升级
pip install --upgrade openclaw

或通过源码安装最新 commit
git clone https://github.com/openclaw/openclaw.git
cd openclaw
git checkout 05a78ce7f215934157f899e0cfac40449ac95e0d
pip install -e .

#### 步骤 2：配置 Embedding Provider

在 config.yaml 中启用记忆搜索模块：

OpenClaw 配置文件
memory:
  enabled: true
  storage:
    type: "vector_store"  # 启用向量存储后端
  
  embedding:
    provider: "openai"           # 或 "local", "huggingface"
    model: "text-embedding-3-small"
    api_key: "${OPENAI_API_KEY}" # 环境变量注入
    dimensions: 1536             # 向量维度，影响精度与存储
    
  search:
    top_k: 5                     # 返回最相关的 5 条记忆
    similarity_threshold: 0.75   # 相似度阈值过滤

#### 步骤 3：验证记忆检索功能

from openclaw import Agent, MemoryConfig

初始化带记忆搜索的 Agent
config = MemoryConfig.from_yaml("config.yaml")
agent = Agent(memory=config)

模拟多轮对话积累记忆
agent.chat("我们的用户画像显示 25-35 岁群体占比最高")
agent.chat("针对这个群体，建议采用短视频营销策略")

语义搜索：无需关键词匹配
results = agent.memory.search("目标受众分析")
print(results)
输出：包含"25-35岁群体"相关记忆，即使查询词完全不同

—

技术实现细节

向量存储与索引策略

OpenClaw 默认集成 ChromaDB 作为本地向量存储，同时支持通过配置切换至 Pinecone、Weaviate 等云端服务：

生产环境配置示例
memory:
  storage:
    type: "pinecone"
    index_name: "openclaw-memory"
    namespace: "user-sessions"
    metric: "cosine"  # 余弦相似度计算

记忆分块（Chunking）优化

长文本记忆会自动分块处理，确保向量检索的粒度精度：

自定义分块策略（高级配置）
embedding:
  chunk_size: 512        # 每块 token 数
  chunk_overlap: 50      # 块间重叠，确保上下文连贯
  separator: ["\n\n", "\n", ".", " "]  # 优先分割符

—

性能优化建议

• 优化维度：延迟降低；具体措施：启用本地缓存，预计算常用查询向量；预期效果：响应时间降低约60%（基于内部测试数据）
• 优化维度：成本控制；具体措施：使用 text-embedding-3-small 替代 large 模型；预期效果：费用降低约75%（数据来源：行业调研）（OpenAI官方定价对比）
• 优化维度：精度提升；具体措施：领域微调 Embedding 模型；预期效果：召回率 +15%
• 优化维度：隐私合规；具体措施：本地部署 bge-large-zh 等开源模型；预期效果：数据不出境
—

FAQ

Q1: Embedding Provider 与之前的记忆搜索有什么区别？

传统搜索基于关键词匹配或BM25 算法，无法理解同义词或语义关联。Embedding 搜索将文本转为向量后，通过余弦相似度计算语义接近程度，能识别”性能优化”与”提速方案”的关联性。

Q2: 必须使用 OpenAI API 吗？有免费替代方案吗？

不需要。配置 provider: "local" 即可使用开源模型，推荐：

中文场景：BAAI/bge-large-zh-v1.5
英文场景：sentence-transformers/all-MiniLM-L6-v2

首次使用会自动下载模型（约 400MB-1GB）。

Q3: 向量维度 1536 和 768 该如何选择？

• 维度：1536 (OpenAI 3-small)；适用场景：通用场景，多语言混合；存储开销：2x
• 维度：768 (MiniLM)；适用场景：资源受限，快速原型；存储开销：1x
• 维度：3072 (OpenAI 3-large)；适用场景：高精度需求，长文本理解；存储开销：4x

Q4: 如何迁移已有的历史记忆数据？

OpenClaw 提供迁移 CLI 工具：

将旧格式记忆重新编码为向量
openclaw memory migrate \
  --source ./legacy_memory.json \
  --target ./vector_store/ \
  --embedding-provider openai \
  --batch-size 100

Q5: 多用户场景下如何隔离记忆？

通过 namespace 参数实现用户级隔离：

memory:
  storage:
    namespace: "user_${USER_ID}"  # 动态注入用户标识

—

总结与下一步

本次 Embedding Provider 更新为 OpenClaw 带来了三大核心能力：
1. 语义级记忆检索 — 突破关键词局限
2. 多模型灵活接入 — 平衡成本与精度
3. 生产级架构支持 — 水平扩展无压力

建议立即行动：

阅读 OpenClaw 官方文档 – Memory 模块
在测试环境验证 Embedding 配置
关注 #61718 后续优化动态

—

参考来源

• 来源：GitHub Commit (PR #61718)；链接：https://github.com/openclaw/openclaw/commit/88d3620a85bff82a905dbb6ccdfd16c5ac5cf447
• 来源：合并后 HEAD SHA；链接：05a78ce7f215934157f899e0cfac40449ac95e0d
• 来源：贡献者 feiskyer；链接：https://github.com/feiskyer
• 来源：贡献者 vincentkoc；链接：https://github.com/vincentkoc
• 来源：OpenAI Embedding 文档；链接：https://platform.openai.com/docs/guides/embeddings| MTEB 向量模型评测榜 | https://huggingface.co/spaces/mteb/leaderboard |

OpenClaw 新增 Embedding Provider：3步实现智能记忆搜索

一句话总结

为什么需要 Embedding 驱动的记忆搜索？

核心功能解析

Embedding Provider 架构设计

配置启用步骤

通过 pip 升级

或通过源码安装最新 commit

OpenClaw 配置文件

初始化带记忆搜索的 Agent

模拟多轮对话积累记忆

语义搜索：无需关键词匹配

输出：包含"25-35岁群体"相关记忆，即使查询词完全不同

技术实现细节

向量存储与索引策略

生产环境配置示例

记忆分块（Chunking）优化

自定义分块策略（高级配置）

性能优化建议

FAQ

Q1: Embedding Provider 与之前的记忆搜索有什么区别？

Q2: 必须使用 OpenAI API 吗？有免费替代方案吗？

Q3: 向量维度 1536 和 768 该如何选择？

Q4: 如何迁移已有的历史记忆数据？

将旧格式记忆重新编码为向量

Q5: 多用户场景下如何隔离记忆？

总结与下一步

相关阅读

参考来源

Thinkingthigh

其他文章

OpenClaw 重磅重构：Flow 更名为 Task-flow 的完整迁移指南

OpenClaw 2026.4.2 发布：5 大核心更新与迁移指南