跳到主要内容

🧠 Memory 内存

为了实现给定的目标,AI 代理执行多种任务,考虑到它们自己的执行历史。当代理长时间运行时,这成为一个问题,因为它们的记忆通常只有上下文长度那么大。在 GPT-3.5 和 GPT-4 的情况下,这大约是 8k 个令牌。

这意味着使用 Ultra-GPT 后,一旦您的代理程序运行了几次循环,它们就完全忘记了之前做过的事情。为了解决这个问题,我们需要将代理程序的记忆外部保存,这正是向量数据库发挥作用的地方。

什么是向量数据库?

要最好地了解向量数据库,我们建议查看外部文档,如 Weaviate 文档

本质上,向量数据库允许我们将任务和任务执行历史外部保存,使代理程序能够访问许多先前循环的记忆。这是通过对文本进行相似性搜索来完成的。

直观地说,当我们人类想要记住某些东西时,我们尝试想到与之相关的东西。最终,我们在脑海中找到了与该主题相关的信息集合,并采取行动。这个框架类似于向量数据库的操作方式。

Weaviate

Ultra-GPT 默认使用的向量数据库是 Weaviate。我们选择使用它们有以下原因:

  • 它们是开源的,并且通过 docker-compose 很容易访问。这意味着本地 Ultra-GPT 运行不需要您生成 API 密钥。
  • 它们有一个云提供程序,可以随着我们的工作负载扩展,使我们避免管理更多的基础设施
  • 它们与 LangChain 等工具集成良好