当前位置:首页 > 技术分析 > 正文内容

Redis也入坑了向量数据库,为生成式AI开发加了一把柴

ruisui884个月前 (03-10)技术分析16

作者丨Shritama Saha

编译丨诺亚

出品 | 51CTO技术栈(微信号:blog51cto)

向量数据库,一个从去年开始火到今年的概念,通常被认为是大模型的记忆海绵。

作为一种专门用于存储、 管理、查询、检索向量的数据库,向量数据库可以说是大模型落地行业场景必不可少的组成部分。

当然也有人曾指出,向量数据库这波热潮有不少炒作成分,到底是虚火还是实火,或许还要等时间验证。不过,这个赛道上入局的玩家已经越来越多了。比如大家耳熟能详的Redis。

Redis最近推出了一款名为Redis Vector Library的工具,旨在为生成式AI应用开发提供更为高效便捷的支持。

该库整合于Redis Enterprise平台中,作为一个专门针对向量搜索、LLM(大型语言模型)缓存以及聊天历史记录等场景的实时向量数据库系统。

Redis Vector Library的关键特性包括:

第一,简化客户端:专为搜索用向量嵌入设计,使得在AI驱动的任务中更容易使用向量数据。Python版本的Redis Vector Library(redisvl)是对现有广泛使用的redis-py客户端的扩展,能够与Redis实现无缝集成,以支持生成式AI应用程序。

第二,便捷安装与部署:通过pip包管理器即可安装此库;开发者可以选择在Redis Cloud上部署获得托管服务,或者利用Docker镜像进行本地开发环境搭建。

第三,精细化配置与自定义架构:该库还配备有专用CLI工具rvl,用于更方便地管理和操作向量数据。为了优化生产环境下的搜索性能,redisvl允许用户明确配置索引设置和数据集架构,并且采用YAML文件格式来简化自定义架构的定义、加载及管理工作。

另外,VectorQuery功能是redisvl的核心组件之一。VectorQuery致力于简化带有可选过滤条件的向量搜索过程,从而提高检索结果的精确度。除了基础查询外,还支持将结构化数据的搜索与基于向量相似性的搜索相结合。

此外,该库还包含一个内建的vectoriser模块,可以生成并管理各种流行嵌入技术提供的向量表示,如Cohere、OpenAI、VertexAI和HuggingFace等平台的嵌入模型,进一步增强了AI应用的能力范围。

Redisvl 还集成了语义缓存功能,通过基于语义相似性缓存响应来提升与大模型(LLMs)交互的应用程序效率。这一特性声称能够通过复用,针对相似查询的先前缓存响应,从而减少响应时间和API调用成本。该库旨在未来提供LLM会话管理和上下文访问控制的抽象接口,以进一步增强对LLM资源使用的优化和安全控制。

参考链接:
https://analyticsindiamag.com/redis-unveils-redis-vector-library-for-generative-ai-development/

来源: 51CTO技术栈

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/2671.html

分享给朋友:

“Redis也入坑了向量数据库,为生成式AI开发加了一把柴” 的相关文章

Win+Ubuntu缝合怪:第三方开发者推出“Wubuntu”Linux发行版

IT之家 2 月 26 日消息,一位第三方开发者推出了一款名为“Wubuntu”的缝合怪 Linux 发行版,系统本身基于 Ubuntu,但界面为微软 Windows 11 风格,甚至存在微软 Windows 徽标。据介绍,这款 Wubuntu 发行版旨在为习惯使用 Windows 11 的用户打造...

发行版Vanilla OS 2发布稳定版:彻底重写、改变使用Linux的方式

Vanilla OS 是去年崭露头角的 Linux 发行版,最初的 1.0 版本基于 Ubuntu 构建 —— 亮点之一是系统核心“不可变”。后来改用 Debian 测试分支 (Debian Sid),免费且开源,默认桌面环境是 GNOME。什么是不可变 Linux 发行版?不可变发行版确保操作系统...

前后端分离自动化运维平台开发

运维平台采用前后端分离:前端vue,框架vue-element-admin;后端python,框架django-rest-framework.目前运维平台模块如下:1、 CMDB管理应用管理、环境管理、开发语言管理、产品项目管理、资产管理2、 构建发布持续构建、持续部署、Jar工程依赖构建3、 容器...

使用cgroup限制进程资源

这里使用containerd项目中的cgroup包来实现进程资源限制。先写一个耗费一个CPU并且一秒增加10m内存的测试进程package mainimport ( "fmt" "math/rand" "time")func main() { go f...

我的VIM配置

写一篇关于VIM配置的文章,记录下自己的VIM配置,力求简洁实用。VIM的配置保存在文件~/.vimrc中(Windows下是C:\Users\yourname \_vimrc)。VIM除了自身可配置项外,还可插件扩展。VIM的插件一般用vundle或vim-plug来管理,但我力求简单,不打算装太...

虚幻引擎5.5发布

IT之家 11 月 13 日消息,虚幻引擎 5.5 现已发布。据介绍,新版本虚幻引擎在动画创作、虚拟制作和移动游戏开发方面取得进步;渲染、摄像机内视觉特效和开发人员迭代等领域的部分功能已可用于生产。IT之家整理部分功能亮点如下:动画Sequencer增强虚幻引擎的非线性动画编辑器 Sequencer...