Ana içeriğe geç

Vektör veritabanı EklentisiName

Zaman çizgisi

Vespa, ISO 25'e dayalı ana akım anahtar kelime arama algoritmasının yanına vektör 1.4 arama ekleyen ilk alıcılardan biridir.

Hedviate 2018'in sonunda özel bir açık kaynak vektör veritabanı ürünü başlattı.

2019'a kadar, Milkha da dahil olmak üzere bu alanda daha fazla rekabet görmeye başlayacağız. Tagliz, Milkha'nın ana şirketidir.

2021 yılında yarışmaya üç yeni tedarikçi katıldı: Vald, Qdrant ve Pinecon.

Ancak o zaman Elasticsearch, Redis ve Andromeda gibi yerleşik yerleşimler insanların düşündüğünden çok daha sonra vektör aramaya başladı, sadece 2022'de ve sonra.

image-20240125145334529

Açık kaynak ve ticaret

İş dünyası: çam kozalağı ve Tagliz

Fiş - Formda

  • pgvectorGenericName
  • Redis Stack.

image-20240125145550416

@ info: whatsthis

Veritabanı da destekler:

  • Relational veritabanı: RDS
  • Vektör veritabanı: pgvector
  • Zaman serileri veritabanı: zaman serileri veritabanı XML' de önemli bir rol oynar. Olayları ve olayları kaydeden bir veritabanıdır ve zaman serisi için arama hızı çok hızlıdır. Paçavra uygulamalarında, onbinlerce endüstri bilgi dosyası kesilirse, zaman aralığını kullanmak çok önemli olacak. Örneğin, sözleşme dosyalarını Mart 2023'te geri almamız gerekiyorsa, on binlerce kişiden hedef parça seçmek ve vektörü hesaplamak için zaman serisi verilerini kullanabiliriz.
image-20240125150309961

Timecale Vector prizi - girdi@ info: tooltip

Daha hızlı biyokimyasal araştırma: destek** Diskann** algoritma,** HTMW** Algoritma* Algoritma

  • ** Timecale Vector zaman - tabanlı vektör arama sorguları:** Otomatik zaman - zaman aralığı ve indeksleme, zaman aralığı veya belge varoluşu yılı için etkili bir şekilde bulmak için, zaman aralığı veya belge varlığına göre arama, ve büyük dil modeli (LLM) yanıtları ve sohbet geçmişini elde etmek için otomatik zaman aralığı ve indeksleme. Time - tabanlı makrotik arama ayrıca geliştirilmiş nesil (Retrieval artmış koordinasyon,** bez**** zaman - kullanıcılara daha yararlı LLM yanıtları sağlamak için tabanlı bağlam geri alma yöntemini kullanmanızı sağlar. -** Basitleştirilmiş yapay zeka altyapı yığını:** Vektör verilerini birleştirerek** ilişkisel veri**** ve** zaman serisi verisi** tek bir GCGreSlin veritabanına dönüştürür, zaman vektörleri birden fazla veritabanı yönetmenin operasyonel karmaşıklığını büyük ölçekte belirler.
  • ** Coğrafi işlem ve multi - öznitelik kodları:** Geliştiriciler, daha fazla bağlam elde etmek için bağlantı vektör arama sonuçlarını depolamak ve filtrelemek için tüm XMgreSQL veri tiplerini kullanabilirler. Gelecekteki yayınlarda, Timescale Vector zengin çokluları daha da empoze edecek - niteliklilik koordinasyonunu daha hızlı makroekonomik arama işlemini etkinleştirmek için.

Vektör veritabanı Llamaqua tarafından sıralandı

链接

** Vector Sestore Opsiyonları & Özellik Desteği **

Vector StoreTypeMetadata FilteringHybrid SearchDeleteStore DocumentsAsync
Apache Cassandra®self-hosted / cloud
Astra DBcloud
Azure Cognitive Searchcloud
Azure CosmosDB MongoDBcloud
ChatGPT Retrieval Pluginaggregator
Chromaself-hosted
DashVectorcloud
Deeplakeself-hosted / cloud
DocArrayaggregator
DynamoDBcloud
Elasticsearchself-hosted / cloud
FAISSin-memory
txtaiin-memory
Jaguarself-hosted / cloud
LanceDBcloud
Lanternself-hosted / cloud
Metalcloud
MongoDB Atlasself-hosted / cloud
MyScalecloud
Milvus / Zillizself-hosted / cloud
Neo4jVectorself-hosted / cloud
OpenSearchself-hosted / cloud
Pineconecloud
Postgresself-hosted / cloud
pgvecto.rsself-hosted / cloud
Qdrantself-hosted / cloud
Redisself-hosted / cloud
Simplein-memory
SingleStoreself-hosted / cloud
Supabaseself-hosted / cloud
Taircloud
TencentVectorDBcloud
Timescale
Typesenseself-hosted / cloud
Weaviateself-hosted / cloud

Desteklenen veritabanlarının çoğu

ector StoreTypeMetadata FilteringHybrid SearchDeleteStore DocumentsAsync
DashVectorcloud
Elasticsearchself-hosted / cloud总觉得比较重
Jaguarself-hosted / cloud
Lanternself-hosted / cloud
MyScalecloud
Pineconecloud
Postgresself-hosted / cloud
pgvecto.rsself-hosted / cloud
Qdrantself-hosted / cloud创始人好像出走了
TencentVectorDBcloud
Weaviateself-hosted / cloud

Elasticsearch:总觉得比较重

Postgress:先从最简单的开始吧。

Qdrant:创始人好像出走了。

Veritabanlarının karşılaştırılması Langlois

原文

数据库名称应用场景
HNSWLib, Faiss, LanceDB, CloseVector如果你需要一个可以在你的Node.js应用程序中运行的内存数据库,无需其他服务器
MemoryVectorStore, CloseVector如果你在寻找一个可以在类似浏览器的环境中内存中运行的东西
HNSWLib, Faiss如果你来自Python,并且你在寻找类似于FAISS的东西
Chroma如果你在寻找一个开源的、功能全面的向量数据库,可以在docker容器中本地运行
Zep如果你在寻找一个开源的向量数据库,提供低延迟、本地嵌入文档支持,并且支持边缘上的应用
Weaviate如果你在寻找一个开源的、生产就绪的向量数据库,可以在docker容器中本地运行或在云中托管
Supabase vector store如果你已经在使用Supabase,看看Supabase向量存储,使用同一个Postgres数据库来存储你的嵌入
Pinecone如果你在寻找一个生产就绪的向量存储,你不必担心自己托管
SingleStore vector store如果你已经在使用SingleStore,或者你需要一个分布式、高性能的数据库,你可能会考虑SingleStore向量存储
AnalyticDB vector store如果你在寻找一个在线MPP(大规模并行处理)数据仓库服务,你可能会考虑AnalyticDB向量存储
MyScale如果你在寻找一个性价比高的向量数据库,允许使用SQL进行向量搜索
CloseVector如果你在寻找一个可以从浏览器和服务器端加载的向量数据库,看看CloseVector。它是一个旨在跨平台的向量数据库
ClickHouse如果你在寻找一个可扩展的、开源的列式数据库,对于分析查询有着出色的性能

Farklı veritabanlarının karşılaştırması

开源向量数据库对比

Bez Seçimi

Elasticsearch

Qdrant

Postgress

Referans

https://mp.weixin.qq.com/s/YENmch0b4rbNJ73bvBLUpQ