Qdrant, dostawca rozwiązań do wyszukiwania wektorowego i bazy danych, wprowadził ulepszoną wydajność indeksowania, mechanizmy failover'u klastrów z trzema strefami,i funkcje rejestrowania kontroli skoncentrowane na zgodności.
Firma opracowuje samodzielną bazę danych wektorowych do przechowywania wbudowanych elementów wymaganych przez duże modele językowe (LLM) i autonomiczne agenty sztucznej inteligencji,które powszechnie obsługują przepływy pracy inferencji AI, takie jak Recovery-Augmented Generation (RAG)Według Qdranta zespoły zakupów przedsiębiorstw zawsze oceniają narzędzia wyszukiwania wektorowego w oparciu o trzy podstawowe kryteria: skalowalność dla rosnących obciążeń pracą, ciągłość usług w przypadku awarii infrastruktury,i śledzonego audytu operacyjnego.
André Zayarni, współzałożyciel i dyrektor generalny Qdrant, skomentował: "GPU nie ograniczają się już do wnioskowania o modelu; optymalizują również indeksowanie danych.W naszej wersji open-source umożliwiliśmy GPU-accelerated HNSW construction od v1.13W połączeniu z wielo-AZ replikacją i rejestracją audytów,Zintegrowany pakiet wyposaża przedsiębiorstwa w wdrażanie Qdrant do krytycznych obciążeń produkcyjnych.??
Najnowsze ulepszenia produktu Qdrant obejmują trzy kluczowe usprawnienia:
Akceleracja indeksowania za pomocą GPU: Testy porównawcze potwierdzają, że dedykowane procesory graficzne zwiększają szybkość budowy indeksu HNSW nawet o cztery razy na Qdrant Cloud.Użytkownicy mogą montować zasoby GPU do istniejących klastrów w celu efektywnego obsługi wysokiej intensywności wybuchów indeksowania.
Klustery w strefie wielokrotnej dostępności (AZ): Mechanizm replikacji cross-AZ powtarza dane w trzech strefach dostępności w jednym regionie.zapewnienie nieprzerwanych operacji odczytu i zapisu nawet w przypadku awarii jednej strefy dostępności.
Rejestrowanie audytów: Funkcja rejestruje wszystkie operacje oparte na interfejsie API, w tym zapytania o dane, uzupełniania, usuwania, zarządzania zbiórkami i zadania nagrywania.oznaczanie tożsamości użytkownika, klucze API, znaczniki czasu, zbiory docelowe i status autoryzacji operacji.czas wykonania i legalność dostępuUżytkownicy mogą dostosować cykle przechowywania dziennika i eksportować rekordy zewnętrznie za pośrednictwem interfejsów API do długoterminowego archiwizacji.
Obecnie indeksowanie przyspieszone przez GPU jest dostępne na AWS, z trwającymi planami rozszerzenia zasięgu na więcej dostawców chmury i regionów.dostarczanie czasu pracy wspieranej przez SLA wynoszącego 99Funkcja rejestracji audytów jest dostępna dla wszystkich płatnych klastrów Qdrant Cloud.
Oficjalna dokumentacja zawiera dalsze szczegóły dotyczące trzech nowych możliwości.
Wskazówka
Hierarchical Navigable Small World (HNSW) to algorytm zaprojektowany do identyfikacji najbliższych wektorowych sąsiadów.które gwałtownie rozwijają się wraz z rosnącą ilością danych. HNSW układa wiele warstw wirtualnego wykresu: górna, rzadka warstwa zawiera minimalne wektory do szybkiego wstępnego wyszukiwania,podczas gdy dolne warstwy przechowują coraz więcej wektorów, dopóki dolna warstwa nie pokryje wszystkich punktów danychKażda warstwa działa jako zoptymalizowany punkt wejścia do następnej, znacznie skracając ogólną opóźnienie wyszukiwania.
Pinecone również przyjmuje algorytmy HNSW i wykorzystuje procesory graficzne NVIDIA w celu optymalizacji wydajności wbudowy i ponownego rankingu.Zilliz zapewnia zarówno kompatybilność HNSW, jak i przyspieszenie GPU; jego podstawowa baza danych Milvus integruje Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) z biblioteki RAPIDS cuVS, aby umożliwić indeksowanie GPU.
Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang, dyrektor ds. strategii globalnej
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Strona internetowa: www.qianxingdata.com/www.storagesserver.com
Skoncentruj się na biznesie:
Dystrybucja produktów ICT/Integracja systemów i usługi/Rozwiązania infrastrukturalne
Dzięki ponad 20-letniemu doświadczeniu w dystrybucji IT współpracujemy z wiodącymi światowymi markami w celu dostarczania niezawodnych produktów i profesjonalnych usług.
Używanie technologii do budowy inteligentnego świata•Twój zaufany dostawca usług produktów ICT!