Elasticsearch引入BBQ新量化方法,大幅提升向量資料儲存與查詢效能
支付動態 · 2024-11-13

Elasticsearch 8.16採用了新的量化技術Better Binary Quantization(BBQ),以非對稱量化方式大幅加快查詢速度,並降低高維度資料的記憶體需求,甚至可節省記憶體達到95%

Elastic在最新版本Elasticsearch 8.16應用了一種稱為Better Binary Quantization(BBQ)的量化技術,該技術能夠大幅最佳化向量資料的儲存和處理方式。具有BBQ功能的Elasticsearch,將有助於降低高維度資料的記憶體需求,並提升查詢和索引效率。

越來越多企業應用嵌入模型,因此對向量資料的處理需求不斷增加,而模型產生的大量浮點數float32資料,對儲存空間和處理效能造成極大的挑戰,這是因為在數百甚至是數千個維度的情境下,浮點數運算會消耗非常大量的記憶體和運算資源。

Elasticsearch之前已經引入int8量化技術來減輕這個問題,而這次新增的BBQ能夠突破傳統二進位量化技術的侷限。BBQ是以新加坡南洋理工大學所提出的RaBitQ技術作為基礎,經過Elastic進一步改良,使得浮點數資料可以縮減成二進位表示,進一步減少約95%的記憶體使用量,還同時保持高品質查詢準確度。

相較於傳統的乘積量化(Product Quantization)BBQ在索引及查詢的效率更為快速。根據Elastic官方的測試,BBQ索引速度可以提升達20到30倍,查詢速度則增快為2至5倍,而且精確度沒有明顯的下降。

之所以BBQ能夠如此高效能,是因為採用了非對稱量化方法,研究人員解釋,這種量化方式在檔案向量,也就是由檔案內容轉換而成的向量,與查詢向量採用不同精度處理。檔案向量被量化至位元層級,以最大程度壓縮儲存空間,而查詢向量則保持較高的精度,例如int4。如此非對稱設計使得查詢向量在搜尋過程中能夠以更高的準確度比對檔案向量,達到較佳的搜尋結果。

這種設計不僅能夠減少儲存空間的需求,還能利用快速的位元運算提升查詢速度,實現低成本高效搜尋,適用於需要處理大量向量資料的應用場景。

在效能測試上,Elastic使用了E5-small、CohereV3以及CohereV2資料集,驗證BBQ在記憶體需求和查詢效率上的優勢。在CohereV3測試中,BBQ僅需3倍過採樣(Oversampling)即可達到90%的召回率(Recall),顯示其在高維度資料處理上具有潛力。

在更大規模的測試中,Elastic表示,BBQ可在單一64 GB記憶體的節點上,儲存並查詢高達1.38億個1024維度的浮點數向量,而記憶體僅需19 GB,這對於需要儲存大量向量資料的企業特別有用。

熱門文章
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
首頁
遊戲
合作
發現
我的