雲端資料倉儲BigQuery現可生成文字嵌入強化自然語言應用
· 2023-08-30

Google雲端資料倉儲BigQuery用戶,現在可利用textembedding-gecko、BERT、NNLM以及SWIVEL共4種模型生成嵌入,應用於開發下游人工智慧應用程式

Google雲端資料倉儲服務BigQuery加入文字嵌入(Text Embedding)生成功能,開發者將可以透過熟悉的SQL指令擷取文字嵌入,並將其應用到下游應用程式中。目前BigQuery所支援的文字嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

這項新功能的使用流程,由註冊需要的模型成為遠端模型開始,接著用戶就可以使用生成文字嵌入函式來生成嵌入,而這些操作都僅使用BigQuery SQL就可以完成。文字嵌入是一個由文字轉化而來的向量,可用來尋找相似的項目,像是語義搜尋、分類、分群、異常偵測和或是對話式介面等應用。

BigQuery新支援的4種模型嵌入,其中textembedding-gecko是運用Google語言模型PaLM生成嵌入,其他三個模型BERT、NNLM以及SWIVEL,則都可以從TensorFlow Hub選用。BERT是Transformer架構的深度預訓練網路,可針對自然語言生成密集的向量表示,NNLM與SWIVEL則是以英文Google新聞語料庫訓練而成。

同時,官方也宣布開始支援array<numeric>特徵類型結構,使這些生成出來的嵌入,可被其他BigQuery支援的機器學習模型所使用,並根據向量空間的鄰近度與距離進行資料分析。

熱門文章
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
首頁
遊戲
合作
發現
我的