Google整合BigQuery與Document AI簡化文件資料擷取工作
· 2024-01-08

Google藉由整合BigQuery與Document AI,讓開發者更容易從文件擷取資料,開發大型語言模型應用程式

Google現在讓開發者可以更方便從檔案資料擷取資訊,並用於建置新的大型語言模型應用程式,這項新功能仰賴BigQuery與Document AI整合。此功能允許BigQuery用戶創建Document AI自定義擷取器,運用基礎模型對檔案和後設資料進行自訂,用戶能夠直接從BigQuery呼叫這些自訂模型,實現從文件中擷取並儲存結構化資料的目標。

過去用戶要建立獨立的Document AI工作管線,需要手動管理擷取邏輯和模式,因為缺乏原生的整合功能,需要自己開發客製化基礎設施,同步和維護資料的一致性,這使得用戶需要投入大量的資源在檔案分析上。而現在Google推出BigQuery與Document AI的整合,用戶可以在BigQuery中,創建用於Document AI自定義擷取器的遠端模型,進行大規模文件分析和生成式人工智慧應用。

首先用戶需要先在Document AI中建立自定義擷取器,藉由選擇樣本檔案,並基於Document AI基礎模型訓練擷取器模型。而Document AI也提供現成的擷取器,可用於處理各種常見檔案類型,像是發票或是身分證件等。

接著,Document AI自定義擷取器便可於BigQuery中使用,透過SQL在BigQuery中註冊遠端模型,呼叫並使用自定義擷取器,來分析檔案擷取相關欄位資料。從檔案擷取出來的資訊,可以進行文本分析、摘要生成和建立各種創新應用。

BigQuery ML支援訓練和部署多種文本模型,可以用來辨識客戶服務通話中的情緒,或是Python開發者也可使用BigQuery DataFrames for pandas,和類似scikit-learn的API來分析資料。用戶也能運用PaLM 2大型語言模型對文件進行摘要,甚至將檔案後設資料和儲存在BigQuery表格中的其他結構化資料整合,開發創新應用。

熱門文章
英國確認各垂直行業的賭博稅稅率
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
首頁
遊戲
合作
發現
我的