Google集成BigQuery与Document AI简化文件数据截取工作
· 2024-01-09

Google现在让开发者可以更方便从文件数据截取资讯,并用于构建新的大型语言模型应用程序,这项新功能依赖BigQuery与Document AI集成。


Google现在让开发者可以更方便从文件数据截取资讯,并用于构建新的大型语言模型应用程序,这项新功能依赖BigQuery与Document AI集成。此功能允许BigQuery用户创建Document AI自定义截取器,运用基础模型对文件和元数据进行自订,用户能够直接从BigQuery调用这些自订模型,实现从文件中截取并存储结构化数据的目标。


过去用户要创建独立的Document AI工作管线,需要手动管理截取逻辑和模式,因为缺乏原生的集成功能,需要自己开发定制化基础设施,同步和维护数据的一致性,这使得用户需要投入大量的资源在文件分析上。而现在Google推出BigQuery与Document AI的集成,用户可以在BigQuery中,创建用于Document AI自定义截取器的远程模型,进行大规模文件分析和生成式人工智能应用。


首先用户需要先在Document AI中创建自定义截取器,借由选择样本文件,并基于Document AI基础模型训练截取器模型。而Document AI也提供现成的截取器,可用于处理各种常见文件类型,像是发票或是身份证件等。


接着,Document AI自定义截取器便可于BigQuery中使用,通过SQL在BigQuery中注册远程模型,调用并使用自定义截取器,来分析文件截取相关字段数据。从文件截取出来的资讯,可以进行文本分析、摘要生成和创建各种创新应用。


BigQuery ML支持训练和部署多种文本模型,可以用来识别客户服务通话中的情绪,或是Python开发者也可使用BigQuery DataFrames for pandas,和类似scikit-learn的API来分析数据。用户也能运用PaLM 2大型语言模型对文件进行摘要,甚至将文件元数据和存储在BigQuery表格中的其他结构化数据集成,开发创新应用。


熱門文章
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
首頁
遊戲
合作
發現
我的