Google 再展黑科技?新研究突破 Transformer 限制稱讓 LLM 處理無限文字
· 2024-04-13

Google 稱使用 Infini-attention 的模型可以在超過一百萬個 token 的情況下還能保持輸出品質,還無需額外的記憶體。

Google 最近再度發表新的 AI 論文,號稱可以賦予大型語言模型(LLM)處理無限長度文本的能力!

這個技術叫 Infini-attention,直譯就是「無限注意力」,最白話來說是修改了 Transformer 的注意力層,讓 LLM 可以在保持記憶體和計算需求不變的情況下擴展模型的「Context Window」。

Context Window 是指模型可以處理的上下文 token 數量。例如你與 ChatGPT 的對話超出了 Context Window 最大量話,它的性能將會急劇下降,而且會忘記、捨棄、忽視對話一開始所輸入的資訊,所以 Context Window 最大量往往也是評斷一組 LLM 最重要的指標之一。

Google 研究團隊稱,使用 Infini-attention 的模型可以在超過一百萬個 token 的情況下還能保持輸出的品質,而且還無需額外的記憶體。理論上還可以處理更多 token。

技術上 Transformer 處理數據所需的記憶體量、時間會以指數方式增加。理論上沒有修改過的同一組模型如果要把輸入量從 1,000 個 token 擴展到 2,000 個 token 的話,處理輸入所需的記憶體和計算時間不僅僅會增加一倍,而是會增加四倍,這是因為 Transformer 的注意力機制會把每個 token 與其他所有 token 都進行比較運算。在過去幾年中,研究人員開發了不同的技術來降低擴展 LLM 上下文長度的成本。

Infini-attention 的原理是保留了 transformer 的注意力機制,但添加了「壓縮記憶體」模組來處理輸入資訊。一旦輸入超出 Context Window 上線 ,Infini-attention 就會將舊的注意力狀態儲存在壓縮記憶體模組中,該模組也會保持恆定數量的記憶體參數以提高計算效率。

該論文說明是在 10 億和 80 億個參數的 LLM 進行實驗,但 Google 沒有發布詳細用了哪個模型,或任何相對應的程式碼,因此其他研究人員目前還無法驗證結果(合理推測 Google 可能是用自家的 Gemini 測試的)。

快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!

    热门文章
    准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
    广告营销
    哈萨克斯坦计划对在线赌场促销活动进行处罚
    游戏风向
    GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
    灰度头条
    越南博彩管控逐步放宽,惟本土需求仍显乏力
    东南亚资讯
    PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
    广告营销
    菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
    东南亚资讯
    巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
    游戏风向
    横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
    灰度头条
    斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
    游戏风向
    BETFAIR 网络攻击80万用户资料泄露
    游戏风向
    越南在线博彩业政策收紧 催生市场新机遇
    东南亚资讯
    灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
    灰度头条
    超级PAC筹资4800万美元:体育博彩势力加码
    游戏风向
    密西西比州众议院委员会推进提议增加赌场税的法案
    游戏风向
    英国确认各垂直行业的赌博税税率
    游戏风向
    首页
    游戏
    合作
    发现
    我的