

Google 歷經十月寒窗砥礪,總算一掃 2 月那次巴黎發表會的醜態,展現出網路鉅子該有的格局。
Google 今天終於發表研發已久的新世代大型語言模型「Gemini」,其中最大型、最完整的版本 Gemini Ultra 技壓群雄,在32 項 AI 測試中,有 30 項的評分超越了 OpenAI 的 GPT-4V,同時也是在所謂 MMLU(大規模多任務語言理解,包括數學、物理、歷史、法律、醫學和倫理學等 57 項科目)測試中,第一個達到 90% 水準並超越人類專家的大型自然語言模型。
從表面來看,Gemini 好像就是一組衝著 OpenAI 跟微軟,能力更高強的大型語言模型,但實質 Google 默默藉由推出 Ultra、Pro、Nano 大中小三種版本,從中做了兩件足以改變遊戲規則的事,而且都還跟「晶片」有莫大關係。第一是 Google 表明,Gemini 絕大部分都是自家的 TPU v4 和 v5e 所訓練出來的,同時「順水推舟」發表新的 TPU v5p 供雲端使用,強調 TPU v5p 訓練大型 LLM 模型的速度比上一代 TPU v4 快 2.8 倍。
這件事向市場放出一個很鮮明的訊息:「想訓練 AI 模型?不要只傻傻的去搶 NVIDIA GPU,我的 TPU 也很能打」。作為軍火商,NVIDIA 無疑是這波 AI 熱潮目前為止的最大贏家,管你們這些軟體廠演算法再精良,通通還是要跟我買 GPU 來算。
Google 自然是不怎麼可能在硬體上大量銷售 TPU 跟 NVIDIA 正面衝突,一時之間也不太可能馬上翻轉 CUDA 生態系,但不管是 OpenAI、Google、AWS 甚至是微軟,這些大廠都一直想透過新的專用晶片繞過 NVIDIA 來節能省錢,像微軟推出自家設計 Arm 晶片 Maia AI 來運行 OpenAI 的模型,AWS 也有 Graviton、Trainium,OpenAI 更是爆出秘密向新創 Rain AI 下單 NPU 神經網絡處理器試圖取代 GPU。
只是 Google 用 TPU 訓練出 Gemini 這件事不僅說明 Google 跟他者相比「自給自足」程度更高,相對不怕 NVIDIA GPU 供貨限制,在跟 AWS、Azure 雲端的傳統競爭賽道上還能反過來證明技高一等。Google 這項舉動,很可能會開始為大廠擺脫 NVIDIA GPU 的趨勢引起後續發酵作用。
但比起雲端,第二件事:Gemini Nano 即日起直接可在 Pixel 8 Pro 運行恐怕才是影響力更深厚的舉動,因為這代表新世代 AI 手機、AI PC 時代已悄悄但快速來到大家身邊。先說明一下現在手機廠、PC 廠喊很大聲的 AI 手機、AI PC 本來也不是什麼新概念,蘋果很早在 2017 年 iPhone 8 的 A11 仿生晶片裡就放入了神經網路處理器。
但自從 LLM 開始爆發後,馬上就有人試圖想把 LLM 不斷縮小直接放到手機終端裡,不用連線就可直接使用,Meta 也在釋出 Llama 僅僅半年後,就宣布跟高通合作,要在 2024 正式把 Llama 2 大量部署在旗艦智慧型手機、PC 上。
不料高通跟 Meta 合作的手機還沒面世,Android 生態真正的老大 Google 就自己搶先做掉了。在自家 Tensor G3 晶片加持下,Google Pixel 8 Pro 可以輕鬆在離線環境下使用 Gemini Nano 所帶進的錄音生成摘要功能。
還沒完,Android Developer 也推了新的系統服務「Android AICore」,可存取預先安裝在裝置端的 AI 基礎模型,裡面正躺著 Gemini Nano,等於是第一時間已經先幫開發者鋪好路了。
綜觀其他科技大廠,沒有一間可以像 Google 如此有完整生態系可供佈局。Apple 有神經網路的手機?有,但它沒有 LLM;Meta 有社群帶來的大量資料與可擴性極強的 LLM,但它沒有手機這條通路,也沒有雲。微軟有很強的雲,但沒切入智慧型手機是心頭上那顆永恆的硃砂痣。Google 歷經十月寒窗砥礪,總算一掃 2 月那次巴黎發表會的醜態,展現出網路鉅子該有的格局。
:Sisley
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!