

另外,Gemini Live 對話很自然,過程中無需點擊按鈕就可打斷,或先暫停對話之後再回來。
Google 在今(14)日的 Made By Google 2024 活動上宣佈,推出 Gemini 新語音聊天模式「Gemini Live」,該功能今天已開始針對 Android 裝置推出,只有英文版,且僅供 Gemini Advanced 訂閱戶使用,未來幾週內將來到 iOS 並提供更多語言。
Gemini Live 很類似於 ChatGPT 的語音功能,同樣有多種聲音可選擇,Google 共提供 10 個新的 Gemini 聲音供選擇,名字包括 Ursa 和 Dipper。
另外,Gemini Live 對話很自然,過程中無需點擊按鈕就可打斷,或先暫停對話之後再回來。Gemini Live 在使用者手機鎖定時仍能在背景運行,因此可免持操作。
Gemini Live 相較 ChatGPT 進階語音模式,具備的優勢之一是有更好的記憶力。Gemini Live、 Gemini 1.5 Pro 和 Gemini 1.5 Flash 所採用的 AI 模型架構具有比平均更長的上下文視窗長度,可吸收和推理更大量的資訊。
Google 之前在 I/O 上展示過 Gemini Live 的多模態輸入功能,此功能將在「今年稍後」推出。
除了 Gemini Live 之外,Google 還宣佈 Gemini 將與 Google 服務有新的整合,稱之為「Gemini 擴充功能」。AI 將能夠透過 Google 日曆、Keep、任務、YouTube 音樂等應用程式進行更多操作,舉例來說,可拍下一張演唱會宣傳海報,詢問 Gemini 當天是否有空,AI 就會進到日曆查詢,且可加以設定買票提醒。
Gemini 也獲得看懂使用者裝置螢幕的能力,當用戶點擊「詢問此畫麵」或「詢問此影片」後,Gemini 就可提供相關訊息,包括從旅遊影片中提取目的地等詳細資訊,並新增到 Google 地圖中。
:Jocelyn
:Chris
本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!