

Google坦承上周發布的Bard底層最新模型Gemini的展示影片有經過處理,而部分省略了Gemini真實情況下的延遲性與輸出,讓媒體質疑這樣的處理方式,會讓外界高估了Gemini在對話流暢度以及推理速度上的能耐
在影片中,Gemini能隨著用戶筆順猜出鴨子、理解拳頭、指頭比出2和5是「剪頭、石頭、布」的遊戲,並正確猜出紙團藏在哪個倒扣的杯子下、也能指出太陽、地球和土星的正確順序。影片顯示Gemini能接受文字、圖片、聲音、影片和程式碼的多模態輸入,且具備近乎人類的推論與對話能力,還能正確說出「鴨子」的中文。Google說,這支影片突顯了他們最喜歡和Gemini之間的互動,但為示範效果之故,減少了AI的延遲性、也精簡了Gemini的輸出。
Gemini實在太神奇,或許神奇得不像真的。《彭博》報導,Google承認,這段影片中Gemini其實並非「看到」影片的即時回應,而是以原始影片的靜態影格剪接而成,再配上文字提示。
報導指出,雖然Google有說明影片為了效果而經過優化,但仍然誤導觀眾相信Gemini可看懂影片,並和人類之間可以即時產生流暢對話。
Google向《The Verge》說明,影片旨在向開發人員展示Gemini會產生什麼多模態使用者體驗,他們並且重申並非造假,團隊真的有提供Gemini圖像及文字提示,讓它回應預測下一步為何。
報導或許會讓Google丟掉好不容易掙回的面子。在OpenAI宣布ChatGPT後感到不安的Google宣布以Bard急起直追,不料展示大會上卻被爆Bard找來的James Webb太空望遠鏡影像是另一座望遠鏡照片的張冠李戴,致使外界認為Google AI技術還不成熟。
上周Gemini的展示原希望能一掃Google Bard出糗的恥辱,正面的媒體評價也讓Google股價上揚5%。不過在《彭博》、《The Verge》、《Techcrunch》報導後,再度引發市場對Google是否能趕上OpenAI ChatGPT的疑慮,致使股價再度由升轉跌,一度超過2%。