

不管是 OpenAI 的 GPT-4、GPT-3.5 Turbo、Anthropic 的 Claude 還是 Google 的 FLAN-T5,人類兒童使用工具解決問題的能力都還要比它們厲害得多。
許多人都認為超越人類智慧的 AI 總有一天會到來,但或許以下這則新聞會讓這麼想的人放心一點。根據加州大學柏克萊分校科學家最新的研究發現,人類兒童在解決基本問題、思考方面的表現全面超越 AI,科學家還非常確定 AI 還有一非常嚴重的盲點:創新。
這份研究專注在「工具使用、解決問題」的能力,科學家把 OpenAI 的 GPT-4、GPT-3.5 Turbo、Anthropic 的 Claude 以及 Google 的 FLAN-T5 拿來跟 3-7 歲的兒童進行比對,研究發現,不管是哪款 AI,人類兒童使用工具解決問題的能力都還要比它們厲害得多。
例如研究者拿出尺、茶壺或爐子,要求受試者盡可能畫出一個圓。研究發 85% 狀況下兒童都直接選茶壺拿來當模板畫出圓圈;但 AI 光是在這個簡單的問題上就表現不佳,唯一比較孩子們的是 GPT-4,成功率為 76%。
另外一個研究則是著名的「玩具偵測器」(blicket detector)手法,這是一個常常用來觀察孩童是否具有邏輯能力的實驗方式,它的設計是把某些特定物品放在偵測器上面時,blicket 就會發光並播放音樂,表示這是blicket;另外一些物品放上去則不會有任何動靜。這些會發光、會出聲音物品不一定有意義,但這就是重點——就是要故意測試人工智慧或孩子是否可以對 blicket detector 進行觀察,並從中推斷出因果關係。
結果發現,人類兒童依舊表現優秀,就算是 4 歲的小朋友在熟練後都可以順利找出哪些是會發光的物體,哪些不是,而且小朋友們還會自發性的讓 blicket detector 順利運轉;反倒是人工智慧進行大量(非資料性輸入)的嘗試後,仍難以產生相關的因果推論。
這項研究最後支持這項觀點:那就是儘管目前主流機器學習模型是基於人類的神經所設計的(所以才叫神經網路模型),但其推理過程仍然與人類的推理存在本質上的差異。研究人員不斷強調,兒童具備活躍的好奇心,他們會自我管理,存在內在動機,這些都是 AI 遠不可及的。
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!