版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們
人工智能會下棋,甚至打敗過世界圍棋冠軍,這已經(jīng)是老生常談。
別看AI這么厲害,它只是借助了深度學(xué)習(xí)的方式,通過無數(shù)次的訓(xùn)練,讓它能夠在面對實際問題時,從訓(xùn)練數(shù)據(jù)庫中計算尋得最優(yōu)解,這并不代表機器人能夠像人一樣進行自主思考。
7月11日,Deep Mind公司最新的一項關(guān)于AI的文章有了突破性進展,研究者運用發(fā)展心理學(xué)領(lǐng)域的知識可以讓AI能像人類嬰兒一樣“學(xué)會思考”。而此前,最先進的AI系統(tǒng)仍然難以捕捉到日常人類場景中的“常識性”知識,比如指導(dǎo)預(yù)測、推理和行動。
可以說,Deep Mind的這項研究,大大推進了人工智能在直覺感知方面的發(fā)展。此后,人工智能真的更像“人”了。
撰文 | 徐詩露
出品:科普中國-星空計劃
圖片來自Deep Mind
早在機器人問世之時,就有許多人想象過:如果機器人能夠像人一樣思考,世界將會變成什么樣子?(相信你腦海中已經(jīng)浮現(xiàn)出相應(yīng)的電影場景了)
這個問題已經(jīng)塵封多年,但是近期的一項發(fā)表在《自然·人類行為》上的研究顯示,人工智能或許擁有了“像嬰兒一樣思考”的能力:能像嬰兒一樣理解直觀物理學(xué)。值得一提的是,這是知名人工智能公司Deep Mind科研人員發(fā)表的成果。
論文通訊作者Luis Piloto,此前他在普林斯頓大學(xué)學(xué)習(xí)
Luis Piloto和他的同事做了一個能學(xué)習(xí)直觀物理學(xué)的深度學(xué)習(xí)系統(tǒng),名為PLATO。PLATO包含的系統(tǒng)受到了嬰兒學(xué)習(xí)方法相關(guān)研究的啟發(fā)。并且,PLATO遵循認為物體在我們周圍物理世界的表示和預(yù)測中扮演核心作用的理論。
具體來說,研究者通過給PLATO觀看許多描繪簡單場景的視頻來訓(xùn)練它,比如球落到地上,球滾到其他物體后面又再次出現(xiàn),很多球之間彈來彈去。訓(xùn)練之后,PLATO在看到?jīng)]有意義的場景(如物體互相穿過卻沒有發(fā)生相互作用)時表現(xiàn)出了像人類嬰兒那樣“驚訝”。
令人驚訝的是,PLATO只觀看了28小時的視頻就獲得了以上學(xué)習(xí)效果。
我們不禁發(fā)問,直觀物理學(xué)是什么,嬰兒是如何理解它的?AI又是如何學(xué)到這一點的呢?
嬰兒眼里的直觀物理學(xué)是什么?
首先我們來明確一個概念,直觀物理學(xué)是什么?我們可以簡單地把它理解為“直覺”或者“常識”。
比如我們在桌子上方丟下一串鑰匙,所有人都知道,鑰匙不會漂浮在半空中,也不會穿過桌面掉到地上,而是會掉落在桌面上。
這就是“直觀物理學(xué)”,它是我們了解世界的基礎(chǔ)物理概念,也是思維中“常識”的關(guān)鍵組成部分。
在發(fā)展心理學(xué)領(lǐng)域中,直觀物理學(xué)被分為5個方面的概念:
1. 連續(xù)性:物體不會從一個地方傳送到另一個地方,而是在時間和空間中有一定的連續(xù)路徑;
2. 對象持久性:物體在看不見時不會消失;
3. 固體性:物體不會相互滲透;
4. 不變性:對象的屬性(如形狀)不會更改;
5. 定向慣性:物體運動的路徑與慣性原理一致。
是不是每一個都很好理解?沒錯,這些都是我們?nèi)菀桌斫夂徒邮艿摹俺WR性”概念。
如果鑰匙的掉落過程違背了我們的常識,比如懸浮在了半空中、或者穿過了桌子、或者是從桌面上duang的一下彈起來老高,甚至是化成了液體,那么事情就會超出我們的預(yù)期,變得詭異起來。
面對這種怪異事件,每個人都會感到驚訝。即使是三個月大的嬰兒也是一樣,他們也會對這樣違背直觀物理學(xué)的現(xiàn)象表現(xiàn)出驚訝,這種驚訝反應(yīng)被稱為違反期望(VoE)效應(yīng)。
至于嬰兒對世界的認識是否和成人一樣,這一點存在一個關(guān)于“先天”和“后天”的爭議,許多發(fā)展科學(xué)家認為這是“先天”的,也有一些學(xué)者更支持從無到有的“后天”理論。
那我們能否設(shè)計一個模擬嬰兒思維的程序,通過適當?shù)挠?xùn)練,使AI能夠像嬰兒一樣思考呢?
如何把AI訓(xùn)練得像嬰兒一樣思考?
為了探究這個爭論不休的“先天”和“后天”問題,Piloto等人利用PLATO仿真系統(tǒng),來測試深度學(xué)習(xí)系統(tǒng)是否能夠通過學(xué)習(xí)視覺動畫,來獲得對直觀物理學(xué)的理解。
如果“后天”的理論是正確的,那么智力發(fā)展的關(guān)鍵就在于通過處理大量經(jīng)驗和大量數(shù)據(jù)來進行鍛煉。
PLATO仿真系統(tǒng)由兩個模塊組成:前饋感知模塊(左)和循環(huán)動態(tài)預(yù)測器模塊(右)組成。前饋感知模塊中,通過編碼器將圖像轉(zhuǎn)換為一組對象代碼,通過解碼器模塊將對象代碼解碼成對象的圖像。利用重建和原始圖像之間的差異來訓(xùn)練編碼器和解碼器的參數(shù)。循環(huán)動態(tài)模塊中,動態(tài)模塊通過預(yù)先訓(xùn)練好的解碼器對下一時刻的對象狀態(tài)進行預(yù)測。
而這項研究使用的訓(xùn)練數(shù)據(jù)少到驚人,就讓AI擁有了穩(wěn)定的違反期望效應(yīng)。在面對超出5個直觀物理學(xué)概念的情況時,PLATO仿真系統(tǒng)會顯示出魯棒(即具有穩(wěn)定性)的VoE效應(yīng)。這可以解釋一些直觀物理學(xué)的概念,但是這種效應(yīng)與嬰兒身上看到的現(xiàn)象并不完全一致。
研究發(fā)現(xiàn),雖然視覺動畫的經(jīng)驗對智力發(fā)展有很重要的貢獻,但不足以解釋我們在嬰兒身上看到的現(xiàn)象。
也就是說,智力發(fā)展并非全部依靠于“后天”的經(jīng)驗和數(shù)據(jù)。要形成完整的智力,還需要一些先天的認知,這項研究在“先天”派和“后天”派之間建立了一個有趣的中間立場。
當視頻在直觀物理學(xué)上變得不可能時,AI表現(xiàn)出的驚訝會顯著增加。
此外,PLATO仿真系統(tǒng)可以將符合直觀物理學(xué)的期望,歸納為一組與訓(xùn)練中不相同的對象和事件。其次,盡管只是接受了相對較少的視覺動畫訓(xùn)練,這個仿真系統(tǒng)也能夠成功地演示學(xué)習(xí),在針對嬰兒研究中也有相似的特征。
可以看到,將仿真建模的工作和發(fā)展心理學(xué)中的關(guān)鍵問題融合起來,研究人員得到了意想不到的效果和結(jié)論。
目前,研究團隊正在將違反期望效應(yīng)的研究擴展到神經(jīng)生理學(xué)領(lǐng)域,這可能為后續(xù)的研究開辟新的可能性,也為AI的發(fā)展提供了更多的可能。
參考資料
1. Can a computer think like a baby? Nature News.
2. Intuitive physics learning in a deep-learning model inspired by developmental psychology.
https://doi.org/10.1038/s41562-022-01394-8.歡迎掃碼關(guān)注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動和科普好物!