踩油門、急轉(zhuǎn)彎,像人類賽車手一樣精準決策的AI要來了!
來源:科普中國
發(fā)布時間:2024-07-25
瀏覽次數(shù):1054

版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

前言

想象一下,在緊張刺激的賽車游戲中,人類需要迅速而精準地判斷何時踩下油門、何時巧妙地轉(zhuǎn)彎。在根據(jù)路況不斷改變行駛路徑的過程中,人類大腦可以展現(xiàn)出敏捷的決策能力和反應(yīng)速度。

然而,在人類應(yīng)對自如的賽車游戲中,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型只能做出確定性的決策,尚不具備人類的感知行為能力。模擬人類大腦的決策過程,始終是人工智能(AI)領(lǐng)域的一大挑戰(zhàn)。

如今,一種新型神經(jīng)網(wǎng)絡(luò)模型,有望讓 AI 系統(tǒng)像人類賽車手一樣,權(quán)衡各種選擇,做出迅速、精準的決策。

近日,來自佐治亞理工學院的研究團隊便提出了一種神經(jīng)網(wǎng)絡(luò)模型 RTNet,這一模型不僅能夠生成隨機決策,還能達到類似人類決策的響應(yīng)時間分布。

研究團隊通過全面的測試發(fā)現(xiàn),RTNet 能夠再現(xiàn)人類在準確性、響應(yīng)時間和置信度上的所有特征,而且表現(xiàn)優(yōu)于多個當前先進的神經(jīng)網(wǎng)絡(luò)模型。

相關(guān)研究論文以“The neural network RTNet exhibits the signatures of human perceptual decision-making”為題,發(fā)表在科學期刊 Nature Human Behaviour 上。

研究團隊表示,即使是功能強大的大語言模型(LLM)也會因為幻覺編造一些不切實際的回答,因此開發(fā)一種更接近真實人腦的神經(jīng)網(wǎng)絡(luò)可能會使 AI 系統(tǒng)更加可靠。

像人類一樣感知決策

近年來,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在 AI 圖像處理方面取得了很大進展,甚至在醫(yī)學圖像處理等領(lǐng)域超過了人類的水平,但在感知決策的認知模型中與人類的表現(xiàn)仍相較甚遠。

傳統(tǒng)的 CNN 面對相同的輸入信號時,輸出的結(jié)果總是確定的,而且在處理復(fù)雜度不同的圖像時,花費的計算時間總是不變的。這也決定了 CNN 模型很難實現(xiàn)人類大腦的感知決策水平,無法根據(jù)任務(wù)的復(fù)雜程度調(diào)整反應(yīng)時間和準確度。

此前,為了解決這些問題,一些研究團隊曾嘗試為神經(jīng)網(wǎng)絡(luò)引入隨機性和動態(tài)性,開發(fā)能夠生成動態(tài)響應(yīng)時間的神經(jīng)網(wǎng)絡(luò),但這些模型無法處理復(fù)雜的圖像輸入,結(jié)果也是確定性的,還是沒有達到人類的感知決策能力。

Google Research 和科羅拉多大學的研究團隊曾通過在深度神經(jīng)網(wǎng)絡(luò)的前饋網(wǎng)絡(luò)中引入傳播延遲來構(gòu)建級聯(lián)網(wǎng)絡(luò),產(chǎn)生了圖像可計算的動態(tài)網(wǎng)絡(luò),其通過決策計算資源隨時間增加的機制生成響應(yīng)時間,從而允許響應(yīng)通過每個處理步驟進行不斷地演變。雖然模型可以模擬人類感知決策的速度和準確度,但輸出結(jié)果還是確定性的,距離人類的感知決策水平還有相當大的距離。

在這項研究中,F(xiàn)arshad Rafiei 等人將現(xiàn)代 CNN 與傳統(tǒng)認知模型相結(jié)合,創(chuàng)建了一個可進行圖像計算、隨機且動態(tài)的模型。因為該模型能夠模擬人類的行為決策響應(yīng)時間,故將它命名為 RTNet。

圖 | 模型的架構(gòu)(來源:該論文)

他們通過對貝葉斯神經(jīng)網(wǎng)絡(luò)進行采樣,獲得深度神經(jīng)網(wǎng)絡(luò)噪聲權(quán)重,然后在每個處理步驟,從這些有噪聲的權(quán)重分布中進行采樣,來模擬神經(jīng)響應(yīng)的隨機性。RTNet 也會積累每個選擇對應(yīng)的輸出,直到其中一個選擇達到預(yù)定義的閾值。

為了驗證 RTNet 能夠適用于各種感知任務(wù),并做出類似人類感知決策的一些基本特征,他們對 RTNet 進行了全面的評估測試。

他們設(shè)計了 “二選一” 的決策任務(wù),通過人為改變?nèi)蝿?wù)難度,來對比 RTNet 模型與 60名 參與者進行決策判斷的響應(yīng)時間和準確度,從而驗證 RTNet 在模擬人類行為方面的出色表現(xiàn)。

人類行為的一個核心特征就是決策具有隨機性,面對同樣的情況可能做出不同的決策,研究人員將人類行為與 RTNet、CNet、BLNet 和 MSDNet 的行為進行了比較。

實驗充分考慮了人類決策的隨機性、增加響應(yīng)時間帶來的準確性下降、復(fù)雜度高的決策導(dǎo)致的準確性降低等干擾因素,來驗證 RTNet 在決策上的隨機性是魯棒、可靠的。

圖 | 實驗參與者和四個神經(jīng)網(wǎng)絡(luò)模型在決策隨機性的表現(xiàn)(來源:該論文)

研究發(fā)現(xiàn),模型表現(xiàn)出的決策隨機性隨著任務(wù)難度的增加而增加,在 20% 的試驗中,RTNet 對兩個圖像表現(xiàn)出了不同的響應(yīng)。雖低于人類的反應(yīng)水平,隨著任務(wù)難度和速度要求的提高,RTNet 決策的隨機性也在提高。

與之相反,對于固定的任務(wù),CNet、BLNet 和 MSDNet 的決策是完全確定性的,并且沒有表現(xiàn)出任何隨機性。RTNet 在捕獲感知決策特征方面表現(xiàn)出優(yōu)于 CNet、BLNet 和 MSDNet 的特征,RTNet 也是唯一一個能夠模擬時間響應(yīng)分布形狀和偏度,以響應(yīng)任務(wù)難度進行不同操作的模型。

不足與展望

總的來說,RTNet 表現(xiàn)出了類人感知決策的關(guān)鍵特征,具有廣泛的應(yīng)用前景。此外,RTNet 也為開發(fā)更加逼真的 AI 模型提供了新的思路,未來在醫(yī)療診斷、自動駕駛和人機交互等領(lǐng)域?qū)l(fā)揮重要作用。

研究人員推測,RTNet 能夠匹配觀察到的人類行為模式,主要是因為其內(nèi)部機制更接近人類產(chǎn)生響應(yīng)時間的真實機制。RTNet 通過模仿重復(fù)呈現(xiàn)相同刺激的神經(jīng)元反應(yīng),在證據(jù)積累的過程中,自然地產(chǎn)生持久的神經(jīng)元激活,所以模型的輸出本質(zhì)上是隨機的。

但 RTNet 也存在一定的局限性,它在每次從選擇中進行證據(jù)采樣的機制不是最佳的,且前饋路徑的每次掃描都獨立于先前的狀態(tài),但人腦一般當前的狀態(tài)會受到其先前狀態(tài)的影響。

研究人員表示,未來的研究可以進一步優(yōu)化 RTNet 的生物學合理性,例如引入遞歸處理機制,并使用其他方法來設(shè)置每個連接的噪聲級別,來更好地模擬人類大腦的處理方式。

歡迎掃碼關(guān)注深i科普!

我們將定期推出

公益、免費、優(yōu)惠的科普活動和科普好物!

聽說,打賞我的人最后都找到了真愛。
做科普,我們是認真的!
掃描關(guān)注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者