GPT-4創(chuàng)造力有多強(qiáng)?專屬于智慧生物的發(fā)散思維,已超越人類!
發(fā)布時(shí)間:2024-03-28
瀏覽次數(shù):1183

版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

發(fā)散性思維(divergent thinking)被認(rèn)為是創(chuàng)造性思維的核心指標(biāo),是人類創(chuàng)造性的體現(xiàn)。

如果 ChatGPT-4 等大模型具有超過(guò)人的發(fā)散性思維,那是不是意味著,這一專屬于智慧生物的獨(dú)特性,也被人工智能(AI)學(xué)會(huì)了?

近日,來(lái)自阿肯色大學(xué)的研究團(tuán)隊(duì)在一項(xiàng)工作中發(fā)現(xiàn):ChatGPT-4 在創(chuàng)造性思維測(cè)試中的表現(xiàn),已經(jīng)超越了人類。

相關(guān)研究論文以“The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks”為題,已發(fā)表在 Nature 子刊 Scientific Reports 上。

研究團(tuán)隊(duì)表示:“總體而言,即使在控制反應(yīng)的流暢性的情況下,GPT-4 在每項(xiàng)發(fā)散性思維任務(wù)上都比人類更具獨(dú)創(chuàng)性和復(fù)雜性。換句話說(shuō),GPT-4 在整個(gè)發(fā)散思維任務(wù)中表現(xiàn)出了更高的創(chuàng)造潛力?!?/p>

GPT-4的發(fā)散性思維,真的好過(guò)人類?

據(jù)論文描述,研究團(tuán)隊(duì)測(cè)試了 151 名人類參與者和 ChatGPT-4 分別在 Alternative Uses Task、Consequences Task 和 Divergent Associations Task 三個(gè)創(chuàng)造性思維任務(wù)上的表現(xiàn)。

這些任務(wù)旨在評(píng)估個(gè)體的創(chuàng)造性思維能力,其中包括了對(duì)于日常物品的創(chuàng)新用途、對(duì)于假設(shè)情境的可能后果,以及對(duì)于詞語(yǔ)的語(yǔ)義差異的理解。這些標(biāo)準(zhǔn)有助于量化每個(gè)參與者在創(chuàng)造性思維任務(wù)中的表現(xiàn),同時(shí)也為后續(xù)的分析提供了基礎(chǔ)。

Alternative Uses Task(替代用途任務(wù)):這是一個(gè)經(jīng)典的創(chuàng)造力測(cè)試,要求參與者為一個(gè)常見(jiàn)物品想出盡可能多的不同用途。例如,參與者可能會(huì)被要求為一張紙想出多種用途。這個(gè)任務(wù)旨在衡量個(gè)體在生成獨(dú)特和多樣想法方面的能力。

Consequences Task(結(jié)果任務(wù)):在這個(gè)任務(wù)中,參與者被要求想象一個(gè)不尋常的情況或事件,并描述可能發(fā)生的結(jié)果。例如,如果重力突然消失,會(huì)發(fā)生什么?這個(gè)任務(wù)考察的是個(gè)體在邏輯推理和想象力方面的創(chuàng)造力。

Divergent Associations Task(發(fā)散聯(lián)想任務(wù)):這個(gè)任務(wù)要求參與者對(duì)一個(gè)給定的刺激詞(如“云”)提供盡可能多的關(guān)聯(lián)詞或想法。這個(gè)任務(wù)用于評(píng)估個(gè)體的思維靈活性和詞匯關(guān)聯(lián)能力。

測(cè)試結(jié)果顯示,在三個(gè)創(chuàng)造性思維任務(wù)中,ChatGPT-4 明顯優(yōu)于人類參與者。無(wú)論是在生成回答的數(shù)量、回答的長(zhǎng)度還是語(yǔ)義差異方面,ChatGPT-4 都表現(xiàn)出了顯著的優(yōu)勢(shì),突顯了其在創(chuàng)造性思維領(lǐng)域的潛力。

圖|在 Alternative Uses Task 中,與人類相比,在給出相同數(shù)量生成答案的機(jī)會(huì)下,GPT-4 更能成功地提出不同的答案,并且表現(xiàn)出更高的原創(chuàng)性,但僅限于特定的提示。(來(lái)源:該論文)

圖|在 Consequences Task 中,與人類相比,在相同數(shù)量的機(jī)會(huì)下,GPT-4 能夠更成功地想出更多不同的反應(yīng),并且根據(jù)提示類型也表現(xiàn)出更高的原創(chuàng)性。(來(lái)源:該論文)

為了排除其他因素的影響,研究還對(duì)回答流暢性進(jìn)行了控制比較。結(jié)果顯示,即使在控制了回答流暢性的情況下,ChatGPT-4 仍然表現(xiàn)出了更高的創(chuàng)造性潛力,進(jìn)一步證實(shí)了其在創(chuàng)造性思維任務(wù)中的優(yōu)越性。

這一研究結(jié)果引發(fā)了關(guān)于創(chuàng)造性潛力和實(shí)際應(yīng)用的討論。雖然 ChatGPT-4 在創(chuàng)造性思維任務(wù)中表現(xiàn)出了顯著的優(yōu)勢(shì),但研究團(tuán)隊(duì)也指出了其適用性的局限性。

例如,與人類相比,ChatGPT-4 缺乏自主性和實(shí)際經(jīng)驗(yàn),其創(chuàng)造性潛力依賴于人類用戶的指導(dǎo)和輸入。因此,盡管 ChatGPT-4 能夠生成創(chuàng)造性的想法,但其實(shí)際應(yīng)用仍受到限制。

另外,在評(píng)估 ChatGPT-4 的創(chuàng)造性潛力時(shí),還需要考慮其回答的適用性和實(shí)用性。盡管 ChatGPT-4 可以生成大量原創(chuàng)的想法,但這些想法是否適用于實(shí)際情境,以及是否能夠產(chǎn)生有意義的成果,仍然需要進(jìn)一步的研究和驗(yàn)證。

最后,研究團(tuán)隊(duì)還強(qiáng)調(diào)了人類創(chuàng)造力的獨(dú)特性和多樣性。與 ChatGPT-4 相比,人類具有更廣泛的經(jīng)驗(yàn)和情感體驗(yàn),能夠以更靈活和多樣的方式思考和創(chuàng)造。因此,在探討創(chuàng)造性潛力時(shí),不能簡(jiǎn)單地將 ChatGPT-4 的表現(xiàn)與人類相提并論,同時(shí)也需要更全面地考慮其在實(shí)際應(yīng)用中的適用性和局限性。

AI取代人類?還有待觀察

與之前的研究相比,此次研究的測(cè)試結(jié)果揭示了 ChatGPT-4 在多個(gè)創(chuàng)造性思維任務(wù)上的顯著優(yōu)勢(shì),為我們提供了有關(guān)人工智能在創(chuàng)造性思維方面的新認(rèn)識(shí)。

然而,這也引發(fā)了更多問(wèn)題和未來(lái)的探索方向。我們需要深入研究人工智能與人類創(chuàng)造性思維之間的關(guān)系,探討如何更好地利用人工智能來(lái)促進(jìn)創(chuàng)新。

未來(lái)的研究將致力于開發(fā)更智能、更全面的測(cè)量方法,以更好地理解和評(píng)估創(chuàng)造性思維的各個(gè)方面。隨著人工智能技術(shù)的不斷發(fā)展,我們對(duì)于人類創(chuàng)造力的認(rèn)識(shí)也將不斷深化,為構(gòu)建更具創(chuàng)意和智能的未來(lái)奠定堅(jiān)實(shí)基礎(chǔ)。

研究團(tuán)隊(duì)認(rèn)為,這些測(cè)試是否能完美地衡量人類的創(chuàng)造潛能并不是問(wèn)題的關(guān)鍵。關(guān)鍵在于,大模型正在快速演化,并以前所未有的方式超越人類,它們是否有可能取代人類的創(chuàng)造力還有待觀察。

他們也表示,在未來(lái),人工智能作為靈感工具、作為個(gè)人創(chuàng)造過(guò)程的輔助工具或克服固定性(fixedness)的工具,都大有可為。

參考鏈接:

https://www.nature.com/articles/s41598-024-53303-w

https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/

歡迎掃碼關(guān)注深i科普!

我們將定期推出

公益、免費(fèi)、優(yōu)惠的科普活動(dòng)和科普好物!


聽說(shuō),打賞我的人最后都找到了真愛(ài)。
做科普,我們是認(rèn)真的!
掃描關(guān)注深i科普公眾號(hào)
加入科普活動(dòng)群
  • 參加最新科普活動(dòng)
  • 認(rèn)識(shí)科普小朋友
  • 成為科學(xué)小記者