ChatGPT又帶著“驚喜”來刷屏了。
斯坦福大學商學院組織行為學專業(yè)的副教授Michal Kosinski日前在預印本平臺發(fā)布了一篇論文。他在研究中發(fā)現(xiàn),原本認為是人類獨有的心智,竟出現(xiàn)在了人工智能模型上。
(資料圖片僅供參考)
他指出,2022年1月發(fā)布的davinci-002版本的GPT-3(ChatGPT是它的優(yōu)化版本)已經(jīng)可以解決70%的心智理論任務,相當于7歲兒童;而GPT-3.5模型(ChatGPT的同源模型)則可以解決92.5%的心智理論任務,相當于9歲的兒童。
說得再大膽一點,各位現(xiàn)在“調(diào)戲”ChatGPT,相當于“調(diào)戲”一個上三年級的小學生。
更讓人細思極恐的是,Kosinski還強調(diào),在2022年之前發(fā)表的AI模型幾乎都沒有顯示出解決心智理論任務的能力,也沒有證據(jù)表明后來的模型中有特別加入心智理論的東西,他認為這代表著GPT-3和GPT-3.5的心智是由“進化”而來。
這也引發(fā)了吃瓜群眾的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小說變成現(xiàn)實;有人則看熱鬧式地猜測什么時候AI才能迭代到成年人的心智,并提問他的好朋友什么時候才能被制造出來……
總之,Kosinski的這篇論文掀起了狂熱的討論,越來越多的人開始關注這個研究的進展。
心智理論
在Kosinski的論文中,他通過兩個測試來研究AI模型是否具備心智理論。一個測試是Smarties Task,又名意外內(nèi)容測試,用于測試AI對意料之外的事情的判斷力。另一個測試是Sally-Anne測試,又名意外轉(zhuǎn)移任務,測試AI預估他人想法的能力。
在第一個測試中,Kosinski假設了一個裝滿爆米花的袋子,但袋子的標簽卻顯示里面裝的是巧克力。然后,他向AI提問:袋子里裝的是什么,Sam因為喜歡吃什么東西而對打開袋子感到高興?
可以看出,GPT-3.5在測試中對袋子中內(nèi)容物判斷幾乎沒有錯誤,且在判斷Sam的情緒時表現(xiàn)出很強的同理心。在Sam看不到袋子里的內(nèi)容物時,GPT-3.5判斷她喜歡吃巧克力,而在Sam發(fā)現(xiàn)袋子里裝的是巧克力后,GPT-3.5立刻反應到Sam應該喜歡吃的是爆米花。
此外,在相關測試中,GPT-3.5也在Sam打開袋子發(fā)現(xiàn)里面是爆米花而不是巧克力時,人性化地回答:Sam感到疑惑,她想要獲取別的信息但一無所得,她最后把袋子帶回商店,請求解釋。
經(jīng)過多次測試,在意外內(nèi)容這一點上,GPT-3.5成功回答出了20個問題中的17個,準確率高達85%。
而在第二個測試中,GPT-3.5的表現(xiàn)更加出色。在這一項測試中,Kosinski以約翰把貓放進籃子里后離開,馬克再把貓從籃子提出來放進盒子里為情景,讓AI判斷貓的位置和約翰會以為貓在哪里。
在這一項測試中,GPT-3.5完美地根據(jù)文字內(nèi)容回答出正確的貓的位置,以及約翰的主觀想法。且GPT-3.5在多次測試中,其準確率竟達到了100%。
而在作者的另一項無邏輯驗證測試中,GPT-3.5的準確率直線下降,這也佐證了GPT-3.5是依靠邏輯進行解答,而不是靠詞匯的出現(xiàn)頻率。
進化還是瞎胡鬧?
Kosinski在論文中還表示對GPT-3.5之外的8個模型做了相同測試,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都沒有表現(xiàn)出超過5歲孩童的心智。
Kosinski認為,GPT-3.5和GPT-3是出于完成任務的目的,自己學習的能力。換而言之,就是AI通過學習獲得了人類的心智。
值得注意的是,這些測試同樣也被用于自閉癥測試,有研究表明,患有自閉癥的兒童通常難以通過這類測試。
但根據(jù)中科院計算技術研究所研究員劉群的說法,AI只是學得像有心智了。
還有網(wǎng)友則猜測稱,這些模型并沒有任何意識,它們只是在預測一個嵌入的語義空間。Kosinski則在論文中推測,AI可能發(fā)現(xiàn)和利用了一些未知的語言模式,這也意味著語言中可能存在某一種的規(guī)律,使AI在沒有心智的情況下,也能解決心智任務。
而作為一個組織行為學教授,Kosinski認為人工智能模型的復雜化讓人已經(jīng)難以直接從其設計中推導出AI的能力。他還表示,探索人工智能的神經(jīng)結構,不僅可以促進人類對人工智能的理解,也能促進人類對人類大腦的理解。
不過,也有人批評道,被人用來測試人的測試,如何能用來測試人工智能……他們建議重新檢查一下心智理論測試的有效性,以及心理學家通過測試獲得的結論。
總之,在不同的人眼中,Kosinski的這一篇論文有完全不同的意義。而對市場來說,這可能會讓大家更加期待“進化”完全的AI能掀起怎樣的技術革命吧。
(文章來源:科創(chuàng)板日報)
關鍵詞: ChatGPT
- 全球即時看!ChatGPT背后模型竟擁有心智 論文發(fā)現(xiàn)其相當于人類9歲兒童!
- 赴土耳其的中國藍天救援隊 希望發(fā)現(xiàn)更多奇跡
- 每日觀察!北向資金凈買入6.92億元 搶籌三一重工、寧德時代
- 【獨家】國家能源局:2022年全國風電、光伏發(fā)電新增裝機突破1.2億千瓦 再創(chuàng)歷史新高
- 遼寧銀保監(jiān)局:利用經(jīng)營貸等置換房貸存多重風險 甚至要承擔刑責
- 世界觀點:突發(fā):6死1傷!韻達快遞貨車司機被警方控制!
- 世界報道:華揚聯(lián)眾:截至本公告披露日 公司對外擔保余額為約1.63億元
- 全球新動態(tài):佳緣科技股東擬合計減持不超3.68%股份
- 【世界新要聞】歐林生物:AC-Hib聯(lián)合疫苗申請生產(chǎn)注冊獲受理
- 當前報道:雙鷺藥業(yè):海布生物目前開發(fā)的產(chǎn)品有電子煙、藥品、護膚品等
- 夜郎古酒攜手復星,共啟醬酒新征程!
- 金價難跌!2023年2月13日各大金店黃金價格多少錢一克?
- 科大訊飛AI學習機:個性化教學是找到契合孩子學習的優(yōu)解方法
- 內(nèi)蒙古風力發(fā)電量首破千億度
- 環(huán)球速看:北方最大優(yōu)質(zhì)特種玻璃及光伏背板深加工項目在內(nèi)蒙古準格爾旗投產(chǎn)
- 焦點速讀:老有所依 幼有所養(yǎng)!2023年內(nèi)蒙古將建350個鄉(xiāng)鎮(zhèn)養(yǎng)老服務中心 2萬個嬰幼兒托位
- 環(huán)球資訊:專訪:美政府策劃破壞“北溪”管道是對歐洲盟友展開的“經(jīng)濟戰(zhàn)”——訪瑞典跨國和平與未來研究基金會創(chuàng)始人奧貝里
- 自然資源“五項機制”服務打好經(jīng)濟增長主動仗
- 北京集租房水電氣熱怎么收費?
- 每日快播:南非媒體人士:北約像“軍火販” 加劇沖突與對抗
- 低碳菜單引領寧波餐飲消費新風尚 試點將持續(xù)至今
- 深圳坪山打造餐飲服務食品安全示范高地 嚴守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場活
- 第三季度全國消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對機動車檢測機構開展監(jiān)督抽查 規(guī)范機動
- 天津北辰扎實做好價格監(jiān)管工作 維護安全有序市場
- 北京石景山開展冬季供暖前特種設備安全專項檢查
- 陜西延安:開展兒童化妝品專項檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進網(wǎng)絡直播營銷治理顯成效 培育放心消費直
- 1 全球即時看!ChatGPT背后模型竟擁有心智 論文發(fā)現(xiàn)
- 2 赴土耳其的中國藍天救援隊 希望發(fā)現(xiàn)更多奇跡
- 3 每日觀察!北向資金凈買入6.92億元 搶籌三一重工、
- 4 【獨家】國家能源局:2022年全國風電、光伏發(fā)電新增
- 5 遼寧銀保監(jiān)局:利用經(jīng)營貸等置換房貸存多重風險 甚
- 6 世界觀點:突發(fā):6死1傷!韻達快遞貨車司機被警方控
- 7 世界報道:華揚聯(lián)眾:截至本公告披露日 公司對外擔
- 8 全球新動態(tài):佳緣科技股東擬合計減持不超3.68%股份
- 9 【世界新要聞】歐林生物:AC-Hib聯(lián)合疫苗申請生產(chǎn)注
- 10 當前報道:雙鷺藥業(yè):海布生物目前開發(fā)的產(chǎn)品有電子