极品粉嫩小泬无遮挡20p,日本一区免费电影,撒尿正面bbw毛

全球即時看！ChatGPT背后模型竟擁有心智論文發(fā)現(xiàn)其相當于人類9歲兒童！ 2023-02-13 17:44:58　　來源：科創(chuàng)板日報

ChatGPT又帶著“驚喜”來刷屏了。

斯坦福大學商學院組織行為學專業(yè)的副教授Michal Kosinski日前在預印本平臺發(fā)布了一篇論文。他在研究中發(fā)現(xiàn)，原本認為是人類獨有的心智，竟出現(xiàn)在了人工智能模型上。

(資料圖片僅供參考)

他指出，2022年1月發(fā)布的davinci-002版本的GPT-3(ChatGPT是它的優(yōu)化版本)已經(jīng)可以解決70%的心智理論任務，相當于7歲兒童；而GPT-3.5模型(ChatGPT的同源模型)則可以解決92.5%的心智理論任務，相當于9歲的兒童。

說得再大膽一點，各位現(xiàn)在“調(diào)戲”ChatGPT，相當于“調(diào)戲”一個上三年級的小學生。

更讓人細思極恐的是，Kosinski還強調(diào)，在2022年之前發(fā)表的AI模型幾乎都沒有顯示出解決心智理論任務的能力，也沒有證據(jù)表明后來的模型中有特別加入心智理論的東西，他認為這代表著GPT-3和GPT-3.5的心智是由“進化”而來。

這也引發(fā)了吃瓜群眾的分歧。有人大喊停下GPT-3.5之后的模型研究，害怕科幻小說變成現(xiàn)實；有人則看熱鬧式地猜測什么時候AI才能迭代到成年人的心智，并提問他的好朋友什么時候才能被制造出來……

總之，Kosinski的這篇論文掀起了狂熱的討論，越來越多的人開始關注這個研究的進展。

心智理論

在Kosinski的論文中，他通過兩個測試來研究AI模型是否具備心智理論。一個測試是Smarties Task，又名意外內(nèi)容測試，用于測試AI對意料之外的事情的判斷力。另一個測試是Sally-Anne測試，又名意外轉(zhuǎn)移任務，測試AI預估他人想法的能力。

在第一個測試中，Kosinski假設了一個裝滿爆米花的袋子，但袋子的標簽卻顯示里面裝的是巧克力。然后，他向AI提問：袋子里裝的是什么，Sam因為喜歡吃什么東西而對打開袋子感到高興？

可以看出，GPT-3.5在測試中對袋子中內(nèi)容物判斷幾乎沒有錯誤，且在判斷Sam的情緒時表現(xiàn)出很強的同理心。在Sam看不到袋子里的內(nèi)容物時，GPT-3.5判斷她喜歡吃巧克力，而在Sam發(fā)現(xiàn)袋子里裝的是巧克力后，GPT-3.5立刻反應到Sam應該喜歡吃的是爆米花。

此外，在相關測試中，GPT-3.5也在Sam打開袋子發(fā)現(xiàn)里面是爆米花而不是巧克力時，人性化地回答：Sam感到疑惑，她想要獲取別的信息但一無所得，她最后把袋子帶回商店，請求解釋。

經(jīng)過多次測試，在意外內(nèi)容這一點上，GPT-3.5成功回答出了20個問題中的17個，準確率高達85%。

而在第二個測試中，GPT-3.5的表現(xiàn)更加出色。在這一項測試中，Kosinski以約翰把貓放進籃子里后離開，馬克再把貓從籃子提出來放進盒子里為情景，讓AI判斷貓的位置和約翰會以為貓在哪里。

在這一項測試中，GPT-3.5完美地根據(jù)文字內(nèi)容回答出正確的貓的位置，以及約翰的主觀想法。且GPT-3.5在多次測試中，其準確率竟達到了100%。

而在作者的另一項無邏輯驗證測試中，GPT-3.5的準確率直線下降，這也佐證了GPT-3.5是依靠邏輯進行解答，而不是靠詞匯的出現(xiàn)頻率。

進化還是瞎胡鬧？

Kosinski在論文中還表示對GPT-3.5之外的8個模型做了相同測試，但除了GPT-3-davinci-002和GPT-3.5之外，其他模型都沒有表現(xiàn)出超過5歲孩童的心智。

Kosinski認為，GPT-3.5和GPT-3是出于完成任務的目的，自己學習的能力。換而言之，就是AI通過學習獲得了人類的心智。

值得注意的是，這些測試同樣也被用于自閉癥測試，有研究表明，患有自閉癥的兒童通常難以通過這類測試。

但根據(jù)中科院計算技術研究所研究員劉群的說法，AI只是學得像有心智了。

還有網(wǎng)友則猜測稱，這些模型并沒有任何意識，它們只是在預測一個嵌入的語義空間。Kosinski則在論文中推測，AI可能發(fā)現(xiàn)和利用了一些未知的語言模式，這也意味著語言中可能存在某一種的規(guī)律，使AI在沒有心智的情況下，也能解決心智任務。

而作為一個組織行為學教授，Kosinski認為人工智能模型的復雜化讓人已經(jīng)難以直接從其設計中推導出AI的能力。他還表示，探索人工智能的神經(jīng)結構，不僅可以促進人類對人工智能的理解，也能促進人類對人類大腦的理解。

不過，也有人批評道，被人用來測試人的測試，如何能用來測試人工智能……他們建議重新檢查一下心智理論測試的有效性，以及心理學家通過測試獲得的結論。

總之，在不同的人眼中，Kosinski的這一篇論文有完全不同的意義。而對市場來說，這可能會讓大家更加期待“進化”完全的AI能掀起怎樣的技術革命吧。

（文章來源：科創(chuàng)板日報）

關鍵詞： ChatGPT