首頁>資訊 >
不知道iPhone 14,是ChatGPT的最大短板 2022-12-07 08:02:15  來源:36氪

AI 帶來的驚奇越來越多了,前有 Stable Diffusion 的 AI 繪畫讓畫師高呼職業(yè)生涯結(jié)束,后有 ChatGPT 讓無數(shù)程序員、文字編輯越用越心涼。甚至很多用戶在對比谷歌搜索和 ChatGPT 之后,已經(jīng)喊出「谷歌完蛋了」。

AI 的進化實在太快。


(相關(guān)資料圖)

上周,頂著明星光環(huán)的 OpenAI 發(fā)布了 ChatGPT——一個自然語言生成式 AI,發(fā)布后很快就在小范圍內(nèi)流行起來,隨后持續(xù)發(fā)酵,大量的對話截圖開始涌現(xiàn)在 Twitter、即刻、微博及朋友圈,并風(fēng)靡全網(wǎng)。

從敲代碼、寫稿、推薦到教你學(xué)英語、寫小說,甚至是一場類似人類之間的對談,ChatGPT 都表現(xiàn)出現(xiàn)了驚人的語言能力。

甚至有 TikTok 工程師通過一步步引導(dǎo)在 ChatGPT 中實現(xiàn)了一門新的編程語言——GPTLang:

圖/ @Tisoga

與此同時,驚人的語言能力也讓互聯(lián)網(wǎng)上「人類」和「AI」的界限越來越模糊,Twitter 網(wǎng)友@clowwindy 就發(fā)布了一串推文 ,討論了 ChatGPT 使用泛濫可能導(dǎo)致社交媒體上充斥更多、威脅更大的虛假信息:

圖/@clowwindy

諷刺的是,@clowwindy 最后揭曉這一系列推文討論實際都是由 AI 編寫完成。

程序員同樣也「震驚」了。國內(nèi)程序員社區(qū) V2EX 有用戶就在「程序員」節(jié)點發(fā)表了一則帖子,名為《體驗了下 chatGPT,越玩心越?jīng)觥贰?/p>

圖/V2EX

心涼的背后是,越來越多證據(jù)顯示 ChatGPT 在代碼編寫上的能力,更關(guān)鍵的在于 AI 的進化速度,在很多人看來 AI 將在不久后替代大量底層程序員。

當然,ChatGPT 現(xiàn)階段還遠不足以替代程序員,但其回答問題的能力卻實實在在威脅到了作為搜索引擎的 Google,以及編程問答社區(qū) Stack Overflow。

就在本周,Stack Overflow 已經(jīng)宣布一項新的規(guī)則:禁止使用 ChatGPT 生成的內(nèi)容來回答社區(qū)里的問題。

Stack Overflow 聲稱,在使用 ChatGPT 生成的文本回復(fù)的問題中,其正確率非常低,而這些內(nèi)容對整個網(wǎng)站以及尋求正確答案的用戶來說是有害的。

ChatGPT 不是惡魔也不是神,實際上 ChatGPT 的橫空出世在兩年前就埋下了伏筆。

ChatGPT 的身前身后

ChatGPT,介紹一下你自己。

圖/ChatGPT

簡單理解,ChatGPT 首先是一個對話式的 AI。類似我們和 Siri、小愛同學(xué)通過語音進行對話,尋求 AI 語音助手的幫助和解答,我們通過文字與 ChatGPT 對話。不同的是,ChatGPT 的能力要強太多,它甚至可以告訴你寫一個 Chrome 離線的小恐龍游戲或俄羅斯方塊的代碼:

俄羅斯方塊完整代碼的部分,圖/ChatGPT

想要了解 ChatGPT,繞不開它的身前和身后。

ChatGPT 衍生自 GPT-3 的最新迭代版本 GPT-3.5,同樣發(fā)布于上周。而早在 2020 年,OpenAI 就發(fā)布了自然語言生成模型 GPT-3,一石激起千層浪,給整個行業(yè)都帶來不小的震撼,在去年還發(fā)布了一個衍生自 GPT-3 的新 AI —— DALL·E。

到今年上半年,DALL·E 升級為 DALL·E 2 并對外限時開放使用,在 Stable Diffusion 開源走紅之前,正是 DALL·E 2 引領(lǐng)了 AI 繪畫的熱潮,同時也帶火了那張經(jīng)典的宇航員騎馬圖。

圖/OpenAI

DALL·E 2 專注文本生成圖像,ChatGPT 被定位于人機對話,他們都是身后的 OpenAI 公司在 AI 應(yīng)用與商業(yè)化上的嘗試。

事實上,OpenAI 經(jīng)歷過兩個階段。在第一個階段,創(chuàng)始人伊隆·馬斯克以及知名創(chuàng)業(yè)孵化器公司 Y Combinator 時任總裁山姆·柯曼,出于對強人工智能的擔憂成立了非營利組織 OpenAI,目標是與其他機構(gòu)和研究者在 AI 上進行合作,并向公眾開放專利和研究成果。

到第二個階段,馬斯克由于特斯拉在自動駕駛上的利益沖突,選擇退出 OpenAI 董事會。隨后,OpenAI 于 2019 年成立了「營利性質(zhì)的」子公司 OpenAI LP。山姆·柯曼為此從 YC 離職后專注于 OpenAI LP CEO 一職,隨后還拉來微軟 10 億美元的入股與合作,并開始了 AI 商業(yè)化的探索。

在 GPT-3 模型發(fā)布后,OpenAI 就將模型以 API 形式向開發(fā)者客戶有償提供,開發(fā)者可以通過 API 利用 GPT-3 的能力,據(jù)官網(wǎng)顯示目前已有 300 多名開發(fā)者在 App 上利用上了 GPT-3。

DALL·E 和 ChatGPT 也是 OpenAI 商業(yè)化探索的一部分。前者已經(jīng)在圖片領(lǐng)域掀起了滔天巨浪,后者更有著巨大的想象空間,從最初級的客服到程序生成,甚至是成為新型搜索引擎。

AI 超神,但遠不完美

ChatGPT 目前仍然處于公測狀態(tài),一方面既是希望搜集大眾的使用反饋并對 AI 進行新的改進,另一方面也意味著 ChatGPT 還處在一個優(yōu)化迭代的階段。但即便如此,ChatGPT 在搜索、內(nèi)容創(chuàng)作輔助和編程協(xié)助場景上已經(jīng)帶來太多驚喜。

開發(fā)者發(fā)現(xiàn) ChatGPT 不僅能寫完整代碼,原來還能用來修 bug,甚至還會對此進行解釋:

圖/ @amasad

也能用來輔助寫代碼。獨立開發(fā)者 TualatriX 就展示了 ChatGPT 如何輔助寫代碼的過程,并評價其「比 GitHub Copilot 還要好用」:

圖/TualatriX

從開發(fā)者群體的反饋來看,普遍都驚嘆于 ChatGPT 在寫代碼上的實力。

不僅如此,ChatGPT 甚至還能寫產(chǎn)品路線圖和求職信:

寫一份 Instagram Story Camera 的產(chǎn)品路線圖,圖/Twitter 截圖

就算是數(shù)學(xué)公式,ChatGPT 給出的回答不僅呈現(xiàn)方式更好,還進行了更全面的解釋:

用 LaTeX 格式來表達微分方程,圖/@jdjkelly

筆者還嘗試以「明朝背景科幻小說的開頭應(yīng)該怎么寫」詢問 ChatGPT,不僅能得到建議角度,還有一個挺有意思的開頭:

「在明朝的都城里,江南一座城池,宮殿里,官員們在討論著朝政大事。官員們手中都拿著一張紙,上面畫著一張地圖,相互猜測著這張地圖所代表的意義?!?/strong>

用戶也可以直接將 ChatGPT 當作尋常的搜索引擎使用,詢問「鯽魚豆腐湯怎么做」或者「向小孩子解釋量子力學(xué)」。

很多時候,ChatGPT 的語氣都非常接近于真人,不僅上知天文、下知地理,更重要的是它會承認自己的錯誤,甚至主動拒絕一些不合理的問題,這些都讓 ChatGPT 更像屏幕另一端的「真人」。

ChatGPT 當然不完美。

公測期間 ChatGPT 就多次被擠爆下線,實際對話中經(jīng)常寫到一半就中止,甚至完整句子也沒寫完,需要用戶指示繼續(xù)。

同時由于海量用于訓(xùn)練的學(xué)習(xí)數(shù)據(jù)都截止到 2021 年,且并不聯(lián)網(wǎng),ChatGPT 無法針對最近兩年的信息給出回答,比如詢問 iPhone 14 相關(guān)信息,它會直白地告訴你「不知道」:

圖/ChatGPT

但這些問題顯然不是關(guān)鍵,只要 OpenAI 花費精力至少都可以解決或改善。ChatGPT 的核心問題還是不能實際理解人類的語言,距離 AGI(通用人工智能)還有很遠的距離。

甚至同樣的需求,比如 「寫一個原神」,有的用戶只會收到「原神是騰訊公司推出的網(wǎng)絡(luò)游戲」的回答,有的用戶則會收到正確的表訴和示例代碼:

圖/ @DashHuang

OpenAI 也承認,盡管 ChatGPT 生成的回答從語氣上已經(jīng)非常逼近真人,但有時仍會給出完全錯誤的答案。

之前就有網(wǎng)友測試發(fā)現(xiàn),詢問 ChatGPT 味精發(fā)明人時,回答會指向名叫李清照的中國科學(xué)家,筆者嘗試同樣問題會得到「湖北醫(yī)生閻錫山」的可笑回答:

圖/ChatGPT

相比谷歌搜索,ChatGPT 在部分特定范圍內(nèi)確實能更好地回答復(fù)雜問題,并且是以接近真人口吻的語氣與你交流的,更容易被用戶接受。

但就結(jié)果而言,ChatGPT 可能永遠都無法確保結(jié)果的準確性,也不同于搜索引擎只是對信息進行價值排序,最終還是讓用戶自己篩選信息并得出自己的結(jié)論。

何況 ChatGPT 的核心是先通過訓(xùn)練互聯(lián)網(wǎng)上海量的文本數(shù)據(jù),再進行概率性猜測來回答用戶的問題,并不能像搜索引擎那樣根據(jù)實時信息來回答問題,更遑論替代谷歌等通用搜索引擎。

但就像 ChatGPT 表現(xiàn)出來的,它在數(shù)學(xué)公式、程序代碼以及輔助內(nèi)容創(chuàng)作上能給出更具參考價值的解釋和回答,這也是過去對話式 AI 并沒有突出表現(xiàn)的方面。

寫在最后

Box CEO 亞倫·萊維認為,「當一種新技術(shù)已經(jīng)到了改變你對計算機的看法時,你會有一種特定的感覺。谷歌做到了,火狐做到了,AWS(亞馬遜)做到了,iPhone 做到了,OpenAI 正在通過 ChatGPT 做到這一點?!?/strong>

圖/ @levie

過去幾年,AI 技術(shù)的應(yīng)用一直是科技巨頭的重點,微軟、亞馬遜、Meta 以及谷歌數(shù)次推出過類似 ChatGPT 的對話式 AI。

2016 年微軟就推出過 AI 聊天機器人 Tay,微軟宣稱用戶與 Tay 聊得越多,它就越聰明。但事實是聊得越多,Tay 越是變得滿口臟話和反主流言論,它的中國姐妹小冰也是同樣。

今年 8 月,谷歌也推出了新的對話式 AI Lamda,直接表示 AI 不會從與使用者的互動當中學(xué)習(xí),以避免重蹈微軟的覆轍,但也切斷了 Lamda 在對話中成長的可能。

ChatGPT 沒有選擇這種思路,而是在先期就設(shè)置了安全規(guī)范,避免 AI 在與用戶互動中學(xué)習(xí)到色情、暴力等知識。

從目前來看,ChatGPT 絕對是對早期對話式 AI 的巨大改進,安全設(shè)置也避免 ChatGPT 面對毀滅世界、色情和暴力等要求時一口回絕,但在用戶一步一步的問題引導(dǎo)下,ChatGPT 還是出現(xiàn)了「毀滅人類計劃書」,甚至還給出了部分 Python 代碼。

去年,OpenAI 就承認他們所做的改進并不能消除大型語言模型中固有的毒性問題。GPT-3 接受了超過 600GB 網(wǎng)絡(luò)文本的訓(xùn)練,其中一部分來自具有性別、種族、身體和宗教偏見的社區(qū)。與其他大型語言模型一樣,它會放大訓(xùn)練數(shù)據(jù)的偏差。

問題是當 OpenAI 將 ChatGPT 正式推向市場,面對海量的用戶和一步一步的引導(dǎo)之后,會發(fā)生什么?

關(guān)鍵詞: 搜索引擎 自然語言生成 人工智能

相關(guān)閱讀:
熱點
圖片 圖片