首頁>消費 >
見證歷史!GPT-4發(fā)布:能玩梗能考律師!官網(wǎng)被擠爆 用戶直呼:強得離譜 2023-03-15 16:47:43  來源:21財經(jīng)

“見證歷史了?!笨吹紾PT4的發(fā)布后,有多位業(yè)內(nèi)人士感嘆道。

3月15日凌晨,OpenAI發(fā)布了多模態(tài)預訓練大模型GPT-4,這也是其大型語言模型的最新版本。


【資料圖】

與此前的版本相比,GPT-4具備強大的識圖能力,文字輸入限制也提升至2.5萬字;GPT-4的回答準確性也顯著提升,還能夠生成歌詞、創(chuàng)意文本從而實現(xiàn)風格變化。同時,GPT-4在各類專業(yè)測試及學術基準上也表現(xiàn)優(yōu)良。

“這是OpenAI努力擴展深度學習的最新里程碑?!監(jiān)penAI介紹,“GPT-4是一個大型多模態(tài)模型,它接受圖像和文本輸入、進行文本輸出,雖然在許多現(xiàn)實場景中它尚且不如人類,但在各種專業(yè)和學術基準上表現(xiàn)出與人類相當?shù)男阅堋?/strong>”

GPT-4震撼發(fā)布:會玩梗還能考律師

從整體而言,GPT-4實現(xiàn)了多重能力的躍升。

OpenAI介紹稱,在日常對話中,GPT-4與GPT-3.5之間的差距或許微妙,但當任務復雜度足夠高的時候,GPT-4將具備更可靠、更具創(chuàng)造性的特點,且能夠處理更細致的指令。

例如,根據(jù)OpenAI公布的實驗數(shù)據(jù),GPT-4通過模擬律師考試且分數(shù)在應試者的10%左右。相較之下,GPT-3.5版本大模型的成績是倒數(shù)10%。

需要注意的是,相較于此前的GPT模型而言,GPT-4最大的突破之一是在文本之外還能夠處理圖像內(nèi)容。OpenAI表示,用戶同時輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。

OpenAI用一張“梗圖”演示了GPT-4特有的多模態(tài)功能。在以下輸入圖片并設問“這些圖片有何可笑之處?請逐一描述。”GPT-4便會在對每張圖片進行表述后表示,“這幅圖的幽默之處在于,把一個大而過時的VGA接口插入一個小而現(xiàn)代的智能手機充電端口是荒謬的。”

除了普通圖片,GPT-4還能處理更復雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等。此外,在多語種方面,GPT-4也體現(xiàn)出優(yōu)越性。在測試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語言模型的英語語言性能,其中包括部分低資源語言如拉脫維亞語、威爾士語等。在中文語境中,GPT-4能夠達到80.1%的準確性。

與此前的GPT模類似,GPT-4基礎模型可在訓練完預測文檔中的單詞。在數(shù)據(jù)樣本方面,也同樣使用公開可用的數(shù)據(jù)及許可數(shù)據(jù)。為了提升基礎模型回應與用戶之間意圖的匹配性,OpenAI同樣選擇了強化學習人類反饋(RLHF)來微調(diào)模型行為。

不過,OpenAI指出,在模型訓練方面,GPT-4建立了可預測擴展的深度學習棧。通過開發(fā)基礎設施及優(yōu)化,在多種規(guī)模下都可進行預測。為驗證其可擴展性,團隊提前準確預測了GPT-4在內(nèi)部代碼庫上的優(yōu)化指標,但使用的計算量僅為萬分之一。

盡管GPT-4功能強大,但同時OpenAI也坦言,與早期GPT模型類似,GPT-4也具備局限性。GPT-4依然會形成推理錯誤,因而在使用語言模型輸出時需要非常小心,最好以人工核查、附加上下文或避免高風險使用的方式予以輔助。

“GPT4的模型發(fā)布,本身是技術持續(xù)升級迭代發(fā)展的必然階段。AI行業(yè)每一年都會有些新模型發(fā)布,趨勢就是大模型、多模態(tài)?!痹诮邮?1世紀經(jīng)濟報道記者采訪時,IDC中國研究總監(jiān)盧言霞表示,“多模態(tài)肯定是必然趨勢,畢竟AI要真正達到人的智慧,需要處理多模數(shù)據(jù)。且在各行業(yè)場景里,大都是涉及多模態(tài)數(shù)據(jù)的處理?!?/p>

OpenAI付款系統(tǒng)被擠爆

首批用戶連夜寫測評

目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊申請內(nèi)測。

據(jù)財聯(lián)社報道,當天凌晨,在部分微信群,記者看到有不少用戶不眠不休測試GPT-4的表達:或用來出營銷策劃、寫廣告詞;或用于解答邏輯題、數(shù)學題;甚至還有用來調(diào)侃腦筋急轉彎。GPT-4均對答入流,并展示出其強悍的處理能力,用戶直呼“強得離譜”、“牛啊”。

更有用戶連夜寫出了一份測評:

由于僅限于Plus訂閱用戶使用,當晚,大批新訂用戶涌入,以至于OpenAI的付款系統(tǒng)被擠爆了。

已在必應中應用

從商業(yè)應用角度而言,目前GPT-4沒有免費版本。

不過在GPT-4發(fā)布后,OpenAI也直接升級了ChatGPT,目前,GPT-4的訪問權限僅面向ChatGPT Plus的付費訂閱用戶及企業(yè)和開發(fā)者開放。

想要訪問GPT-4的API,用戶可以注冊等待,OpenAI將邀請部分開發(fā)者進行體驗。

此外,在GPT-4發(fā)布后,微軟方面則宣布,目前全新必應預覽版中已經(jīng)搭載了定制版本的GPT-4。

“如果您在過去五周內(nèi)的任何時間使用過新的必應預覽版,那么您已經(jīng)體驗過這個強大模型的早期版本?!蔽④洷硎荆半S著OpenAI對GPT-4及更高版本進行更新,必應將從這些改進中受益?!?/p>

事實上,GPT-4的應用空間還是頗具想象的。目前,微軟已經(jīng)將 ChatGPT整合進云平臺Azure Open AI 中,企業(yè)和個人開發(fā)者均可借助Azure

Open AI功能直接集成到應用產(chǎn)品中,通過私人定制ChatGPT來提供個性化客戶服務,建立企業(yè)級智能化知識庫搜索引擎等。

“微軟有望在產(chǎn)業(yè)中通過GPT-4不斷拓展下游新興領域,應用于更多的場景中,并利用其多模態(tài)模型成本改變傳統(tǒng)AI客制化與定制化的特點,逐步向通用化方向發(fā)展?!比A鑫證券計算機研究團隊分析稱。

浙江大學國際聯(lián)合商學院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林在接受21世紀經(jīng)濟報道記者采訪時評論稱,GPT-4的核心能力提升體現(xiàn)為基本智能水平提升、多模態(tài)模型方面,后者意味著對文字互動形式的突破,識別能力擴展至圖片領域。

在商業(yè)落地方面,盤和林指出,GPT-4一經(jīng)發(fā)布,支付渠道就出現(xiàn)了擁堵,用戶熱情是足夠的,“這也就意味著當前OpenAI實際上沒有商用落地的憂慮,這款產(chǎn)品已經(jīng)可以實現(xiàn)變現(xiàn)?!?/strong>

此前有業(yè)內(nèi)觀點認為,GPT-4的發(fā)布有望成為生成式AI向超級AI快速演變的關鍵節(jié)點,而此次GPT-4真正亮相后,也引爆了業(yè)內(nèi)討論。

“GPT-4和GPT-3的主要區(qū)別在于模型的規(guī)模和能力,其多模態(tài)的模型超出文本范圍實現(xiàn)了對圖像乃至視頻的AI生成,同時突破生成文本的語種限制,實現(xiàn)多語種語言數(shù)據(jù)的輸入輸出?!比A鑫證券計算機研究團隊表示,“這是一場偉大的變革,AI可干的事越來越多,也許未來它將成為人類得心應手的工具。”

(文章來源:21財經(jīng))

關鍵詞:

相關閱讀:
熱點
圖片 圖片