首頁(yè)>資訊 >
微動(dòng)態(tài)丨微軟欲用 ChatGPT 扶必應(yīng)“上位”,對(duì)抗 Google 2023-01-05 09:02:16  來(lái)源:36氪

一直以來(lái),Google 搜索引擎的市場(chǎng)占比一騎絕塵,讓很多競(jìng)爭(zhēng)者望而卻步。

不過(guò),現(xiàn)如今,隨著一種名為ChatGPT聊天機(jī)器人的到來(lái),在現(xiàn)身吟詩(shī)、寫代碼、編段子,甚至還上線司法考試現(xiàn)場(chǎng)的一個(gè)多月時(shí)間里,讓Google 敲響警鈴,更有多方媒體報(bào)道,Google 內(nèi)部正拉起了一道「紅色代碼警戒」(Code red),擔(dān)心 ChatGPT 將對(duì) Google 搜索引擎的未來(lái)帶來(lái)巨大挑戰(zhàn)。

與之形成鮮明對(duì)比的是,排在第二位且占比僅有 3.04% 的 Bing 顯得悠然自得一些。據(jù)外媒 The Information 最新發(fā)布的一篇報(bào)道顯示,微軟可能會(huì)在 2023 年 3 月之前在 Bing 中應(yīng)用 ChatGPT,用人工智能來(lái)回答一些搜索查詢。


【資料圖】

微軟的先見(jiàn)之明

微軟與 ChatGPT 背后的開(kāi)發(fā)商 OpenAI 之間的合作關(guān)系早已不是什么秘密,現(xiàn)如今回過(guò)頭來(lái)看,不少人敬佩起微軟的先見(jiàn)之明。

創(chuàng)立于 2015 年的 OpenAI,自誕生之日起,便以促進(jìn)和發(fā)展友好的人工智能為目標(biāo)。時(shí)至今日,其相繼推出了 GPT-3、DALL·E 2、ChatGPT等重磅模型,推動(dòng)了人工智能一次又一次地成功落地。

然而,起初作為一家非營(yíng)利機(jī)構(gòu),OpenAI 并沒(méi)有找到自身的營(yíng)利模式。

宛如其對(duì)標(biāo)的 Google 旗下的 Deepmind 部門,也曾一度陷入到虧損、負(fù)債的迷茫中。彼時(shí),據(jù)《彭博社》報(bào)道,2018 年,谷歌母公司 Alphabet Inc. 收購(gòu)的人工智能公司 DeepMind 的收入幾乎翻了一番,但卻因?yàn)樘潛p增至數(shù)十億美元,收益情況不容樂(lè)觀。一直以來(lái),DeepMind 的盈利能力依然備受質(zhì)疑。

處于同一起跑線的 OpenAI 亦然也會(huì)面臨“囊中羞澀”的尷尬問(wèn)題。

不過(guò),好在最初名不經(jīng)傳的 OpenAI 帶著馬斯克的光環(huán),渡過(guò)了研發(fā)的第一階段。而后支撐到了2019 年 3 月,OpenAI 也為其可持續(xù)開(kāi)發(fā)做了打算,并成立了 OpenAI LP 子公司,主要目的就是為營(yíng)利。

也是在這一年,OpenAI 的發(fā)展引起了微軟的注意,隨后的7 月,微軟宣布向OpenAI 投資 10 億美元,雙方攜手合作替 Azure 云端平臺(tái)服務(wù)開(kāi)發(fā)人工智能技術(shù),與此同時(shí),OpenAI 也將用這筆巨款進(jìn)一步推進(jìn)通用人工智能(AGI)的研究。

2020 年時(shí),我們只知曉,在 OpenAI 推出 GPT-3 語(yǔ)言模型時(shí),微軟于當(dāng)年的 9 月 22 日取得獨(dú)家授權(quán)。

當(dāng)前,隨著 The information 的報(bào)道,更多的細(xì)節(jié)被曝光出來(lái),其中便包括早在 2019 年,微軟在對(duì) OpenAI 的投資包括了一項(xiàng)將 GPT 的某些方面納入 Bing 中的協(xié)議。

Bing 將加入ChatGPT 功能

具體來(lái)看,舊版本的 GPT 可以在用戶輸入時(shí),自動(dòng)提供搜索查詢建議。如今,微軟已經(jīng)宣布計(jì)劃將Dall-E 2 模型集成到 Bing Image Creator 中,方便用戶可以在其中發(fā)出描述性文本提示并生成 AI 圖稿。

據(jù) The information 報(bào)道,有直接了解情況的人士稱,微軟即將發(fā)布的公告將揭示更多有意義的功能。

那么,如果搜索引擎引入 ChatGPT 聊天機(jī)器人,那么又將會(huì)以什么樣的形式呈現(xiàn)?

據(jù)悉,這些AI 支持的答案可以采用包含信息來(lái)源的完整句子的形式呈現(xiàn),而不是引用可能解決用戶提出的問(wèn)題來(lái)源或者鏈接列表的精選片段。

不過(guò),“Bing 仍將依靠自己的技術(shù)來(lái)產(chǎn)生大部分搜索結(jié)果”,因?yàn)?GPT 并不意味著“像搜索引擎那樣持續(xù)抓取網(wǎng)絡(luò)或提供實(shí)時(shí)信息”。同時(shí),Bing 如何確保答案的準(zhǔn)確性還有待觀察。

The Information 稱這“可能會(huì)在今年 3 月底之前推出”,而 Bing 可能被定位為“免費(fèi)訪問(wèn)部分 GPT 的唯一方式”。因?yàn)榘凑?OpenAI 的計(jì)劃,他們將會(huì)對(duì) ChatGPT 采取收費(fèi)政策,對(duì)此,外媒也將微軟評(píng)價(jià)為“為初創(chuàng)公司的云賬單買單”的企業(yè)。

ChatGPT,為“殺死”傳統(tǒng)搜索引擎而生?

不過(guò),微軟此舉能否讓 Bing 逆襲“天下第一”的 Google 搜索引擎,很多網(wǎng)友表示:期待。

但也有不少人持懷疑態(tài)度,甚至還發(fā)起了一項(xiàng)投票:

為此,用戶層面也形成了兩個(gè)主要觀點(diǎn):

其一,支持 ChatGPT 會(huì)打破傳統(tǒng)搜索引擎的市場(chǎng)格局。

過(guò)去一個(gè)月期間,朋友圈一次又一次地刷屏,ChatGPT 的火爆程度有目共睹。

相比傳統(tǒng)的搜索引擎根據(jù)用戶提問(wèn),從而提供數(shù)千萬(wàn)個(gè)相關(guān)鏈接索引,ChatGPT 直接提供自己的搜索和信息綜合的單一答案,讓用戶省去反復(fù)點(diǎn)擊鏈接找尋答案的復(fù)雜度。

正是基于這一點(diǎn),很多人堅(jiān)信 ChatGPT 會(huì)面向傳統(tǒng)搜索引擎發(fā)起挑戰(zhàn)。

其二,ChatGPT 想要取代 Google 非常牽強(qiáng),至少目前看來(lái),不可能。

為了論述這一觀點(diǎn),外媒 TechTalks 此前也專門發(fā)布了一篇《為什么 ChatGPT 不會(huì)對(duì) Google 搜索構(gòu)成威脅》的文章,從大型語(yǔ)言模型(LLM)的真實(shí)性、更新、速度與商業(yè)化的角度進(jìn)行了剖析。

真實(shí)性無(wú)法保證。

用 ChatGPT 作為輔助性建議的提供者,其實(shí)一點(diǎn)問(wèn)題都沒(méi)有。但是在學(xué)術(shù)、科研等嚴(yán)謹(jǐn)?shù)膽?yīng)用場(chǎng)景中,ChatGPT 提供的答案并不一定都是正確的。解決 ChatGPT 輸出的真實(shí)性將會(huì)是一項(xiàng)重大的挑戰(zhàn),不過(guò),目前并沒(méi)有辦法從 ChatGPT 的輸出中分辨真?zhèn)?,除非你用其他?lái)源(如 Google)來(lái)驗(yàn)證答案。

然而,如果要使用大型語(yǔ)言模型來(lái)替代搜索引擎,此舉未免有些弄巧成拙。

也許有人會(huì)說(shuō),Google 這類的搜索引擎未必也會(huì)提供 100% 正確的答案,為什么不能對(duì) ChatGPT 包容一些?

其實(shí),Google 這類的搜索引擎至少為用戶提供了可以驗(yàn)證的來(lái)源鏈接,但ChatGPT 只提供純文本,不引用實(shí)際網(wǎng)站。雖然目前也有不少人將 LLM 輸出的不同部分鏈接到實(shí)際網(wǎng)頁(yè),但這是一項(xiàng)復(fù)雜的研究工作,當(dāng)前還無(wú)法通過(guò)純粹的基于深度學(xué)習(xí)的方法來(lái)解決。

更新模型的成本太高

ChatGPT 和其他 LLM 面臨的另一個(gè)挑戰(zhàn)是更新他們的知識(shí)庫(kù)。

搜索引擎的索引其實(shí)可以實(shí)時(shí)更新,也更為方便快捷一些,但對(duì)于大型語(yǔ)言模型而言,添加新的內(nèi)容需要重新訓(xùn)練模型。

也許不是每次更新都需要完全重新訓(xùn)練模型,但是相比搜索引擎,其添加或者修改訓(xùn)練數(shù)據(jù)的成本都更昂貴。

據(jù)外媒報(bào)道,基于 GPT 3.5,ChatGPT 可能至少有 1750 億個(gè)參數(shù)。由于沒(méi)有可以適合該模型的單個(gè)硬件,因此必須將其分解并分布在多個(gè)處理器上,例如 A100 GPU。設(shè)置和并行化這些處理器以訓(xùn)練和運(yùn)行模型既是技術(shù)挑戰(zhàn),也是財(cái)務(wù)挑戰(zhàn)。

速度挑戰(zhàn)

LLM 也有推理速度問(wèn)題。搜索引擎不需要為每個(gè)查詢?yōu)g覽整個(gè)數(shù)據(jù)集。他們有索引、排序和搜索算法,可以以非??斓乃俣炔槊髡_的記錄。因此,即使在線信息量在增長(zhǎng),搜索引擎的速度也不會(huì)下降。

不過(guò),LLM 每次收到提示時(shí)都會(huì)通過(guò)整個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)行信息。其計(jì)算量要比搜索引擎的查詢索引多很多。鑒于深度神經(jīng)網(wǎng)絡(luò)的非線性特性,推理操作的并行化程度是有限的。隨著 LLM 訓(xùn)練語(yǔ)料庫(kù)的增長(zhǎng),模型也必須變得更大,才能很好地泛化其知識(shí)庫(kù)。

商業(yè)模式

目前,ChatGPT 還處于測(cè)試階段,并沒(méi)有落地的商業(yè)模式。不過(guò)此前據(jù) TechCrunch 估計(jì),擁有 100 萬(wàn)用戶的 ChatGPT 每天花費(fèi) 100,000 美元,每月花費(fèi)約 300 萬(wàn)美元。

不難計(jì)算出如果全球的用戶每天運(yùn)行 80 億次搜索查詢時(shí)會(huì)發(fā)生什么。此外,再加上定期訓(xùn)練模型的成本,以及通過(guò)強(qiáng)化學(xué)習(xí)和人工反饋對(duì)模型進(jìn)行微調(diào)所需的體力勞動(dòng)。

綜上而言,如果以單一的 ChatGPT 來(lái)對(duì)抗 Google 搜索引擎,也許勝算很小,甚至可以忽略不計(jì),但是當(dāng)下 Bing 的入局,而且按照微軟的初步計(jì)劃,其主要是將 ChatGPT 作為 Bing 的輔助功能,讓二者相結(jié)合起來(lái)的模式,推動(dòng) Bing 的上位。

這讓 Google 還在深陷于「自家也有類似于 ChatGPT 的能力人工智能語(yǔ)言模型 LaMDA ,但由于該技術(shù)帶來(lái)的"聲譽(yù)風(fēng)險(xiǎn)",公司不得不采取“比小型創(chuàng)業(yè)公司更保守的行動(dòng)”」中,處于被動(dòng)的位置。

這也為誰(shuí)能笑到最后的搜索引擎戰(zhàn)局,打上了一個(gè)問(wèn)號(hào)。

參考:

https://datasciencelearningcenter.substack.com/p/could-bing-disrupt-google-with-chatgpt

https://9to5google.com/2023/01/03/bing-chatgpt-report/

https://bdtechtalks.com/2023/01/02/chatgpt-google-search/

關(guān)鍵詞: 搜索引擎 人工智能 語(yǔ)言模型

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片