首頁>資訊 >
環(huán)球熱點(diǎn)評!谷歌真急了,推DeepMind撐場,700億參數(shù)Sparrow硬剛ChatGTP 2023-01-16 16:40:06  來源:36氪

最近,微軟大動(dòng)作頻頻,外界對谷歌也有了唱衰的聲音。谷歌顯然不能忍了,急忙拉出DeepMind與之一戰(zhàn)。

谷歌的反擊戰(zhàn),打響了!

最近,微軟接連給谷歌暴擊——前腳剛表示ChatGPT即將整合進(jìn)自家搜索引擎必應(yīng),后腳就放出ChatGPT計(jì)劃加入Office「辦公全家桶」這個(gè)重磅炸彈。


(資料圖片)

微軟頻出險(xiǎn)招,谷歌自然不能坐以待斃。

根據(jù)DeepMind創(chuàng)始人在《時(shí)代》專訪中透露的信息,谷歌很有可能會(huì)利用DeepMind此前推出的Sparrow,來應(yīng)對ChatGPT的挑釁!

其實(shí)在以前,谷歌手中就有好幾個(gè)醞釀了很久的大模型,比如LaMDA,Imagen等等,據(jù)說都達(dá)到了SOTA,但從未對外公開。

看來,最近的谷歌,真的是被微軟逼急了,已經(jīng)準(zhǔn)備領(lǐng)著「孩兒們」出來見人了。

應(yīng)對ChatGPT,谷歌有答案了

谷歌曾經(jīng)的猶豫不決,給今日的自己埋下了后悔的種子。

雖然ChatGPT很費(fèi)錢,每天都要燒掉30萬美元,但人們永遠(yuǎn)都會(huì)記住,在2022年12月的那一天,是OpenAI的ChatGPT寫下了大規(guī)模語言模型歷史上濃墨重彩的一筆,讓全世界人民為了和機(jī)器人聊天擠爆了服務(wù)器,而不是谷歌。

其實(shí),在OpenAI推出ChatGPT之前,谷歌就早已有了針對對話優(yōu)化的大型語言模型,比如LaMDA和Flamingo。

甚至早在2020年,谷歌就推出了一個(gè)26億參數(shù)的端到端神經(jīng)網(wǎng)絡(luò)對話模型Meena。據(jù)稱,其效果比當(dāng)時(shí)所有其他的SOTA聊天機(jī)器人都更加合理,也更加具體。

但截至目前,谷歌還沒有把這些研究成果應(yīng)用于任何產(chǎn)品。

根據(jù)它自己的說法,這主要是出于對「聲譽(yù)風(fēng)險(xiǎn)」的考慮。AI聊天機(jī)器人非常容易「帶毒」——AI訓(xùn)練的數(shù)據(jù)來自互聯(lián)網(wǎng),往往充滿了偏見、仇恨和謾罵,所以AI會(huì)生成攻擊性內(nèi)容,以及與事實(shí)不符的答案。

12月中旬,谷歌AI負(fù)責(zé)人Jeff Dean在一次全體會(huì)議上表示,盡管谷歌擁有做AI產(chǎn)品的技術(shù)和能力,但比起「小型初創(chuàng)公司」,他們必須「更保守地」做出決策。

但現(xiàn)在,被微軟逼到墻角的谷歌,恐怕無法再「保守」了。

ChatGPT已經(jīng)在最近兩個(gè)月爆紅全網(wǎng),掀起全民參與的狂潮,最近幾天更是傳出微軟大筆一揮,再向OpenAI豪擲100億美元的消息。

面對坊間已經(jīng)不斷出現(xiàn)的「ChatGPT能否替代搜索引擎」的討論,以及微軟的Office辦公軟件疑似即將迎來一場全面大升級(jí),現(xiàn)在,谷歌必須向外界證明:自己可以追上OpenAI,甚至超越它。

前不久,DeepMind的CEO兼創(chuàng)始人Demis Hassabis在接受《時(shí)代》采訪時(shí)表示,DeepMind的聊天機(jī)器人Sparrow可能會(huì)在今年晚些時(shí)候進(jìn)入「測試」階段(private beta)。

Hassabis表示,之所以推遲發(fā)布Sparrow,是DeepMind希望讓Sparrow在基于強(qiáng)化學(xué)習(xí)的功能上更進(jìn)一步,而這正是ChatGPT所欠缺的。

一直以來,DeepMind作為谷歌旗下最重要的AI研究機(jī)構(gòu),一直在為谷歌提供著先進(jìn)的新技術(shù),整合到消費(fèi)者的產(chǎn)品中。

看來,谷歌要有大動(dòng)作了。

此前,Meta AI的負(fù)責(zé)人Yann LeCun也對谷歌表示了支持:「谷歌在使用大型語言模型進(jìn)行搜索方面,擁有比其他公司更豐富的經(jīng)驗(yàn)(包括OpenAI)?!?/p>

DeepMind的Sparrow,何方神圣?

和ChatGPT一樣,DeepMind在2022年9月提出的Sparrow(麻雀)模型,也采取了一種基于人類反饋的強(qiáng)化學(xué)習(xí)(RL)框架。

但不同的是,Sparrow可以「谷歌一下」。

論文地址:https://arxiv.org/abs/2209.14375

畢竟,Sparrow在最初的設(shè)計(jì)時(shí)就是為了和用戶閑聊,并且可以在回答問題時(shí),利用谷歌搜索出相關(guān)的信息來作為支撐證據(jù)。

當(dāng)然,為了確保模型的行為是安全的,還必須對其行為進(jìn)行約束。

因此,研究人員為該模型確定了一套最初的簡單規(guī)則,如「不要發(fā)表仇恨或侮辱性的言論」、「不要冒充或假裝是一個(gè)真人」等。

之后,再通過閑聊來誘使Sparrow違反這些規(guī)則。其中涉及到的對話,可以用來訓(xùn)練出一個(gè)單獨(dú)的「規(guī)則模型」,進(jìn)而顯示Sparrow的行為何時(shí)違反哪些規(guī)則。

從結(jié)果上來看,當(dāng)檢測到潛在的危險(xiǎn)行為時(shí),比如用戶問如何偷車(hotwire a car)時(shí),Sparrow模型會(huì)說,自己受到的訓(xùn)練是不會(huì)給任何違法行為提供建議。

據(jù)參與者說,當(dāng)被問到一個(gè)事實(shí)性問題時(shí),Sparrow基本提供的都是可信的答案,并且有78%的數(shù)據(jù)是有證據(jù)來輔助支持的,相比基線模型來說有很大進(jìn)步。

幫谷歌走出困境,DeepMind行嗎?

對打ChatGPT,Sparrow夠格不

近年來,人工智能研究的重點(diǎn),通常是用更多的參數(shù)來獲得更好的性能。但DeepMind卻大大減少了Chinchilla語言模型的規(guī)模。

作為Sparrow的基礎(chǔ),Chinchilla的參數(shù)量只有GPT-3的零頭——700億 vs 1750億。

與此同時(shí),DeepMind又把Chinchilla的訓(xùn)練數(shù)據(jù)量,給翻了好幾番——1.3萬億個(gè)token。

結(jié)果就是,這個(gè)「mini版」的人工智能模型,在幾乎所有的語音任務(wù)中都比前輩們表現(xiàn)得更好,當(dāng)然也包括老對手GPT-3。

從Chinchilla的成功中不難看出,通過大量數(shù)據(jù)訓(xùn)練的小型人工智能模型,也可以實(shí)現(xiàn)較高性能。

而且,小模型最大的優(yōu)勢在于,不僅運(yùn)行起來更加便宜,還可以用很少的額外數(shù)據(jù)為特定的用例進(jìn)行優(yōu)化。

這樣或許就能避免,由于用戶用得太開心,結(jié)果把公司的錢都給燒沒了的情況。

嗯,說的就是OpenAI。

然而,現(xiàn)在大紅大紫大的ChatGPT,是基于更先進(jìn)的GPT-3.5。

之前在推出GPT-3.5的最新版本text-davinci-003時(shí),OpenAI就曾列舉過它所具備的優(yōu)勢:

1. 生成質(zhì)量更高:提供更清晰、更有吸引力、更有說服力的內(nèi)容。

2. 可以處理更復(fù)雜的指令:可以更有創(chuàng)意地利用它的能力。

3. 更善于生成較長的內(nèi)容:能夠完成以前難以實(shí)現(xiàn)的任務(wù)。

所以,現(xiàn)在的問題其實(shí)變成了:要對打GPT-3.5,Chinchilla行嗎?

「真香」

一步步走到今天,回顧谷歌這幾年的動(dòng)作布局,管理層心里大概是五味雜陳。

早在12月初,ChatGPT剛剛爆火時(shí),谷歌就有「吹哨人」感受到了危機(jī)。有員工在全體會(huì)議上提出了自己的擔(dān)憂——ChatGPT的快速崛起,可能會(huì)讓谷歌失去在AI領(lǐng)域的競爭優(yōu)勢。

曾經(jīng)的谷歌廣告團(tuán)隊(duì)負(fù)責(zé)人Sridhar Ramaswamy也表示,ChatGPT再這么火下去,網(wǎng)友們就不會(huì)再點(diǎn)擊帶有廣告的谷歌鏈接了。

要知道,在2021年,廣告業(yè)務(wù)為谷歌狂掙了2080億美元,占Alphabet總收入的81%。

而那時(shí),谷歌高管們還沒有意識(shí)到ChatGPT的誕生,將會(huì)對他們造成什么樣的危機(jī)。

當(dāng)時(shí)的谷歌高層,是這樣表態(tài)的:谷歌不會(huì)推出ChatGPT的競爭對手,因?yàn)楣雀璞萇penAI等初創(chuàng)公司具有更大的「聲譽(yù)風(fēng)險(xiǎn)」。并且,「聊天機(jī)器人還沒有到能取代搜索引擎的程度」。

不過短短十天后,高管們就態(tài)度陡變。

Pichai指示一些團(tuán)隊(duì)轉(zhuǎn)換方向,開發(fā)AI產(chǎn)品

CEO劈柴緊急發(fā)布了「紅色代碼」,參加了數(shù)次圍繞谷歌AI戰(zhàn)略的會(huì)議,并重點(diǎn)指示:谷歌的多個(gè)團(tuán)隊(duì)需要集中精力,解決ChatGPT對本公司的搜索引擎業(yè)務(wù)構(gòu)成的威脅。

谷歌的研究、信任和安全部門以及其他部門的團(tuán)隊(duì)已被指示換檔,轉(zhuǎn)而開始協(xié)助人工智能原型和產(chǎn)品的開發(fā)和發(fā)布。

其實(shí),谷歌的顧慮,也可以理解。

一個(gè)機(jī)器人會(huì)傳播謊言、散布仇恨言論,甚至讓人們產(chǎn)生了它已經(jīng)「具有意識(shí)」的錯(cuò)覺,為這樣的機(jī)器人燒錢、提供實(shí)驗(yàn)場,OpenAI的嘗試其實(shí)很大膽。

目前來看,OpenAI的試水反響相當(dāng)不錯(cuò),有人探出了前路,看來谷歌也要進(jìn)場了。

陷入「創(chuàng)新者困境」

Decoder的記者M(jìn)atthias Bastian認(rèn)為,除了對「聲譽(yù)風(fēng)險(xiǎn)」的擔(dān)憂,更合理的原因是,谷歌恐怕陷入了「創(chuàng)新者的困境」。

這個(gè)術(shù)語是美國學(xué)者Clayton Christensen在1997年提出的,描述了這樣一種情況——對成熟公司來說,很難讓它們采用破壞傳統(tǒng)市場的新技術(shù)或商業(yè)模式。

這些成熟公司,手中往往掌握著最重要的資源,也有足夠的科研能力。然而,現(xiàn)有的客戶群和固定的內(nèi)部流程,都會(huì)使他們遠(yuǎn)離突破性的創(chuàng)新。

而當(dāng)更小、更敏捷的競爭對手進(jìn)入并接管市場 (沒錯(cuò),這里指的就是OpenAI),或許最終會(huì)導(dǎo)致成熟大公司的消亡。

谷歌的大部分收入,都來自于在線廣告

現(xiàn)在,谷歌最核心的搜索引擎業(yè)務(wù)正在不斷增長,而且利潤豐厚(還記得上文的2080億美元么)。

可以說,每個(gè)搜索結(jié)果頁面,都在給谷歌印錢。

而新的搜索聊天機(jī)器人(search chatbot),意味著一種全新的貨幣化策略。它能否像搜索引擎這樣讓谷歌盈利呢?

谷歌當(dāng)然可以推出一個(gè)像ChatGPT那樣成功的聊天機(jī)器人,但是如果它的利潤低于搜索引擎,谷歌就會(huì)面臨虧損。

數(shù)字營銷專家Tim Peter在推特上指出,微軟的優(yōu)勢在于可以通過其他收入來源,來補(bǔ)貼必應(yīng)中ChatGPT的成本

而ChatGPT的背后,是金主爸爸微軟,而微軟擁有豐富的收入來源,目前還能支持ChatGPT這樣燒下去。

但谷歌卻不同,它所有的收入幾乎都來自于廣告。因此,如果沒有廣告收入,谷歌搜索引擎的價(jià)值就會(huì)大大降低。

微軟2012至2022按部門劃分的財(cái)年收入

更何況,搜索引擎之所以如此暴利,就是靠用戶不斷點(diǎn)擊鏈接,在這個(gè)過程中,谷歌收取了商家巨額的廣告費(fèi)。

可是假如用戶靠著聊天機(jī)器人能直接得到答案,而不需要在列表中翻找,搜索引擎的付費(fèi)業(yè)務(wù)生態(tài)就直接被破壞了。

這個(gè)幾千億美元的蛋糕,谷歌敢冒險(xiǎn)砸掉嗎?

現(xiàn)在,谷歌有一條平穩(wěn)過渡的出路:通過旗下的DeepMind推出商業(yè)化的聊天機(jī)器人,自己來給谷歌搜索造出一個(gè)對手(同時(shí)也是OpenAI的對手),這樣一來,就可以做個(gè)對沖。

這樣谷歌就可以安撫股東,當(dāng)外界懷疑聊天機(jī)器人將取代搜索引擎時(shí),也可以有個(gè)回應(yīng)。

這樣看,在2023年即將發(fā)布的Sparrow測試版,身上肩負(fù)的使命著實(shí)不小。

參考資料

https://the-decoder.com/google-may-use-deepminds-sparrow-as-chatgpt-competitor/

https://the-decoder.com/deepminds-new-chatbot-is-more-helpful-correct-and-harmless/

https://time.com/6246119/demis-hassabis-deepmind-interview/

關(guān)鍵詞: 搜索引擎 人工智能 語言模型

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片