免费xxxx大片国产片_精品在线一区_亚洲午夜福利av_亚洲色大成人一区二区_无码熟妇人妻AV在线影片免费

您的位置:首頁(yè) >聚焦 > 綜合 >

大模型,大逃殺!

2023-09-09 05:10:50 來(lái)源:朋湖網(wǎng)

2023年2月,美國(guó)前國(guó)務(wù)卿基辛格與谷歌前首席執(zhí)行官施密特、麻省理工學(xué)院教授丹·胡騰洛赫共同發(fā)表了一篇文章,名為《ChatGPT預(yù)示著一場(chǎng)智力革命》(ChatGPT Heralds an Intellectual Revolution)。


(資料圖片)

基辛格提出,自印刷術(shù)發(fā)明數(shù)百年之后,生成式大語(yǔ)言模型將再一次改變?nèi)祟惖恼J(rèn)知過(guò)程。“OpenAI開(kāi)發(fā)的ChatGPT現(xiàn)在能夠與人類交流。隨著它們的能力變得更廣泛,它們將重新定義人類知識(shí),加速我們現(xiàn)實(shí)構(gòu)造的變化,并重組政治和社會(huì)。”

一般而言,信息系統(tǒng)的拐點(diǎn)便是將信息的生產(chǎn)和獲取成本從邊際成本轉(zhuǎn)向固定成本。

舉一個(gè)簡(jiǎn)單的例子,過(guò)去找到某個(gè)目的地需要花幾塊錢(qián)買(mǎi)份地圖,然后在地圖上慢慢尋覓,而現(xiàn)在用高德等APP搜索,需要的時(shí)間不到300毫秒,高德花費(fèi)的成本不到一分錢(qián),而這是由于高德使用了大量的測(cè)繪等固定成本做到的。即從每次消費(fèi)者都要付很多,變成了高德一次性付很多。

而大模型帶來(lái)的關(guān)鍵轉(zhuǎn)變也在于此,將人的成本從邊際成本變?yōu)楣潭ǔ杀?,過(guò)去的律師、醫(yī)生等專業(yè)性的工作均可由其完成。

正因如此,自ChatGPT發(fā)布后,上線僅5天就吸引了100萬(wàn)名用戶,兩個(gè)月后,月活躍用戶就已經(jīng)達(dá)到1億人次,成為歷史上用戶數(shù)量增長(zhǎng)最快的消費(fèi)級(jí)應(yīng)用。要知道,TikTok經(jīng)過(guò)大約9個(gè)月的時(shí)間才達(dá)到這一量級(jí),而Instagram則用了兩年半。

01

百模大戰(zhàn)

巨大的蛋糕誰(shuí)都想來(lái)分上一塊。

據(jù)朋湖網(wǎng)不完全統(tǒng)計(jì),我國(guó)目前已有超過(guò)100家機(jī)構(gòu)發(fā)布了自己的AI大模型,其中通用大模型就有超過(guò)20個(gè)。

8月31日,國(guó)內(nèi)首批八家大模型通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案,百度、智譜、百川、字節(jié)、商湯、中科院(紫東太初)、MiniMax、上海人工智能實(shí)驗(yàn)室這八家機(jī)構(gòu)的大模型正式上線面向公眾提供服務(wù)。

然而,大模型投入極大,極其耗費(fèi)資源。英偉達(dá)曾透露,訓(xùn)練一次1750億參數(shù)的GPT-3需要34天,使用1024張A100 GPU芯片,單次訓(xùn)練成本高達(dá)1200萬(wàn)美元。

“超過(guò)千億(參數(shù))級(jí)別的大模型,訓(xùn)練需要投入的人力、電力、網(wǎng)絡(luò)支出等投入,一年至少5000萬(wàn)美金到1億美金?!崩鋈f(wàn)維CEO方漢認(rèn)為。

微軟甚至為了訓(xùn)練大模型,建成一臺(tái)排名世界前五的超級(jí)計(jì)算機(jī)。

以上種種統(tǒng)統(tǒng)證明了,通用大模型擁有極高的準(zhǔn)入門(mén)檻,早已不是入門(mén)者的游戲。然而,改變世界的機(jī)會(huì)沒(méi)有人能視而不見(jiàn),因此,國(guó)內(nèi)幾乎所有知名的互聯(lián)網(wǎng)公司均有大模型方向的布局。

2010年,以拉手網(wǎng)、窩窩團(tuán)、美團(tuán)等為代表的“千團(tuán)大戰(zhàn)”如火如荼,雖然活到如今的只剩一家,但這場(chǎng)競(jìng)爭(zhēng)客觀上的確為消費(fèi)者普及了移動(dòng)互聯(lián)網(wǎng)。如今的大模型同樣如此,已是業(yè)內(nèi)共識(shí)的是,通用大模型未來(lái)可能只有兩三家,甚至可能只有一家。

而如何才能活到最后,在數(shù)據(jù)與模型之外,應(yīng)用才是關(guān)鍵所在。

02

商業(yè)化困境

早在2016年,當(dāng)DeepMind研發(fā)的AlphaGo擊敗李世石后,其宣布與英國(guó)國(guó)家衛(wèi)生服務(wù)局,以及Moorfields眼科醫(yī)院、倫敦大學(xué)醫(yī)院等機(jī)構(gòu)展開(kāi)AI醫(yī)療診斷算法的合作,包括IBM旗下的Watson Health也趁著這股勢(shì)頭加快了拓展的腳步。

自此,人工智能迅速成為了資本市場(chǎng)最為性感的故事,甚至一度到某個(gè)公司發(fā)個(gè)關(guān)于AI合作的通稿就能看到股票的拉升。

泡沫破滅的同樣很快。

2017年,在AI界頂級(jí)的神經(jīng)信息處理系統(tǒng)大會(huì)(NIPS)上,阿里·拉希米將當(dāng)時(shí)快速發(fā)展的機(jī)器學(xué)習(xí)比作煉金術(shù),即方法雖然有不錯(cuò)的效果,但缺乏嚴(yán)謹(jǐn)完備可驗(yàn)證的理論知識(shí),這直接戳破了當(dāng)時(shí)AI存在的最大問(wèn)題。

2018年,Watson Health被曝出內(nèi)部文件,顯示其腫瘤診斷算法經(jīng)常給出不準(zhǔn)確的、與美國(guó)國(guó)家治療指南相悖的建議。例如,對(duì)于一名被診斷患有肺癌,同時(shí)伴有嚴(yán)重出血癥狀的患者,Watson Health給出的建議是接受化療并使用藥物貝伐珠單抗(Bevacizumab),然而該藥物可能導(dǎo)致“嚴(yán)重或致命的出血”,建議不要給患有嚴(yán)重出血的患者服用。

2019年,IBM停止了沃森人工智能藥物研發(fā)工具的開(kāi)發(fā)和銷售,理由是銷售表現(xiàn)令人失望。

這揭示了人工智能的行業(yè)落地最大的問(wèn)題——業(yè)務(wù)難以復(fù)制,模型不可泛化。

對(duì)如今的大模型而言依然如此。

一方面,通用大模型用于訓(xùn)練的信息大部分屬于網(wǎng)絡(luò)信息,有相當(dāng)一部分存在錯(cuò)誤,同時(shí)專業(yè)知識(shí)與行業(yè)數(shù)據(jù)的積累較為淺薄,導(dǎo)致數(shù)據(jù)的“噪音”過(guò)大,難以滿足專業(yè)要求高、容錯(cuò)率低的產(chǎn)業(yè)場(chǎng)景需求,畢竟我們對(duì)于大模型的希望肯定不止于“寫(xiě)寫(xiě)詩(shī)、聊聊天”而已。

另一方面,行業(yè)場(chǎng)景有豐富的know-how訴求,對(duì)數(shù)據(jù)的“投喂”要講究行業(yè)特殊性,如在生產(chǎn)管理中,要將原料特性、排產(chǎn)規(guī)則、資源分配規(guī)則等特定數(shù)據(jù)“喂養(yǎng)”給大模型,才能實(shí)現(xiàn)替代操作員類似的效果。

03

生態(tài)機(jī)會(huì)

為了更好的實(shí)現(xiàn)商業(yè)化,大模型企業(yè)均在不遺余力地推進(jìn)生態(tài)化建設(shè)。

2022年,阿里云在國(guó)內(nèi)首倡MaaS(Model as a Service,模型即服務(wù))理念,提出以AI模型為核心的開(kāi)發(fā)范式,并搭建了一套以AI模型為核心的云計(jì)算技術(shù)和服務(wù)架構(gòu),并將其全部向大模型初創(chuàng)企業(yè)和開(kāi)發(fā)者開(kāi)放。

“阿里云將把促進(jìn)中國(guó)大模型生態(tài)的繁榮作為首要目標(biāo)”, 阿里云首席技術(shù)官周靖人說(shuō)道。

5月,百度宣布設(shè)立規(guī)模為10億元的“百度文心投資基金”,重點(diǎn)投資孵化大模型領(lǐng)域的優(yōu)質(zhì)創(chuàng)業(yè)企業(yè)。資料顯示,百度千帆大模型如今月活企業(yè)近萬(wàn)家,覆蓋金融、制造、能源、政務(wù)、交通等行業(yè)的400多個(gè)業(yè)務(wù)場(chǎng)景。

多名AI行業(yè)的從業(yè)者均向朋湖網(wǎng)表達(dá)過(guò):“對(duì)于應(yīng)用場(chǎng)景而言,將大模型與行業(yè)小模型結(jié)合起來(lái)將會(huì)產(chǎn)生巨大的價(jià)值?!贝竽P涂梢詭?lái)非專業(yè)信息的生成以及更舒適的人機(jī)交互,而小模型可以帶來(lái)更為專業(yè)的行業(yè)信息。

應(yīng)用層的商業(yè)價(jià)值同樣巨大。舉例而言,Monica是一款基于Google瀏覽器的Chrome擴(kuò)展插件,它可以幫助用戶撰寫(xiě)文案、智能搜索。Google的數(shù)據(jù)顯示,其收入在每年6000萬(wàn)美金左右,但其團(tuán)隊(duì)也才僅僅11人。

百度創(chuàng)始人李彥宏也表達(dá)了類似的觀點(diǎn),“對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),卷大模型沒(méi)有意義,卷應(yīng)用機(jī)會(huì)更大。移動(dòng)互聯(lián)網(wǎng)時(shí)代操作系統(tǒng)只有安卓和iOS,但特別成功的應(yīng)用卻很多,只有在大模型基礎(chǔ)上產(chǎn)生足夠多的AI原生應(yīng)用,才是一個(gè)健康的生態(tài)環(huán)境?!?

04

開(kāi)源之爭(zhēng)

與操作系統(tǒng)類似,在大模型生態(tài)中,閉源與開(kāi)源之爭(zhēng)也在愈演愈烈。前者的代表是GPT、百度千川等,而后者的代表則是Meta旗下的LLaMA、阿里通義千問(wèn)等。

與閉源相比,開(kāi)源大模型可以降低模型的二次開(kāi)發(fā)門(mén)檻,有助于各個(gè)領(lǐng)域的廣泛應(yīng)用和普及。更重要的是,大模型開(kāi)源后可以獲得社會(huì)的加持,在開(kāi)發(fā)者社區(qū)驅(qū)動(dòng)的創(chuàng)新和改進(jìn)下,可能獲得更好的發(fā)展。

2月,在Meta宣布開(kāi)源LLaMA后,一個(gè)月內(nèi)就涌現(xiàn)了許多擴(kuò)展版本,影響較大的有斯坦福大學(xué)開(kāi)發(fā)的Alpaca,以及來(lái)自加州大學(xué)伯克利分校、卡內(nèi)基梅隆大學(xué)等開(kāi)發(fā)的Vicuna。

谷歌工程師Luke Sernau甚至發(fā)文稱:“除非谷歌和OpenAI改變態(tài)度,選擇和開(kāi)源社區(qū)合作,否則將被后者替代?!?

7 月 19 日,Llama升級(jí)到Llama2。后者在 2 萬(wàn)億的 token 上進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)增加了 40%,各項(xiàng)外部基準(zhǔn)測(cè)試中皆優(yōu)于其他開(kāi)源語(yǔ)言模型。

“Llama2 出現(xiàn)之后,受打擊最大的應(yīng)該就是 OpenAI,更多的公司會(huì)開(kāi)始直接基于 Llama2 進(jìn)行商業(yè)化開(kāi)發(fā),而不再購(gòu)買(mǎi)它們的 API。”獵豹移動(dòng)董事長(zhǎng)傅盛表示。

然而,當(dāng)下在模型層面上,GPT-4依然遙遙領(lǐng)先,據(jù)業(yè)內(nèi)人士判斷,短期內(nèi)這一領(lǐng)先優(yōu)勢(shì)很難被顛覆。

而閉源的支持者們也有其道理所在。百度集團(tuán)執(zhí)行副總裁沈抖認(rèn)為基礎(chǔ)模型的升級(jí)需要有效的反饋回路,開(kāi)源模型發(fā)展的最大痛點(diǎn)在于反饋路徑不理想,可能會(huì)"走彎路", 事倍功半。

05

寫(xiě)到最后

從2006年亞馬遜推出彈性計(jì)算云EC2算起,云計(jì)算已走過(guò)十余年時(shí)光。

從 AWS 起步時(shí)的牛刀小試,到如今已成長(zhǎng)為一個(gè)巨大的生態(tài)體系,生長(zhǎng)出了一大批如Salesforce、Shopify等的頭部企業(yè)。

如今,我們又站在了人工智能原生產(chǎn)品的新起點(diǎn),大模型也將在這次巨變中發(fā)揮重要的影響力。