免费xxxx大片国产片_精品在线一区_亚洲午夜福利av_亚洲色大成人一区二区_无码熟妇人妻AV在线影片免费

您的位置:首頁(yè) >聚焦 > 快訊 >

天天熱資訊!接近國(guó)際水平?我們和專(zhuān)業(yè)人士聊了聊中國(guó)大模型的真實(shí)實(shí)力

2023-07-06 06:06:58 來(lái)源:鳳凰網(wǎng)


(資料圖)

“都快成紅海了?!碑?dāng)我和一個(gè)創(chuàng)業(yè)者聊起大模型的時(shí)候,他直接甩了這句話給我。

去年11月,OpenAI發(fā)布基于GPT-3.5的ChatGPT,瞬間引爆大模型的熱潮。半年多的時(shí)間,中國(guó)出現(xiàn)了“百模大戰(zhàn)”的局面,BAT等頭部互聯(lián)網(wǎng)公司和人工智能公司基本都對(duì)外宣布了自己的大模型。

5月初,360掌門(mén)人周鴻祎對(duì)外稱,“如果不經(jīng)過(guò)兩年的模仿和抄襲,上來(lái)就說(shuō)自己能超越,那才叫吹牛呢?!眱H僅一個(gè)月后,周鴻祎就表示,“我原來(lái)說(shuō)國(guó)內(nèi)大模型跟國(guó)外差距兩年,我收回這句話,今天已經(jīng)接近國(guó)際水平。”

有人感慨,半年就追上ChatGPT了,大模型似乎也不難。

那么,大模型的核心壁壘是什么?中國(guó)大模型到底什么水平?大模型在應(yīng)用層面最先突圍的方向是什么?

為此,我們和多年從事機(jī)器學(xué)習(xí)研究、某知名985高校教授沈?yàn)椋ɑ┝牧肆?,揭開(kāi)大模型的迷霧。

01.GPT路徑跑通了,所以有了“百模大戰(zhàn)”

白馬商評(píng):能不能用最通俗簡(jiǎn)單的語(yǔ)言解釋一下大模型,大模型是什么?和以往的AI模型有什么區(qū)別?

沈?yàn)椋?/strong>所謂大模型就是指模型的參數(shù)量大,但學(xué)術(shù)界并沒(méi)有一個(gè)清晰明確的定義界定到底多大參數(shù)叫“大”,還在快速研究發(fā)展階段,一般來(lái)講大模型的參數(shù)量達(dá)到1億以上。

其實(shí)深度學(xué)習(xí)的發(fā)展大致經(jīng)歷了三個(gè)階段。第一個(gè)階段是2012-2017年,以圖像分割yolo、圖像分類(lèi)ResNet這種特定領(lǐng)域的小模型為代表,這個(gè)階段一般用LSTM(Long Short-Term Memory)等處理時(shí)序關(guān)系,不能并行化計(jì)算,所以參數(shù)量占內(nèi)存最多也就幾百M(fèi)B。

2017年,Transformer的問(wèn)世讓深度學(xué)習(xí)可以并行化計(jì)算,效率更高,意味著可以做大模型的運(yùn)算,隨后產(chǎn)生了OpenAI GPT和谷歌Bert這類(lèi)自然語(yǔ)言大模型。這一階段誕生的是特定任務(wù)的大模型,模型參數(shù)突破了1億。

到了2020年前后,深度學(xué)習(xí)進(jìn)入通用模型階段,它的輸入就是一句帶空格的話,模型的作用就是“填空”,以前是模型適配下游應(yīng)用,現(xiàn)在是下游應(yīng)用適配模型。這一階段的模型代表包括自然語(yǔ)言領(lǐng)域的GPT 3.5、GPT 4以及圖像領(lǐng)域的Clip、DALLE、Stable Diffusion、Midjourney等等。這一階段模型參數(shù)可以達(dá)到百億、千億級(jí)別。

白馬商評(píng):你了解到最早研究大模型是哪家企業(yè)或機(jī)構(gòu)?有哪些成果?

沈?yàn)椋?/strong>最早是高校和科研機(jī)構(gòu)做相關(guān)的研究,我了解比較早的是北京智源人工智能研究院的悟道、鵬程實(shí)驗(yàn)室的腦海,現(xiàn)在產(chǎn)業(yè)界的研究也很同步了。學(xué)術(shù)界的研究有一些成果,但性能沒(méi)有ChatGPT那么驚艷。

白馬商評(píng):短短幾個(gè)月的時(shí)間,國(guó)內(nèi)出現(xiàn)了“百模大戰(zhàn)”的局面,推出大模型的公司已經(jīng)數(shù)不過(guò)來(lái)了,你怎么看待這種現(xiàn)象?

沈?yàn)椋?/strong>大模型肯定是趨勢(shì),也一直有人在研究。之前很多公司可能會(huì)小范圍投入,做一些淺嘗輒止的研究;現(xiàn)在突然出現(xiàn)了ChatGPT這樣一個(gè)好產(chǎn)品,大家看到了明確的商業(yè)方向,于是都開(kāi)始加大投入。

另一方面,很多公司面臨商業(yè)競(jìng)爭(zhēng)的壓力,不做大模型可能就掉隊(duì)了,所以必須上馬大模型項(xiàng)目。

白馬商評(píng):周鴻祎最近說(shuō)他收回“國(guó)內(nèi)大模型跟國(guó)外差距兩年”這句話,他認(rèn)為今天已經(jīng)接近國(guó)際水平。這才過(guò)去幾個(gè)月的時(shí)間,大模型好像也不難嘛。你覺(jué)得差距有多少?

沈?yàn)椋?/strong>差距看跟誰(shuí)對(duì)標(biāo)吧,我目前沒(méi)有體驗(yàn)過(guò)360智腦的產(chǎn)品,不太好評(píng)價(jià)。但是國(guó)內(nèi)有些生成式AI產(chǎn)品,我體驗(yàn)以后感覺(jué)跟ChatGPT還是有差距的,國(guó)內(nèi)的大模型還需要努力。

02.重資本投入下,只有頭部公司有機(jī)會(huì)?

白馬商評(píng):研發(fā)大模型的核心壁壘是什么?

沈?yàn)椋?/strong>大模型的核心壁壘包括數(shù)據(jù)、算力、算法。

從算力上看,訓(xùn)練ChatGPT這樣的生成式AI需要至少1萬(wàn)張英偉達(dá)A100顯卡,單張顯卡的價(jià)格目前是六七萬(wàn),性能更優(yōu)的V100單價(jià)8萬(wàn)元人民幣,也就是說(shuō)光算力投入至少就要達(dá)到六七個(gè)億以上,只有少數(shù)頭部公司和機(jī)構(gòu)能承擔(dān)得起。對(duì)于商業(yè)機(jī)構(gòu)而言,花幾個(gè)億買(mǎi)一堆顯卡,還不一定能產(chǎn)出成果,這是必須要思考的問(wèn)題。

接下來(lái)是數(shù)據(jù)和算法,算法比較好理解,比如開(kāi)發(fā)框架、算法的優(yōu)化。數(shù)據(jù)方面,中國(guó)不缺數(shù)據(jù),甚至互聯(lián)網(wǎng)數(shù)據(jù)比美國(guó)還要多,但是選擇哪些數(shù)據(jù)去訓(xùn)練、采用什么樣的方式處理,這些都是核心的壁壘。

白馬商評(píng):你平時(shí)會(huì)跟企業(yè)交流嗎?非營(yíng)利性的研究機(jī)構(gòu)和企業(yè)在研究上有什么區(qū)別?

沈?yàn)椋?/strong>我們會(huì)跟企業(yè)的研究部門(mén)有一些交流。跟企業(yè)交流我們會(huì)更加了解實(shí)際的業(yè)務(wù)需求,有時(shí)候我們做的學(xué)術(shù)研究會(huì)更關(guān)注技術(shù)前瞻性,對(duì)落地性要求不那么高;但企業(yè)一般更強(qiáng)調(diào)落地性。

白馬商評(píng):你有沒(méi)有研究過(guò)國(guó)內(nèi)的大模型?最看好哪家?

沈?yàn)椋?/strong>可能還是頭部公司能跑出來(lái)吧。一是重資本的投入,只有頭部公司有實(shí)力;二是幾家頭部公司手里的數(shù)據(jù)更豐富;三是在人工智能領(lǐng)域已經(jīng)有了一段時(shí)間的技術(shù)積累。

白馬商評(píng):你最看好的大模型應(yīng)用是什么?

沈?yàn)椋?/strong>從技術(shù)角度看,最先應(yīng)用的應(yīng)該是自然語(yǔ)言處理和圖像領(lǐng)域,語(yǔ)音識(shí)別可能要晚一些。

大家看到比較多的用ChatGPT來(lái)寫(xiě)文案,這類(lèi)內(nèi)容創(chuàng)作的應(yīng)用越來(lái)越多,其他我覺(jué)得像智能客服這種應(yīng)用應(yīng)該也會(huì)比較快?,F(xiàn)在的一些智能客服很多時(shí)候理解不了用戶的需求,解決不了實(shí)際問(wèn)題,如果讓用戶區(qū)分不出到底是人還是機(jī)器人,體驗(yàn)就會(huì)改善很多;包括游戲中的NPC,以前的對(duì)話是“寫(xiě)死”的,現(xiàn)在漸漸可以互動(dòng)了,玩家體驗(yàn)也會(huì)更好。

白馬商評(píng):你原來(lái)做過(guò)頭部券商的首席分析師,從投資角度看,你覺(jué)得大模型有哪些機(jī)會(huì)?

沈?yàn)椋?/strong>資金炒作的邏輯是從應(yīng)用到算法、模型,再到算力;產(chǎn)業(yè)的邏輯反而是相反的,算力是有明確的增長(zhǎng)預(yù)期的,所以英偉達(dá)最近上漲很快、很多。投資者現(xiàn)在也明白了,誰(shuí)家的大模型能跑出來(lái)、能變現(xiàn)還需要驗(yàn)證,但是增加的資本投入大部分都投到了算力。經(jīng)過(guò)反復(fù)炒作,普漲行情應(yīng)該已經(jīng)告一段落,后面需要邏輯驗(yàn)證和業(yè)績(jī)兌現(xiàn)。

我原來(lái)主要看傳媒互聯(lián)網(wǎng)行業(yè),比如前段時(shí)間比較強(qiáng)勢(shì)的游戲板塊,資本的邏輯一是應(yīng)用大模型提升研發(fā)效率、降低成本;二是大模型帶來(lái)更好的體驗(yàn),NPC角色更智能,最后用戶的粘性提升、UP值提升。當(dāng)然,最終可能還需要業(yè)績(jī)驗(yàn)證。

03.人類(lèi)無(wú)法左右AI,甚至無(wú)法左右自己的命運(yùn)?

白馬商評(píng):我們看到包括奧特曼、馬斯克都對(duì)人工智能的安全性問(wèn)題提出過(guò)擔(dān)憂,現(xiàn)在我們只知道通過(guò)大模型訓(xùn)練出現(xiàn)了智能化的結(jié)果,但訓(xùn)練過(guò)程像一個(gè)黑箱,其實(shí)挺可怕的。你怎么看待安全問(wèn)題?

沈?yàn)椋?/strong>在安全方面,首先我觀察到幾個(gè)反常的現(xiàn)象。第一個(gè)是今年3月包括馬斯克、蘋(píng)果公司聯(lián)合創(chuàng)始人史蒂夫·沃茲尼亞克在內(nèi)的1000多人簽署了一份公開(kāi)信,呼吁暫停訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng)。

第二個(gè)是,今年5月谷歌首席科學(xué)家、已經(jīng)75歲的“AI教父”杰弗里·辛頓辭職,他離開(kāi)谷歌的直接原因是擔(dān)憂人工智能的危險(xiǎn),甚至對(duì)自己一生從事的工作感到后悔。

第三個(gè)是近兩年學(xué)術(shù)領(lǐng)域訓(xùn)練大模型新增了倫理討論。

目前來(lái)看,我覺(jué)得大模型還是可控的,沒(méi)有大的問(wèn)題;但是技術(shù)發(fā)展太快了,出圈以來(lái)短短幾個(gè)月的時(shí)間,GPT就又經(jīng)歷了幾次迭代,發(fā)展速度太快,越來(lái)越智能,會(huì)不會(huì)產(chǎn)生自主意識(shí),不再聽(tīng)人類(lèi)的“使喚”,走向失控?這個(gè)問(wèn)題是大家擔(dān)心的。

白馬商評(píng):你覺(jué)得AI會(huì)不會(huì)造成大量失業(yè)?在AI面前,普通人怎么保住工作?

沈?yàn)椋?/strong>從宏觀上看我不覺(jué)得AI會(huì)造成大量的失業(yè),人類(lèi)總會(huì)有工作的,只是說(shuō)人的工作內(nèi)容會(huì)發(fā)生轉(zhuǎn)變。當(dāng)然,從個(gè)體角度看肯定會(huì)出現(xiàn)結(jié)構(gòu)性的失業(yè),我們只能不斷學(xué)習(xí)。

白馬商評(píng):之前很多人說(shuō)機(jī)器沒(méi)有感情、缺乏想象力,取代不了人類(lèi);現(xiàn)在既然人類(lèi)大腦可以通過(guò)AI模擬出來(lái),那人類(lèi)的情欲、性欲是不是未來(lái)也可以模擬,荷爾蒙、多巴胺這些不過(guò)是一種生物學(xué)的獎(jiǎng)勵(lì)機(jī)制嘛。

沈?yàn)椋?/strong>機(jī)器沒(méi)有感情是當(dāng)前的假設(shè),人工智能越來(lái)越接近人的思考模式,那是不是就會(huì)產(chǎn)生類(lèi)似于人類(lèi)的“感情”?只是他們和人類(lèi)生活在不同的空間維度,就像《流浪地球》里圖恒宇的女兒。人工智能可能會(huì)產(chǎn)生自己世界類(lèi)似于人類(lèi)的生物學(xué)意義上獎(jiǎng)勵(lì)機(jī)制。

白馬商評(píng):如果一切都可以計(jì)算、規(guī)劃、設(shè)置,是不是有點(diǎn)無(wú)趣?

沈?yàn)椋?/strong>AI的行為并不是人類(lèi)預(yù)測(cè)和規(guī)劃的,而是他自我強(qiáng)化、自我訓(xùn)練的結(jié)果,《流浪地球》里MOSS的決策是自己做的,而不是服從人類(lèi)給的指令。

白馬商評(píng):硅基文明取代碳基文明是不是確定性的方向?

沈?yàn)椋?/strong>這個(gè)問(wèn)題超綱了。按照目前的發(fā)展趨勢(shì)可能是這樣的,就像《流浪地球》里真正主宰人類(lèi)命運(yùn)的是MOSS,而不是人類(lèi);但現(xiàn)實(shí)中也有可能技術(shù)會(huì)停滯在某個(gè)階段,跨不過(guò)去,畢竟技術(shù)發(fā)展不是線性的。