編者按:在由啟明創(chuàng)投主辦的2023世界人工智能大會(huì)“生成式AI與大模型:變革與創(chuàng)新”論壇上,人工智能等技術(shù)前沿領(lǐng)域的著名專家與學(xué)者,頂級(jí)投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,共同探索中國(guó)科技創(chuàng)新的驅(qū)動(dòng)力量。
本次論壇是大會(huì)唯一一場(chǎng)由創(chuàng)投機(jī)構(gòu)主辦的相關(guān)論壇,立足創(chuàng)業(yè)與投資視角,分享了最新生成式AI前沿信息和實(shí)踐探索,并發(fā)布了行業(yè)首份基于對(duì)海內(nèi)外逾百家企業(yè)深入調(diào)研撰寫的生成式AI洞察報(bào)告,全方位解讀了生成式AI的產(chǎn)業(yè)變革和未來(lái)十大展望。
啟明創(chuàng)投投資企業(yè)云知聲董事長(zhǎng)兼CTO梁家恩在演講中分享了生成式AI賦能未來(lái)的力量。梁家恩指出大模型帶來(lái)了AI的新時(shí)代,開啟了“數(shù)據(jù)動(dòng)力學(xué)”新范式:預(yù)訓(xùn)練、指令微調(diào)和反饋強(qiáng)化。大模型整合大數(shù)據(jù),將成為AI 2.0時(shí)代的“發(fā)電廠”,并將會(huì)驅(qū)動(dòng)人才、技術(shù)、市場(chǎng)等產(chǎn)業(yè)核心要素的升級(jí)。云知聲自研的山海大模型有強(qiáng)大的通用能力,并聚焦于插件擴(kuò)展和領(lǐng)域增強(qiáng)等相關(guān)能力構(gòu)建,圍繞智慧物聯(lián)和智慧醫(yī)療等行業(yè)賦能客戶。未來(lái)云知聲將繼續(xù)探索智能極限、引領(lǐng)產(chǎn)業(yè)升級(jí)。
以下為精編整理的演講實(shí)錄。
今天非常高興在這個(gè)論壇上和大家分享、交流。啟明創(chuàng)投一直支持我們的發(fā)展,至今已有十年的時(shí)間了,我們走過(guò)了AI 1.0時(shí)代,現(xiàn)在我們發(fā)布了大模型,AI 2.0時(shí)代已經(jīng)開啟,我們希望圍繞這一話題和大家進(jìn)行分享。
云知聲董事長(zhǎng)兼CTO梁家恩
這次的分享分成兩部分:一個(gè)是宏觀的部分,從十年的產(chǎn)業(yè)實(shí)踐出發(fā),我們是怎么看待這一次的大機(jī)會(huì);第二是微觀的部分,云知聲在這些年發(fā)展的實(shí)踐路徑以及大模型給我們帶來(lái)的機(jī)會(huì)。
01/
大模型整合大數(shù)據(jù)
將成為AI 2.0時(shí)代的“發(fā)電廠”
人工智能確實(shí)是很多代人的夢(mèng)想,從1956年開始提出這個(gè)概念,一直到今天,已經(jīng)60多年過(guò)去了,如果算上圖靈時(shí)代,已經(jīng)有80多年了。
這個(gè)時(shí)代經(jīng)歷了三個(gè)階段。最早我們希望機(jī)器能夠像人一樣做事。第二階段是希望機(jī)器像人類的專家一樣分析問(wèn)題和解決問(wèn)題。第三個(gè)階段是完全從神經(jīng)網(wǎng)絡(luò)的角度出發(fā),我們能不能訓(xùn)練出好的會(huì)學(xué)習(xí)的機(jī)器,完全從錯(cuò)誤當(dāng)中學(xué)習(xí)知識(shí),就像曾子所說(shuō)的“吾日三省吾身”,這種情況下我們能把模型訓(xùn)練到最大。大模型我們可以歸納為老子在《道德經(jīng)》里所說(shuō)的“為學(xué)日益,為道日損”。
“為學(xué)日益”使得數(shù)據(jù)的規(guī)模和計(jì)算的尺度比以前大得多,方法上反而比以前看起來(lái)要簡(jiǎn)潔得多,特別是Transformer模型出來(lái)之后,是非常緊湊的學(xué)習(xí)框架,它的威力非常大。
大模型推出之后我們認(rèn)為它已經(jīng)開啟了數(shù)據(jù)動(dòng)力學(xué)的時(shí)代。像人類想飛到天上是空氣動(dòng)力學(xué)的問(wèn)題。到今天為止我們認(rèn)為人工智能最重要的是能不能用機(jī)器把數(shù)據(jù)學(xué)好。
這分為三個(gè)階段:在無(wú)監(jiān)督學(xué)習(xí)階段,因?yàn)閾碛?750億參數(shù),GPT基本實(shí)現(xiàn)了博覽全書;我們會(huì)發(fā)現(xiàn)它有很強(qiáng)的語(yǔ)義抽象能力,這時(shí)可以通過(guò)指令的微調(diào),讓它學(xué)到知識(shí),并真正解決問(wèn)題;ChatGPT加上人工反饋的機(jī)制,能實(shí)現(xiàn)德才兼?zhèn)洹?/strong>我們認(rèn)為大模型的起點(diǎn)從2018年預(yù)訓(xùn)練大模型開始,后面GPT在規(guī)模上提升起來(lái),到ChatGPT已經(jīng)呈現(xiàn)出非常強(qiáng)大的通用釋放能力,這是圍繞我們的語(yǔ)言展開的,是一種新的范式。
我們認(rèn)為大模型能更好地整合大數(shù)據(jù)。在互聯(lián)網(wǎng)時(shí)期,它已經(jīng)開始產(chǎn)生紅利了,我們通過(guò)數(shù)據(jù)等傳統(tǒng)的方法分析學(xué)到的知識(shí)。我們過(guò)去使用煤、石油,有了好的發(fā)電廠、煉油廠之后,才發(fā)現(xiàn)能源可以賦能所有的行業(yè)。大模型建立了非常好的數(shù)據(jù)整合的框架,為AI 2.0時(shí)代構(gòu)建了很好的“發(fā)電廠”,智能數(shù)據(jù)成為了生產(chǎn)力要素。以前我們說(shuō)這個(gè)要素是存在的,但是如果沒(méi)有好的裝置把它對(duì)外智能且有效地輸出,就很難實(shí)現(xiàn)價(jià)值。我們認(rèn)為現(xiàn)在它開啟了一個(gè)像MaaS服務(wù)的模式,未來(lái)會(huì)成為各個(gè)行業(yè)里創(chuàng)新的重要機(jī)制。
為什么我們認(rèn)為大模型已經(jīng)到了AI 2.0時(shí)代?它會(huì)對(duì)產(chǎn)業(yè)的核心要素的升級(jí)起到關(guān)鍵作用。
由于人才、技術(shù)和市場(chǎng)的共同作用才能形成一個(gè)大的產(chǎn)業(yè)。過(guò)去我們?cè)贏I 1.0的時(shí)代也做了這個(gè)工作,但是只能解決系統(tǒng)里的一些零部件,由智能功能完成某一些環(huán)節(jié)。現(xiàn)在有了大模型之后,我們發(fā)現(xiàn)不論在人才端、市場(chǎng)端,還是核心技術(shù)和驅(qū)動(dòng)產(chǎn)品創(chuàng)新端里都有很大的突破。對(duì)外來(lái)說(shuō),未來(lái)大家可以看到越來(lái)越多的虛擬人的形象出現(xiàn),也會(huì)通過(guò)分析營(yíng)銷數(shù)據(jù)更真實(shí)地理解市場(chǎng)的動(dòng)態(tài)。對(duì)內(nèi)來(lái)說(shuō),對(duì)我們的生產(chǎn)效率、生產(chǎn)質(zhì)量的提升,包括組織效率的提升都會(huì)有實(shí)質(zhì)性的變革。
02/
未來(lái)要?jiǎng)?wù)實(shí)地解決實(shí)際場(chǎng)景中的問(wèn)題
讓大模型真正產(chǎn)生商業(yè)價(jià)值
新的商業(yè)模式分為兩個(gè)方面。在通用平臺(tái)方面,過(guò)去在互聯(lián)網(wǎng)時(shí)代誕生的像BAT這些巨頭,以及移動(dòng)互聯(lián)網(wǎng)里一些視頻巨頭,其實(shí)都是由這種平臺(tái)型公司構(gòu)建的。大模型出現(xiàn)后,這些平臺(tái)仍然會(huì)有新的模式,這些模式并不是說(shuō)把里面的部件直接變成大模型的部件,邏輯與今天的商業(yè)邏輯相比沒(méi)有什么大的變化,而是通過(guò)大模型制造規(guī)模效應(yīng)和邊際成本的降低,形成飛輪效應(yīng),可以帶來(lái)新的顛覆和創(chuàng)新。如果應(yīng)用形態(tài)并沒(méi)有發(fā)生變化,只是希望改變巨頭業(yè)務(wù)中的內(nèi)核,單純靠這個(gè)技術(shù)來(lái)推動(dòng)的機(jī)會(huì)并不大。我們借助新的多模態(tài)的交互和行業(yè)多模態(tài)的應(yīng)用,把這個(gè)平臺(tái)構(gòu)建起來(lái)就會(huì)有新的機(jī)會(huì)。
另外就是在行業(yè)大模型層面,大家看到像AI 2.0時(shí)代,很多2B的新興業(yè)務(wù)開始出現(xiàn)。通用大模型像一個(gè)完整的“六邊形戰(zhàn)士”,在各個(gè)方面都不錯(cuò)。最重要的是我們能不能在一個(gè)行業(yè)里面真正可靠地解決問(wèn)題。以最先進(jìn)的GPT-4的模型來(lái)說(shuō),它的可靠性、可控性都存在很大的風(fēng)險(xiǎn),這些問(wèn)題如果不能得到有效解決的話,作為商業(yè)系統(tǒng)來(lái)說(shuō),在行業(yè)里面解決一些嚴(yán)肅場(chǎng)景的應(yīng)用問(wèn)題,就會(huì)有比較大的挑戰(zhàn)。我們認(rèn)為整個(gè)行業(yè)的大模型生態(tài),應(yīng)該要?jiǎng)?wù)實(shí)解決這方面的問(wèn)題。另一方面要把成本降到足夠低,對(duì)于企業(yè)應(yīng)用而言,成本是很大的負(fù)擔(dān),對(duì)于其規(guī)?;瘯?huì)帶來(lái)很大的影響。
大模型帶來(lái)了很多優(yōu)勢(shì),也有很多挑戰(zhàn)。大家比較直觀地感覺到它的認(rèn)知能力有了很大的提升。在AI 1.0的時(shí)代,不管誰(shuí)做的聊天機(jī)器人,聊不到十輪已經(jīng)暴露其智商與人類有顯著的差距,但是ChatGPT推出之后,全球上億用戶和它對(duì)話了大半年,感覺聊天可以一直進(jìn)行下去。可以說(shuō)它的認(rèn)知能力有顯著提升,交互的體驗(yàn)感也有明顯的提升。
另外就是生成式的能力,人與機(jī)器協(xié)同,創(chuàng)造能力也得到了比較大的提高。過(guò)去AI 1.0時(shí)代是鑒別式人工智能,幫我們實(shí)現(xiàn)一個(gè)確定性的目標(biāo)。譬如把聲音轉(zhuǎn)成文字,這是確定性的任務(wù)。人類需要機(jī)器輔助做各種創(chuàng)作。雖然GPT會(huì)出現(xiàn)事實(shí)性問(wèn)題,但如果將其轉(zhuǎn)變成可控的能力,可以為我們打開很好的局面。同時(shí)它也顯著地提升了我們的知識(shí)和信息的整合能力。當(dāng)然也有負(fù)面的因素,雖然現(xiàn)在的大模型并不具備人類的意識(shí)能力,但我們?cè)趺凑{(diào)校它才能將其變?yōu)榭煽氐南到y(tǒng)?這是我們需要解決的問(wèn)題。
未來(lái)應(yīng)該要?jiǎng)?wù)實(shí)地解決實(shí)際場(chǎng)景中的問(wèn)題,讓大模型真正產(chǎn)生商業(yè)價(jià)值。另外它的可靠性、可控性和合規(guī)性都要得到有效的控制,才可能達(dá)到好的商業(yè)化。
03/
通過(guò)人工智能的手段
創(chuàng)造一個(gè)互聯(lián)直覺的世界
在過(guò)去十年中,云知聲希望能夠通過(guò)人工智能的手段,創(chuàng)造一個(gè)互聯(lián)直覺的世界。2012年,剛好趕上深度學(xué)習(xí)在ImageNet刷榜,這是行業(yè)內(nèi)非常有標(biāo)志性的事件。這個(gè)團(tuán)隊(duì)當(dāng)時(shí)是在卷積網(wǎng)絡(luò)實(shí)現(xiàn)了突破,那一年剛好是云知聲創(chuàng)立的第一年。
2016年,AlphaGo作為人工智能的浪潮席卷行業(yè),今天的大模型代表第三波浪潮。在此期間,我們主要構(gòu)建了底層非常強(qiáng)大的超算平臺(tái),這個(gè)超算平臺(tái)的構(gòu)建是我們做這個(gè)大模型的基礎(chǔ)。當(dāng)時(shí)的大模型是在2018年做出來(lái)之后,開始通過(guò)預(yù)訓(xùn)練的方式和底層調(diào)優(yōu)的方式,解決語(yǔ)義理解的問(wèn)題。人工智能皇冠上的明珠就是理解能力是否足夠強(qiáng)大。語(yǔ)言不僅是交流的工具,更多是解決認(rèn)知問(wèn)題的關(guān)鍵部件。
2018年,人工智能行業(yè)已經(jīng)具備強(qiáng)大的通用語(yǔ)言理解能力了。GPT之后通用的能力可以得到更大的釋放。我們認(rèn)為AGI時(shí)代由ChatGPT展開了。過(guò)去,我們很難設(shè)計(jì)一個(gè)系統(tǒng)應(yīng)對(duì)這么多的復(fù)雜任務(wù),OpenAI在ChatGPT推出之后已經(jīng)打開了新的局面,但它只是我們的起點(diǎn),并不是我們的終點(diǎn)。
我們的技術(shù)體系覆蓋底層的超算平臺(tái)至上層的智能組件和大模型。云知聲在今年上半年5月24日開發(fā)了山海大模型,除了底層的通用能力,我們聚焦構(gòu)建插件能力、領(lǐng)域增強(qiáng)和客戶定制的能力,這是圍繞行業(yè)應(yīng)用展開的。我們過(guò)去積累的是智慧物聯(lián)、智慧醫(yī)療方面的應(yīng)用。有應(yīng)用的驅(qū)動(dòng)才能讓我們的模型變得越來(lái)越強(qiáng)大。
通用的基礎(chǔ)上我們構(gòu)建的是插件的擴(kuò)展。大模型最大的問(wèn)題之一是信息的時(shí)效性非常有限,另外它能不能有效地控制、使用工具,這也是一個(gè)很大的問(wèn)題。此外,還需要通過(guò)行業(yè)知識(shí)提高它的專業(yè)性和可靠性。
在領(lǐng)域增強(qiáng)維度,我們重點(diǎn)強(qiáng)調(diào)的是在醫(yī)療行業(yè)的應(yīng)用。目前我們已經(jīng)有幾百家醫(yī)院在商業(yè)應(yīng)用了。這輪應(yīng)用通過(guò)預(yù)訓(xùn)練,包括指令微調(diào)和插件的增量,擴(kuò)展我們?cè)谛袠I(yè)里面的應(yīng)用。通過(guò)醫(yī)療行業(yè)的應(yīng)用,我們已經(jīng)在MedQA評(píng)測(cè)中超越了GPT-4的水平,6月底從81分提高到了87分。山海大模型在滿分為600分的模擬國(guó)內(nèi)臨床執(zhí)業(yè)醫(yī)師資格考試中,目前為止已經(jīng)突破500分,360分就可以拿到資格證了。
除此之外,我們還提供了約7個(gè)應(yīng)用場(chǎng)景,主要是在醫(yī)院里面展開。醫(yī)院中有很多定制工作,因?yàn)橐粋€(gè)通用模型并不能解決它的需求,包括需求定制、數(shù)據(jù)安全、風(fēng)險(xiǎn)控制、服務(wù)支持等。只有把這些問(wèn)題有效解決之后,行業(yè)應(yīng)用才真正能夠打通。
目前,國(guó)內(nèi)我們已在2萬(wàn)多間酒店房間內(nèi)應(yīng)用了大模型,過(guò)去,與人工智能的對(duì)話不可能實(shí)現(xiàn)這樣的流暢度,僅僅可以完成功能性的交互,但現(xiàn)在有了山海大模型之后,靈活度高了很多。
04/
AGI將會(huì)繼續(xù)探索智能的極限
同時(shí)引領(lǐng)產(chǎn)業(yè)的升級(jí)
未來(lái),我們認(rèn)為AGI將會(huì)繼續(xù)探索智能的極限,同時(shí)引領(lǐng)產(chǎn)業(yè)的升級(jí)。
首先,探索智能極限其實(shí)是科學(xué)層面的問(wèn)題,雖然說(shuō)它開啟了起點(diǎn),但是未來(lái)還有很大的挑戰(zhàn),包括更大的模型、數(shù)據(jù)和算法,以及可控性和可靠性方面的研究。現(xiàn)在我們認(rèn)為這基本上超過(guò)了圖靈測(cè)試的水平,它會(huì)從模仿達(dá)到超越。因?yàn)楫?dāng)系統(tǒng)能達(dá)到這個(gè)狀態(tài)以后,在研究可計(jì)算的問(wèn)題時(shí),很有可能會(huì)超越人類的智慧。
對(duì)于產(chǎn)業(yè)來(lái)說(shuō),最核心的還是解決問(wèn)題,能夠比較可靠、高效地驅(qū)動(dòng)產(chǎn)業(yè)的發(fā)展。智能探索需要大量資金;從賺錢的角度來(lái)說(shuō),我們需要把產(chǎn)業(yè)推動(dòng)起來(lái),形成良性的商業(yè)閉環(huán),將行業(yè)真正構(gòu)建起來(lái)。
請(qǐng)關(guān)注啟明創(chuàng)投公眾號(hào)
在后臺(tái)輸入“生成式AI報(bào)告”
獲取完整報(bào)告下載方式