以下文章來(lái)源于澎湃新聞科技頻道 ,作者張靜
編者按:在2024向星力·未來(lái)數(shù)據(jù)技術(shù)峰會(huì)上,啟明創(chuàng)投投資企業(yè)星環(huán)科技(688031.SH)創(chuàng)始人、首席執(zhí)行官孫元浩宣布,星環(huán)科技的定位從Data Infra進(jìn)一步延伸到AI Infra,為企業(yè)客戶(hù)打造AI基礎(chǔ)設(shè)施,建立從語(yǔ)料處理、模型訓(xùn)練、知識(shí)庫(kù)建設(shè)等一整套工具鏈,幫助企業(yè)快速建立行業(yè)大模型。
峰會(huì)期間,孫元浩接受了澎湃科技的采訪。他分析指出,企業(yè)用戶(hù)對(duì)于模型的需求是高精準(zhǔn)度及解決實(shí)際問(wèn)題的能力,因此,大模型的新趨勢(shì)是用RAG(檢索增強(qiáng)生成)和Agent(智能體)技術(shù)提升模型精準(zhǔn)度。針對(duì)大模型落地的核心難點(diǎn),孫元浩表示高質(zhì)量語(yǔ)料是關(guān)鍵,他提出了例如構(gòu)建用于推理的知識(shí)圖譜的解決方案。
啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。
星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩
“大模型卷價(jià)格對(duì)企業(yè)用戶(hù)來(lái)說(shuō)幫助并不大,企業(yè)用戶(hù)對(duì)模型的精準(zhǔn)度要求高,通用大模型更應(yīng)通過(guò)提升模型精準(zhǔn)度和模型效果,贏得競(jìng)爭(zhēng)力?!逼髽I(yè)級(jí)基礎(chǔ)軟件供應(yīng)商星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩日前在2024向星力·未來(lái)數(shù)據(jù)技術(shù)峰會(huì)期間接受澎湃科技采訪時(shí)作出上述表示。
01/
企業(yè)用戶(hù)對(duì)于模型的精準(zhǔn)度要求很高
希望能夠解決實(shí)際問(wèn)題
近期,中國(guó)通用大模型價(jià)格戰(zhàn)打得火熱,科技巨頭紛紛參戰(zhàn)。孫元浩表示,這是由中國(guó)特殊生態(tài)造成的。在他看來(lái),企業(yè)用戶(hù)對(duì)于模型的精準(zhǔn)度要求很高,希望能夠解決實(shí)際問(wèn)題,當(dāng)前即使是市場(chǎng)上最大參數(shù)的模型也未必能達(dá)到企業(yè)要求,所以降價(jià)對(duì)企業(yè)用戶(hù)而言幫助有限?!捌髽I(yè)的要求遠(yuǎn)比現(xiàn)在的模型能力高很多”。
在孫元浩看來(lái),僅依靠低價(jià)很難讓用戶(hù)形成粘性,“降價(jià)是為了給開(kāi)發(fā)者提供低廉的Token價(jià)格,基于通用大模型開(kāi)發(fā)應(yīng)用,從而試圖構(gòu)建生態(tài),收集高質(zhì)量數(shù)據(jù)。但事實(shí)上,模型是很容易被替代的,用戶(hù)想換就換,因?yàn)榻涌谌渴亲匀徽Z(yǔ)言,沒(méi)有額度限制?!?/span>
去年,孫元浩判斷,要讓大模型變成“理科生”,成為專(zhuān)業(yè)領(lǐng)域的專(zhuān)家模型。今年,他認(rèn)為大模型的新趨勢(shì)是用RAG(檢索增強(qiáng)生成)和Agent(智能體)技術(shù)提升模型精準(zhǔn)度?!艾F(xiàn)在大家又開(kāi)始開(kāi)發(fā)Agent,可能馬上會(huì)出現(xiàn)成千上萬(wàn)個(gè)Agent,這可能是現(xiàn)在大模型能力不夠造成的,模型沒(méi)辦法聰明地學(xué)習(xí)現(xiàn)在該用什么工具、怎么用,構(gòu)建Agent的過(guò)程就是教大模型怎么使用內(nèi)部工具?!?/strong>
02/
高質(zhì)量語(yǔ)料是解決行業(yè)大模型幻覺(jué)
及可信可控等核心落地難點(diǎn)的重要手段
目前,通用大模型數(shù)量快速增加,并不斷升級(jí)迭代,但卻不能完全適應(yīng)企業(yè)AI應(yīng)用需求。企業(yè)對(duì)行業(yè)大模型需求增加,迫切需要降低使用門(mén)檻。“現(xiàn)在每個(gè)大模型應(yīng)用開(kāi)發(fā)都要很久,重復(fù)訓(xùn)練量很大。我們想把整套AI基礎(chǔ)設(shè)施建好,用戶(hù)再在大模型上開(kāi)發(fā)應(yīng)用就快了?!睂O元浩表示,過(guò)去一年幫助企業(yè)客戶(hù)落地大模型時(shí),發(fā)現(xiàn)每個(gè)環(huán)節(jié)都遇到了挑戰(zhàn)。為此,星環(huán)科技開(kāi)發(fā)了語(yǔ)料處理、模型訓(xùn)練、知識(shí)庫(kù)建設(shè)等工具鏈,就是為了幫助企業(yè)建立行業(yè)大模型,快速使用生成式AI(AIGC)。
在AI基礎(chǔ)設(shè)施中,星環(huán)科技無(wú)涯大模型Infinity可為各行業(yè)定制自有大模型,提供意圖理解、語(yǔ)義召回、數(shù)據(jù)處理和分析能力。基于無(wú)涯大模型,星環(huán)科技推出無(wú)涯·問(wèn)知、無(wú)涯·問(wèn)數(shù)、無(wú)涯·金融、無(wú)涯·工程等AI原生應(yīng)用,可應(yīng)用于金融、能源、制造、工程等領(lǐng)域。
孫元浩表示,大模型擅長(zhǎng)生成文本,但回答嚴(yán)肅問(wèn)題不可控,為此團(tuán)隊(duì)經(jīng)過(guò)微調(diào)、增加語(yǔ)料,將模型訓(xùn)練成“理科生”,同時(shí)將企業(yè)內(nèi)部數(shù)據(jù)知識(shí)化,利用RAG提升模型準(zhǔn)確度。
語(yǔ)料質(zhì)量決定了模型質(zhì)量,高質(zhì)量語(yǔ)料也是解決行業(yè)大模型幻覺(jué)、可信可控等核心落地難點(diǎn)的重要手段。孫元浩表示,大模型結(jié)構(gòu)已不是秘密,訓(xùn)練方法也不是秘密,但語(yǔ)料散落在各種地方,導(dǎo)致工作量大,“目前最大的挑戰(zhàn)是把現(xiàn)有資料整理起來(lái)訓(xùn)練或微調(diào)模型,企業(yè)應(yīng)用要求100%準(zhǔn)確,所以用現(xiàn)在的語(yǔ)料還不夠,我們正在構(gòu)建知識(shí)圖譜用于推理,再結(jié)合大模型提升準(zhǔn)確度?!?/strong>
來(lái)源 | 澎湃科技
作者 | 張 靜