在KDD國際數(shù)據(jù)挖掘與知識發(fā)現(xiàn)大會上,啟明創(chuàng)投投資企業(yè)智譜AI的GLM團隊介紹了新一代基座大模型GLM-4-Plus。GLM-4-Plus是智譜AI全自研GLM大模型的最新版本,它標志著智譜AI繼續(xù)瞄準通用人工智能,持續(xù)推進大模型技術(shù)的獨立自主創(chuàng)新。
主要更新包括:
01/
最新基座大模型GLM-4-Plus上線
GLM-4-Plus使用了大量模型輔助構(gòu)造高質(zhì)量合成數(shù)據(jù),以提升模型性能;利用PPO有效提升模型的推理(數(shù)學、代碼算法題等)表現(xiàn),更好地反映人類偏好。
以下為benchmark對比:
語言文本能力方面,GLM-4-Plus和GPT-4o及405B參數(shù)量的Llama3.1相當。
Language capabilities(LCB: LiveCodeBench,NCB: NaturalCodeBench,*represents reproduced results)
長文本能力比肩國際先進水平。通過更精準的長短文本數(shù)據(jù)混合策略,取得了更強的長文本的推理效果。
Long context evaluation
GLM-4V-Plus在圖像和視頻理解能力方面位居前列。GLM-4V-Plus還可以理解網(wǎng)頁內(nèi)容,并將其轉(zhuǎn)換為html代碼。
Vision capabilities
GLM-4V-Plus能夠理解并分析復(fù)雜的視頻內(nèi)容,同時具備時間感知能力。上線開放平臺后,將提供國內(nèi)首個通用視頻理解模型API。
Video analysis
GLM-4V-Plus結(jié)合了視頻總結(jié)能力、推理能力、多輪對話、時間問答能力。
用戶:這個穿綠色衣服的球員在整個視頻都做了什么?
GLM-4V-Plus:在整個視頻中,穿綠色衣服的球員在場上運球,然后跳起將球投入籃筐。
用戶:這個視頻的精彩時刻是什么?發(fā)生在第幾秒?
GLM-4V-Plus:這個視頻的精彩時刻發(fā)生在第4秒,當時穿綠色衣服的球員跳起并將球投入籃筐。
文生圖模型迎來最新版本CogView-3-Plus,其效果接近目前最佳的MJ-V6及FLUX等模型,并支持圖片編輯功能。
GLM-4-Plus現(xiàn)已在智譜AI的大模型開放平臺bigmodel.cn部署,開發(fā)者能通過API方式調(diào)用智譜AI的最新基座大模型。
02/
清言App迎來重要更新
全新的“視頻通話”功能來了
智譜AI還宣布清言App迎來了“視頻通話”功能,這是中國首個面向C端開放的視頻通話功能。
清言App作為第一批C端上線的大模型產(chǎn)品,過去的一年,常常以文字和語音的形式和用戶交流。但從今天起,清言App也有了眼睛,解鎖了AI新體驗。
清言App的視頻通話跨越了文本模態(tài)、音頻模態(tài)和視頻模態(tài),并具備實時推理的能力?,F(xiàn)在,用戶撥打清言App的視頻通話窗口,即可與它進行流暢通話,即便頻繁打斷它也能迅速反應(yīng)。只要打開攝像頭,用戶看到的畫面,清言App也可以看到,同時可以聽懂指令并準確執(zhí)行。這樣的體驗就如同和真人視頻通話一樣。
清言App視頻通話功能日前上線,首批面向部分用戶開放,同時開放外部申請。
隨著視頻通話功能的加入,清言App成為首個可以通過文本、音頻、視頻和圖像來進行多模態(tài)互動的AI助手。
03/
CogVideoX-5B開源
智譜AI一如既往推動AI普惠。
繼CogVideoX 2B版本開源后,5B版本也正式開源,性能更強,推理顯存需求最低僅為11.4GB。同時CogVideoX-2B的開源協(xié)議調(diào)整為更加開放的Apache 2.0協(xié)議,任何企業(yè)與個人均可自由使用。隨著CogVideoX-5B的開源,智譜AI不僅在開源模型數(shù)量上領(lǐng)先,累計下載量也突破2000萬次,智譜AI以實際行動為國際開源社區(qū)做出自己應(yīng)有的貢獻。
隨著技術(shù)進步、效率提升和成本優(yōu)化,智譜AI宣布用戶可以通過調(diào)用大模型開放平臺bigmodel.cn最具性價比的大模型GLM-4-Flash,快速、免費地構(gòu)建專屬模型和應(yīng)用。這也是智譜AI開放平臺首個完全免費的大模型API。
04/
專注于大模型的中國創(chuàng)新
最新推出的基座大模型,和此前發(fā)布的CogVideoX等模型一道,完善了智譜AI自主原創(chuàng)的全棧大模型譜系,推動智譜AI實現(xiàn)面向世界先進水平的全面對標。
視頻通話功能是清言App繼7月上線生成視頻功能清影Ying后又一重大更新。通過小步快走持續(xù)迭代,智譜AI努力讓大模型技術(shù)更好賦能更多用戶。
隨著開源模型和開放平臺模型的廣受歡迎,智譜AI也將繼續(xù)推動AI力量惠及更多人群。通過大模型鏈接物理世界億級用戶,智譜AI致力于為千行百業(yè)帶來持續(xù)創(chuàng)新與變革,加速邁向通用人工智能時代。