100种黄色软件,欲漫色

Portfolio News

啟明星 | 智譜AI攜基座大模型GLM-4-Plus亮相KDD，清言App全新升級(jí)視頻通話功能

03/09/2024

在KDD國(guó)際數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)大會(huì)上，啟明創(chuàng)投投資企業(yè)智譜AI的GLM團(tuán)隊(duì)介紹了新一代基座大模型GLM-4-Plus。GLM-4-Plus是智譜AI全自研GLM大模型的最新版本，它標(biāo)志著智譜AI繼續(xù)瞄準(zhǔn)通用人工智能，持續(xù)推進(jìn)大模型技術(shù)的獨(dú)立自主創(chuàng)新。

主要更新包括：

語(yǔ)言基座模型GLM-4-Plus：在語(yǔ)言理解、指令遵循、長(zhǎng)文本處理等方面的性能得到全面提升，保持了國(guó)際領(lǐng)先水平。
文生圖模型CogView-3-Plus：具備與當(dāng)前最優(yōu)的MJ-V6和FLUX等模型接近的性能。
圖像/視頻理解模型GLM-4V-Plus：具備卓越的圖像理解能力，并具備基于時(shí)間感知的視頻理解能力；該模型將上線開(kāi)放平臺(tái)bigmodel.cn，并成為中國(guó)國(guó)內(nèi)首個(gè)通用視頻理解模型API。
視頻生成模型CogVideoX：在發(fā)布并開(kāi)源2B版本后，5B版本也正式開(kāi)源，其性能進(jìn)一步增強(qiáng)，是當(dāng)前開(kāi)源視頻生成模型中的最佳選擇。
智譜AI的開(kāi)源模型累計(jì)下載量已突破2000萬(wàn)次，為開(kāi)源社區(qū)的發(fā)展做出了重要貢獻(xiàn)。

01/
最新基座大模型GLM-4-Plus上線

GLM-4-Plus使用了大量模型輔助構(gòu)造高質(zhì)量合成數(shù)據(jù)，以提升模型性能；利用PPO有效提升模型的推理（數(shù)學(xué)、代碼算法題等）表現(xiàn)，更好地反映人類偏好。

以下為benchmark對(duì)比：

語(yǔ)言文本能力方面，GLM-4-Plus和GPT-4o及405B參數(shù)量的Llama3.1相當(dāng)。

Language capabilities（LCB: LiveCodeBench，NCB: NaturalCodeBench，*represents reproduced results）

長(zhǎng)文本能力比肩國(guó)際先進(jìn)水平。通過(guò)更精準(zhǔn)的長(zhǎng)短文本數(shù)據(jù)混合策略，取得了更強(qiáng)的長(zhǎng)文本的推理效果。

Long context evaluation

GLM-4V-Plus在圖像和視頻理解能力方面位居前列。GLM-4V-Plus還可以理解網(wǎng)頁(yè)內(nèi)容，并將其轉(zhuǎn)換為html代碼。

Vision capabilities

GLM-4V-Plus能夠理解并分析復(fù)雜的視頻內(nèi)容，同時(shí)具備時(shí)間感知能力。上線開(kāi)放平臺(tái)后，將提供國(guó)內(nèi)首個(gè)通用視頻理解模型API。

Video analysis

GLM-4V-Plus結(jié)合了視頻總結(jié)能力、推理能力、多輪對(duì)話、時(shí)間問(wèn)答能力。

用戶：這個(gè)穿綠色衣服的球員在整個(gè)視頻都做了什么？

GLM-4V-Plus：在整個(gè)視頻中，穿綠色衣服的球員在場(chǎng)上運(yùn)球，然后跳起將球投入籃筐。

用戶：這個(gè)視頻的精彩時(shí)刻是什么？發(fā)生在第幾秒？

GLM-4V-Plus：這個(gè)視頻的精彩時(shí)刻發(fā)生在第4秒，當(dāng)時(shí)穿綠色衣服的球員跳起并將球投入籃筐。

文生圖模型迎來(lái)最新版本CogView-3-Plus，其效果接近目前最佳的MJ-V6及FLUX等模型，并支持圖片編輯功能。

GLM-4-Plus現(xiàn)已在智譜AI的大模型開(kāi)放平臺(tái)bigmodel.cn部署，開(kāi)發(fā)者能通過(guò)API方式調(diào)用智譜AI的最新基座大模型。

02/
清言App迎來(lái)重要更新
全新的“視頻通話”功能來(lái)了

智譜AI還宣布清言App迎來(lái)了“視頻通話”功能，這是中國(guó)首個(gè)面向C端開(kāi)放的視頻通話功能。

清言App作為第一批C端上線的大模型產(chǎn)品，過(guò)去的一年，常常以文字和語(yǔ)音的形式和用戶交流。但從今天起，清言App也有了眼睛，解鎖了AI新體驗(yàn)。

清言App的視頻通話跨越了文本模態(tài)、音頻模態(tài)和視頻模態(tài)，并具備實(shí)時(shí)推理的能力?，F(xiàn)在，用戶撥打清言App的視頻通話窗口，即可與它進(jìn)行流暢通話，即便頻繁打斷它也能迅速反應(yīng)。只要打開(kāi)攝像頭，用戶看到的畫面，清言App也可以看到，同時(shí)可以聽(tīng)懂指令并準(zhǔn)確執(zhí)行。這樣的體驗(yàn)就如同和真人視頻通話一樣。

清言App視頻通話功能日前上線，首批面向部分用戶開(kāi)放，同時(shí)開(kāi)放外部申請(qǐng)。

隨著視頻通話功能的加入，清言App成為首個(gè)可以通過(guò)文本、音頻、視頻和圖像來(lái)進(jìn)行多模態(tài)互動(dòng)的AI助手。

03/
CogVideoX-5B開(kāi)源

智譜AI一如既往推動(dòng)AI普惠。

繼CogVideoX 2B版本開(kāi)源后，5B版本也正式開(kāi)源，性能更強(qiáng)，推理顯存需求最低僅為11.4GB。同時(shí)CogVideoX-2B的開(kāi)源協(xié)議調(diào)整為更加開(kāi)放的Apache 2.0協(xié)議，任何企業(yè)與個(gè)人均可自由使用。隨著CogVideoX-5B的開(kāi)源，智譜AI不僅在開(kāi)源模型數(shù)量上領(lǐng)先，累計(jì)下載量也突破2000萬(wàn)次，智譜AI以實(shí)際行動(dòng)為國(guó)際開(kāi)源社區(qū)做出自己應(yīng)有的貢獻(xiàn)。

隨著技術(shù)進(jìn)步、效率提升和成本優(yōu)化，智譜AI宣布用戶可以通過(guò)調(diào)用大模型開(kāi)放平臺(tái)bigmodel.cn最具性價(jià)比的大模型GLM-4-Flash，快速、免費(fèi)地構(gòu)建專屬模型和應(yīng)用。這也是智譜AI開(kāi)放平臺(tái)首個(gè)完全免費(fèi)的大模型API。

04/
專注于大模型的中國(guó)創(chuàng)新

最新推出的基座大模型，和此前發(fā)布的CogVideoX等模型一道，完善了智譜AI自主原創(chuàng)的全棧大模型譜系，推動(dòng)智譜AI實(shí)現(xiàn)面向世界先進(jìn)水平的全面對(duì)標(biāo)。

視頻通話功能是清言App繼7月上線生成視頻功能清影Ying后又一重大更新。通過(guò)小步快走持續(xù)迭代，智譜AI努力讓大模型技術(shù)更好賦能更多用戶。

隨著開(kāi)源模型和開(kāi)放平臺(tái)模型的廣受歡迎，智譜AI也將繼續(xù)推動(dòng)AI力量惠及更多人群。通過(guò)大模型鏈接物理世界億級(jí)用戶，智譜AI致力于為千行百業(yè)帶來(lái)持續(xù)創(chuàng)新與變革，加速邁向通用人工智能時(shí)代。

啟明星 | 智譜AI攜基座大模型GLM-4-Plus亮相KDD，清言App全新升級(jí)視頻通話功能

More News

啟明星 | 智譜AI攜基座大模型GLM-4-Plus亮相KDD，清言App全新升級(jí)視頻通話功能