編者按:基于“AI for Science”新范式,啟明創(chuàng)投投資企業(yè)深勢(shì)科技專注于利用人工智能和分子模擬相融合的先進(jìn)計(jì)算手段驅(qū)動(dòng)難成藥靶點(diǎn)的藥物開發(fā)。近日,深勢(shì)科技提名潛在best-in-class高選擇性Kv1.3小分子抑制劑DPT0218作為治療炎癥性腸病和特應(yīng)性皮炎等多種免疫疾病的臨床前候選化合物。DPT0218已在數(shù)種自身免疫性疾病的臨床前動(dòng)物模型中展示出優(yōu)越的效果。
深勢(shì)科技創(chuàng)始人兼首席執(zhí)行官孫偉杰在接受醫(yī)藥魔方Pro采訪時(shí),指出AI能突破很多藥物研發(fā)場(chǎng)景的計(jì)算效率、準(zhǔn)確性和能力的邊界。談及AI制藥技術(shù)的商業(yè)切入點(diǎn)和價(jià)值主張,孫偉杰表示,AI制藥注重提升原始創(chuàng)新的投入產(chǎn)出比,為行業(yè)解決更多關(guān)鍵而困難的問題。他亦分享了深勢(shì)科技選擇軟件模式進(jìn)行商業(yè)化的原因,即這種模式能讓先進(jìn)的技術(shù)最大程度和最快速度得到驗(yàn)證和反饋。展望AI制藥的未來(lái),他相信計(jì)算技術(shù)有望成為所有藥物研發(fā)領(lǐng)域默認(rèn)必備的基礎(chǔ)設(shè)施。
啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。
深勢(shì)科技創(chuàng)始人兼首席執(zhí)行官孫偉杰
人工智能(AI)技術(shù)被寄予了變革新藥研發(fā)的厚望。剛剛過去的2023年,AI制藥領(lǐng)域保持良好的發(fā)展勢(shì)頭,一方面,BMS、諾和諾德、默克、賽諾菲、羅氏、AZ、艾伯維、禮來(lái)等10多家制藥巨頭繼續(xù)關(guān)注AI制藥,另一方面,資本寒冬下,全球AI制藥領(lǐng)域依然累計(jì)收獲了超26億美元的融資。
應(yīng)用層面,AI制藥不斷拓寬邊界,除了傳統(tǒng)小分子、大分子,在蛋白降解劑、細(xì)胞療法、RNA療法、腫瘤疫苗、基因編輯療法等領(lǐng)域也逐漸釋放潛力。此外,大模型、生成式AI等技術(shù)的突破也為AI制藥領(lǐng)域的發(fā)展帶來(lái)了新機(jī)遇。
目前火熱的大模型究竟能給AI制藥帶來(lái)怎樣的突破?AI制藥產(chǎn)業(yè)近期發(fā)展態(tài)勢(shì)如何?背后有哪些原因?在商業(yè)模式方面,AI制藥公司有哪些選擇?AI制藥真正取得成功的標(biāo)志是什么?近日,醫(yī)藥魔方Pro就這些問題采訪了深勢(shì)科技創(chuàng)始人兼首席執(zhí)行官孫偉杰。
成立五年多的深勢(shì)科技,致力于運(yùn)用AI for Science的科研新范式,賦能生物醫(yī)藥等多領(lǐng)域的發(fā)展。2023年,深勢(shì)科技完成了超7億元人民幣的最新融資,成為國(guó)內(nèi)唯一入選2023年全球AI制藥融資TOP10榜單的企業(yè)。除此之外,過去一年,深勢(shì)科技對(duì)外合作不斷,一年內(nèi)與啟明創(chuàng)投投資企業(yè)英矽智能,以及和徑醫(yī)藥、晶泰科技、沙礫生物、維亞生物、美迪西、佰君生物等多家公司達(dá)成了合作。
值得注意的是,1月30日,深勢(shì)科技藥物研發(fā)團(tuán)隊(duì)宣布提名一款靶向Kv1.3的口服高選擇性小分子抑制劑DPT0218為臨床前候選化合物,用于治療多種免疫性疾病,包括炎癥性腸病和特應(yīng)性皮炎等。2022年6月,制藥巨頭禮來(lái)曾以6000萬(wàn)美元首付款(潛在交易總額5.35億美元)從D. E. Shaw Research(DESRES)公司獲得一款Kv1.3抑制劑(DES-7114)的全球臨床開發(fā)和商業(yè)化權(quán)利。
技術(shù)方面,2023年,深勢(shì)科技發(fā)布了一系列重磅成果,對(duì)AI for Science基礎(chǔ)設(shè)施進(jìn)行了迭代升級(jí),也將AI for Science帶入了預(yù)訓(xùn)練大模型時(shí)代。
孫偉杰表示:“制藥行業(yè)復(fù)蘇的過程中,AI其實(shí)是一個(gè)重要的驅(qū)動(dòng)力,有很多跨國(guó)企業(yè)、制藥企業(yè)、Biotech企業(yè)都深度布局了AI技術(shù),越來(lái)越多的人開始相信或者更加相信AI的力量。相信在不遠(yuǎn)的將來(lái),計(jì)算技術(shù)將成為所有藥物研發(fā)領(lǐng)域默認(rèn)必備的基礎(chǔ)設(shè)施。當(dāng)大家不再需要強(qiáng)調(diào)AI這個(gè)概念,當(dāng)AI成為藥物研發(fā)中一個(gè)自然且不可或缺的部分時(shí),AI制藥就真正成功了?!?/strong>
01/
AI是制藥行業(yè)復(fù)蘇的驅(qū)動(dòng)力
醫(yī)藥魔方Pro:從CADD到AIDD,變化是什么?為什么AI可以為藥物研發(fā)帶來(lái)助力?
孫偉杰:過去幾年大家對(duì)這兩個(gè)概念難免爭(zhēng)論,也給行業(yè)帶來(lái)了不少熱度。跳出概念本身的束縛的話,我們其實(shí)可以更關(guān)注技術(shù)發(fā)展的實(shí)質(zhì)。從廣義概念上來(lái)講,CADD包含AIDD,AI其實(shí)是計(jì)算手段中的一種;也可以說CADD作為一種“泛智能”的工具,屬于廣義的AI的一部分。從狹義來(lái)講,以機(jī)器學(xué)習(xí)為代表的AI技術(shù),本質(zhì)上使我們對(duì)高維復(fù)雜問題的處理能力有了大幅度提升,比如對(duì)于復(fù)雜物理模型和復(fù)雜科學(xué)數(shù)據(jù)的處理。由此,我們才有能力基于有限的數(shù)據(jù)攻克科學(xué)問題和工業(yè)研發(fā)問題?,F(xiàn)在一系列的預(yù)訓(xùn)練大模型技術(shù)也給數(shù)據(jù)驅(qū)動(dòng)和物理驅(qū)動(dòng)的方法帶來(lái)了更多、更強(qiáng)大的生產(chǎn)力工具。
具體到從CADD到AIDD的變化,CADD主要依賴于基于物理、化學(xué)和規(guī)則的計(jì)算方法,這些方法在處理復(fù)雜的化學(xué)和生物學(xué)時(shí)常常陷入效率和精度的兩難問題。而AIDD則利用了深度學(xué)習(xí)、預(yù)訓(xùn)練模型等AI技術(shù),突破了很多藥物研發(fā)場(chǎng)景的計(jì)算效率、準(zhǔn)確性和能力邊界。
首先,在處理物理驅(qū)動(dòng)的問題方面,AI能夠高效擬合和加速量子力學(xué)、密度泛函、分子動(dòng)力學(xué)等物理模型,更有效地模擬和理解生物分子復(fù)雜的結(jié)構(gòu)、動(dòng)力學(xué)和相互作用機(jī)制,發(fā)現(xiàn)過去未被發(fā)現(xiàn)的化學(xué)和分子生物學(xué)機(jī)理;其次,在處理數(shù)據(jù)驅(qū)動(dòng)的問題時(shí),如AlphaFold2和Uni-Mol所展示的,AI能夠大幅提升信號(hào)挖掘和規(guī)律發(fā)現(xiàn)的效率,比如通過分析海量的生物學(xué)數(shù)據(jù),發(fā)現(xiàn)之前未被理解或認(rèn)識(shí)到的生物規(guī)律,或者基于預(yù)訓(xùn)練模型技術(shù)大幅提升對(duì)有限的實(shí)驗(yàn)數(shù)據(jù)的利用能力,以及對(duì)于ADMET等分子性質(zhì)的預(yù)測(cè)能力;最后,對(duì)于傳統(tǒng)意義上經(jīng)驗(yàn)驅(qū)動(dòng)的問題,如有機(jī)合成規(guī)則和經(jīng)驗(yàn)打分函數(shù),AI能夠通過知識(shí)嵌入等手段,將物理規(guī)律、大數(shù)據(jù)和經(jīng)驗(yàn)規(guī)則有機(jī)整合統(tǒng)一,為科學(xué)家的研發(fā)提供更多維的指導(dǎo)。
醫(yī)藥魔方Pro:過去幾年,AI制藥領(lǐng)域不管是資本市場(chǎng)表現(xiàn),還是管線推進(jìn),都經(jīng)歷了起起伏伏,背后有哪些原因?
孫偉杰:廣義的AI制藥是指以計(jì)算手段為代表的藥物研發(fā)方法,其實(shí)在過去二三十年中,AI已經(jīng)逐漸滲透到了很多管線研發(fā)中。誠(chéng)然,過去兩年整個(gè)制藥行業(yè)在一個(gè)相對(duì)來(lái)說的“寒冬”、“低谷”,AI制藥領(lǐng)域的發(fā)展也在全行業(yè)的背景下深受影響。背后的原因有很多,我認(rèn)為行業(yè)的起伏,一方面源于新技術(shù)的巨大機(jī)遇與技術(shù)成熟度相對(duì)不足之間的矛盾;另一方面,也源于“泡沫”之下額外資源和注意力的注入,當(dāng)然也有很多非理性玩家涌入給行業(yè)帶來(lái)的“噪音”。
當(dāng)前AI制藥技術(shù)的成熟度相較于人們過高的預(yù)期尚有差距。DeepMind的首席執(zhí)行官Hasabis曾預(yù)測(cè),我們想要實(shí)現(xiàn)“AI制藥”的愿景大概還需要6個(gè)AlphaFold級(jí)別的技術(shù)突破。我的看法也是類似的,當(dāng)前的很多AI技術(shù)突破已經(jīng)在文獻(xiàn)知識(shí)挖掘、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、蛋白動(dòng)力學(xué)分析、蛋白-分子相互作用預(yù)測(cè)、分子ADMET性質(zhì)預(yù)測(cè)等藥物研發(fā)關(guān)鍵問題上提供新的解決方案,但實(shí)際上我們才剛剛抵達(dá)AI制藥技術(shù)礦山的門口,底層的技術(shù)富礦還有極大空間等著我們挖掘。
人們對(duì)于AI技術(shù)的高度期望給行業(yè)帶來(lái)了額外的資源和注意力,使得大家也更容易對(duì)行業(yè)任何的正面或負(fù)面的風(fēng)吹草動(dòng)有著“過度放大”的傾向。比如原本特定階段的管線開發(fā)的成功率是2%,AI制藥可以把成功率提升十倍至20%,但就特定的管線而言,仍舊有80%的概率是失敗的。從藥物研發(fā)的行業(yè)視角這是非常正常的事情,而往往大家比較有針對(duì)性地把“AI藥物管線”的失敗案例放大了。就像我前面所說,其實(shí)CADD作為廣義的“AI制藥”方法,已經(jīng)幾乎融入了所有主流組織的藥物管線研發(fā)中,并為當(dāng)前的藥物研發(fā)行業(yè)提供了難以取代的價(jià)值。
總體上還是要理性地看待整個(gè)技術(shù)發(fā)展的生命周期,前沿技術(shù)必須經(jīng)過“泡沫”的催化才能獲得充足的資源,才能獲得快速的發(fā)展。進(jìn)入現(xiàn)代社會(huì)以來(lái),我們高新科技產(chǎn)業(yè)也是在一輪一輪的“泡沫”浪潮中螺旋上升的,而浪潮的暫時(shí)褪去對(duì)行業(yè)也是好事。
過去幾年的行業(yè)起伏正在給AI制藥帶來(lái)更多的機(jī)會(huì),因?yàn)檫@種低谷和震蕩本質(zhì)上是行業(yè)出清、良幣驅(qū)逐劣幣的過程;更是倒逼創(chuàng)新效能提升,促進(jìn)創(chuàng)新技術(shù)快速應(yīng)用于行業(yè)研發(fā)的過程;也是促進(jìn)AI制藥組織與藥物研發(fā)組織彼此撥云見日,不斷凝練真問題的過程。我們也看到,在這個(gè)過程中有越來(lái)越多的跨國(guó)企業(yè)、Biotech、創(chuàng)業(yè)公司都深度布局和全面擁抱AI技術(shù),越來(lái)越多的人相信或者更加相信AI的力量。相信在AI制藥逐步克服上述的一些挑戰(zhàn)后,將會(huì)為行業(yè)帶來(lái)越來(lái)越多的高價(jià)值產(chǎn)出,也將成為行業(yè)復(fù)蘇更強(qiáng)大的內(nèi)在動(dòng)力。
醫(yī)藥魔方Pro:AI制藥行業(yè)近期的發(fā)展勢(shì)頭如何?背后有哪些深層次的原因?
孫偉杰:AI制藥行業(yè)正在快速發(fā)展,且這種發(fā)展一直是連續(xù)的、持續(xù)的,這既有內(nèi)生(技術(shù)創(chuàng)新)的原因,也有環(huán)境的原因。比如全球開放科學(xué)體系的協(xié)同推動(dòng),市場(chǎng)和投資人對(duì)于AI制藥行業(yè)認(rèn)知的不斷深化,以及頭部企業(yè)的研發(fā)實(shí)踐帶來(lái)越來(lái)越多的成功案例的出現(xiàn),都在作用于行業(yè)的積極演變。關(guān)于行業(yè)變化前面已經(jīng)討論了不少,這里重點(diǎn)說說技術(shù)的變化,尤其是AI制藥的底層技術(shù)基座——AI for Science。
AI for Science在過去兩年剛剛邁入預(yù)訓(xùn)練模型時(shí)代,整體上相比于以GPT為代表的大語(yǔ)言模型,技術(shù)發(fā)展周期大約滯后3-4年。但就像前文所說,AI for Science底層技術(shù)的發(fā)展已經(jīng)為行業(yè)帶來(lái)了很多質(zhì)的變化。
比如對(duì)于大家始終無(wú)法回避的,老生常談的數(shù)據(jù)質(zhì)量和可用性問題,與語(yǔ)言、圖片處理等數(shù)字世界的數(shù)據(jù)問題不同,藥物研發(fā)行業(yè)在AI的視角下,可能“數(shù)據(jù)不足”不是一個(gè)結(jié)論,甚至不是問題本身,而是我們討論問題的起點(diǎn)。由于真實(shí)的化學(xué)、生物空間往往龐大到我們無(wú)法想象也很難在實(shí)驗(yàn)層面可及的地步,我們可能永遠(yuǎn)無(wú)法基于現(xiàn)有的實(shí)驗(yàn)手段獲得真正的“大數(shù)據(jù)”,因此基于AI對(duì)整個(gè)化學(xué)和生物空間的表征和采樣就顯得尤為重要。這也是Uni-Mol、Uni-RNA等AI for Science大模型將會(huì)帶給行業(yè)的巨大變化,和致力于完成的工作。
AI算法和工具的驗(yàn)證體系也正在快速健全的過程中。相比于數(shù)據(jù),驗(yàn)證體系可能是AI技術(shù)發(fā)展更重要的方面。在過去幾年中,隨著生物技術(shù)的發(fā)展,AI與制藥、Biotech、CRO企業(yè)合作數(shù)量的增多,已經(jīng)基本上在AI算法關(guān)注的各個(gè)藥物研發(fā)環(huán)節(jié)上摸索出干濕閉環(huán)的驗(yàn)證體系,而不像是更早時(shí)期的“閉門造車”。
時(shí)至今日,我們已經(jīng)能夠清晰地意識(shí)到Hasabis所說的,行業(yè)需要的6個(gè)突破已經(jīng)有3-4個(gè)都在現(xiàn)有的技術(shù)儲(chǔ)備中快速生長(zhǎng)了,并且成長(zhǎng)的土壤越來(lái)越肥沃,只要給這種前沿技術(shù)的發(fā)展更多時(shí)間和耐心,假以時(shí)日必將給行業(yè)帶來(lái)更多驚喜。
在技術(shù)快速發(fā)展的前提下,AI制藥技術(shù)的商業(yè)切入點(diǎn)和價(jià)值主張也在變得更加明確。藥物研發(fā)更多是一種原始創(chuàng)新投入,這種投入很反常識(shí),當(dāng)它的投入產(chǎn)出比提升時(shí),人們不僅不會(huì)為了“省錢”而選擇用更少的投入完成跟原來(lái)一樣的研發(fā)工作,反而會(huì)投入更多的資源來(lái)挖掘更多“寶礦”。因此AI制藥要做的,不只是效率的提升,更重要的是效能提升;效率提升更多是成本視角,而效能提升是投入產(chǎn)出比視角,是如何提升原始創(chuàng)新的投入產(chǎn)出比,讓大家的創(chuàng)新有的放矢,為行業(yè)解決更多問題。
前沿技術(shù)的發(fā)展到落地不是一勞永逸的邏輯,而更像是“沿途下蛋”的邏輯。我們不能期望AI在當(dāng)下能夠解決所有問題,但在不同的AI技術(shù)成長(zhǎng)階段,需要以當(dāng)前的技術(shù)能力邊界為限,優(yōu)先解決最關(guān)鍵而困難的問題,而不是在低水平上加劇內(nèi)卷。我們意識(shí)到,給行業(yè)帶來(lái)更大價(jià)值的主要有兩個(gè)方面,一是難成藥靶點(diǎn)的開發(fā),比如針對(duì)IDP(固有無(wú)序蛋白)、GPCR/離子通道等膜蛋白、PPI的藥物發(fā)現(xiàn);二是針對(duì)成熟靶點(diǎn)的差異化開發(fā),尤其是復(fù)雜的分子設(shè)計(jì)問題,比如特殊的PK/PD profile的分子設(shè)計(jì)、多靶點(diǎn)抑制劑、ADC等組合型藥物設(shè)計(jì)等。這兩類工作能夠顯著體現(xiàn)AI相比于傳統(tǒng)藥物設(shè)計(jì)思路的優(yōu)越性,也是最能夠給行業(yè)帶來(lái)突破性的研發(fā)價(jià)值的方向。
最近,我們的藥物研發(fā)團(tuán)隊(duì)剛剛提名一款靶向Kv1.3的口服高選擇性小分子抑制劑DPT0218為臨床前候選化合物。DPT0218的發(fā)現(xiàn)依托了深勢(shì)科技的RiDYMO?藥物研發(fā)平臺(tái),其融合了多種AI及物理模型算法(核心算法之一的強(qiáng)化動(dòng)力學(xué)算法Reinforced Dynamics在分子模擬采樣效率上具有顯著優(yōu)勢(shì),通過充分結(jié)合神經(jīng)網(wǎng)絡(luò)的高維表示能力,Reinforced Dynamics能夠在復(fù)雜的生物大分子體系中高效地捕捉動(dòng)態(tài)構(gòu)象變化),致力于“難成藥”靶點(diǎn)及best-in-class分子的藥物開發(fā)。離子通道的動(dòng)力學(xué)過程極其復(fù)雜,RiDYMO?平臺(tái)無(wú)疑正適合應(yīng)用于這一系列高難度體系的藥物開發(fā)。DPT0218的成功發(fā)現(xiàn)是達(dá)成AI for Science愿景的重要一步。我們期待與該領(lǐng)域經(jīng)驗(yàn)豐富的藥企建立合作關(guān)系,共同推動(dòng)這個(gè)項(xiàng)目進(jìn)入下一個(gè)里程碑。
02/
AI制藥邁向“預(yù)訓(xùn)練大模型時(shí)代”
醫(yī)藥魔方Pro:為什么深勢(shì)科技要強(qiáng)調(diào)AI與物理模型融合?
孫偉杰:因?yàn)槲覀兊目陀^世界本身是物理的,藥物也不例外地遵守物理規(guī)律的約束。純粹的數(shù)據(jù)驅(qū)動(dòng)方法在缺乏足夠高質(zhì)量數(shù)據(jù)時(shí)可能效果有限,而物理模型能夠提供必要的理論基礎(chǔ)、結(jié)構(gòu)框架和數(shù)學(xué)約束,大幅降低我們對(duì)于數(shù)據(jù)的需求,提升模型的精度和泛化能力。
醫(yī)藥魔方Pro:目前火熱的預(yù)訓(xùn)練大模型在AIDD中有哪些應(yīng)用?
孫偉杰:預(yù)訓(xùn)練是先對(duì)自變量進(jìn)行學(xué)習(xí),使得模型對(duì)于自變量空間結(jié)構(gòu)學(xué)習(xí)到足夠的知識(shí),然后再使用有標(biāo)簽的數(shù)據(jù)進(jìn)行二次訓(xùn)練(finetune)的方法。一般來(lái)說,預(yù)訓(xùn)練學(xué)習(xí)所需的自變量數(shù)據(jù)十分充足,而標(biāo)簽數(shù)據(jù)相對(duì)稀缺(藥物研發(fā)中的標(biāo)簽數(shù)據(jù)主要是各公司的私域?qū)嶒?yàn)數(shù)據(jù)),因此,預(yù)訓(xùn)練模型相比于傳統(tǒng)的“小模型”可以彰顯出巨大的優(yōu)勢(shì)。
舉例來(lái)說,深勢(shì)科技開發(fā)的Uni-RNA通過對(duì)大約20億條高質(zhì)量RNA序列的大規(guī)模預(yù)訓(xùn)練,充分挖掘了RNA序列中的潛在信息。這種大規(guī)模的預(yù)訓(xùn)練使得Uni-RNA能夠在RNA結(jié)構(gòu)預(yù)測(cè)、mRNA序列性質(zhì)預(yù)測(cè)和RNA功能預(yù)測(cè)等關(guān)鍵領(lǐng)域取得領(lǐng)先的成果。
此外,深勢(shì)科技開發(fā)的Uni-Mol 3D分子表征預(yù)訓(xùn)練模型,通過對(duì)數(shù)十億個(gè)分子的三維結(jié)構(gòu)的預(yù)訓(xùn)練,再結(jié)合實(shí)驗(yàn)數(shù)據(jù)的finetuning來(lái)驅(qū)動(dòng)分子生成、小分子性質(zhì)預(yù)測(cè)、大分子性質(zhì)預(yù)測(cè)、小分子-蛋白結(jié)合性質(zhì)等各類下游任務(wù)。在最近的更新中,Uni-Mol docking v2在蛋白-配體對(duì)接預(yù)測(cè)上取得了顯著進(jìn)步。它在最新的PoseBuster數(shù)據(jù)集上表現(xiàn)出超越AlphaFold-latest的精度,這對(duì)于發(fā)現(xiàn)和優(yōu)化新藥分子具有重要意義。
除了Uni-RNA、Uni-Mol這類AI for Science“大模型”,我們也廣泛地探索了大語(yǔ)言模型在藥物研發(fā)領(lǐng)域的潛力。藥物研究人員需要閱讀大量文獻(xiàn)來(lái)分析特定靶點(diǎn)的關(guān)鍵作用區(qū)域,收集活性小分子的數(shù)據(jù)等。這一過程往往需要耗費(fèi)大量的時(shí)間和人力資源。傳統(tǒng)的科學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(如SciFinder)盡管提供了檢索功能,卻仍需要人工篩選并閱讀大量文獻(xiàn)。此外,盡管像ChatGPT這樣的大型語(yǔ)言模型在處理自然語(yǔ)言方面表現(xiàn)出色,但面對(duì)含有分子結(jié)構(gòu)圖、化學(xué)反應(yīng)式等多模態(tài)元素的科學(xué)文獻(xiàn)時(shí),它們卻顯得力不從心。
針對(duì)上述挑戰(zhàn),深勢(shì)科技推出了智能科學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)平臺(tái)Uni-Finder,旨在進(jìn)一步提升科學(xué)文獻(xiàn)的閱讀和分析效率。該平臺(tái)不僅具備傳統(tǒng)數(shù)據(jù)庫(kù)(如SciFinder)的多模態(tài)檢索功能,還能通過自然語(yǔ)言交互,在篩選結(jié)果中靈活且自動(dòng)化地提取所需信息,如多個(gè)專利的共同中間體或與特定靶點(diǎn)相關(guān)的小分子活性數(shù)據(jù)。此外,由于其對(duì)科學(xué)多模態(tài)元素的精確理解,Uni-Finder在科學(xué)文獻(xiàn)的內(nèi)容理解和問答方面的性能也優(yōu)于其他大型語(yǔ)言模型。
Uni-Finder的核心技術(shù)是深勢(shì)科技自研的科學(xué)多模態(tài)大模型Uni-SMT(Universal Science Multimodal Transformer)。不同于之前僅關(guān)注純文本的大型語(yǔ)言模型,Uni-SMT綜合考慮了科學(xué)文獻(xiàn)中的多模態(tài)元素,如圖表、數(shù)學(xué)方程、分子結(jié)構(gòu)和化學(xué)反應(yīng)方程式等。它運(yùn)用多模態(tài)對(duì)齊技術(shù),實(shí)現(xiàn)了對(duì)科學(xué)文獻(xiàn)的更全面和精確理解。例如,對(duì)于某些專利,Uni-SMT能夠通過多模態(tài)對(duì)齊技術(shù)同時(shí)理解markush式(帶有可變基團(tuán)的化學(xué)分子式)和文本中對(duì)可變基團(tuán)的描述,從而精確地識(shí)別和解析專利的保護(hù)范圍。
03/
AI制藥真正的成功是“淡化AI”
醫(yī)藥魔方Pro:AI制藥公司的商業(yè)化模式備受關(guān)注,深勢(shì)科技為何選擇軟件模式為主?
孫偉杰:對(duì)于一個(gè)行業(yè)的新技術(shù)而言,只要技術(shù)本身有用、能夠解決問題,無(wú)論什么樣的商業(yè)模式,它一定能夠帶來(lái)價(jià)值,只是價(jià)值的實(shí)現(xiàn)方式和規(guī)模不同。
軟件模式能夠讓行業(yè)所有玩家都能快速使用最先進(jìn)的技術(shù),這種商業(yè)模式和載體,同時(shí)也能讓先進(jìn)的技術(shù)最大程度和最快的速度得到驗(yàn)證和反饋。而在提供軟件服務(wù)的基礎(chǔ)上,我們也和其他公司與機(jī)構(gòu)做一些管線的聯(lián)合開發(fā)和對(duì)外授權(quán)(license-out),幫助合作伙伴更好地開發(fā)高價(jià)值管線資產(chǎn)。
醫(yī)藥魔方Pro:您認(rèn)為,AI制藥成功的標(biāo)志是什么?
孫偉杰:AI制藥真正取得成功的標(biāo)志,在于不再需要強(qiáng)調(diào)AI這個(gè)概念本身,而是將其作為藥物研發(fā)中一個(gè)自然且不可或缺的部分。我們已經(jīng)可以看到這種趨勢(shì)的初步體現(xiàn):Biotech創(chuàng)始人組合正在從傳統(tǒng)的生物學(xué)家和藥物化學(xué)家,轉(zhuǎn)變?yōu)樯飳W(xué)家、藥物化學(xué)家加上計(jì)算科學(xué)家的組合。相信在不遠(yuǎn)的將來(lái),計(jì)算技術(shù)將成為所有藥物研發(fā)領(lǐng)域默認(rèn)必備的基礎(chǔ)設(shè)施。
至于AI是否會(huì)取代人類,答案是否定的。AI不會(huì)取代人類,但會(huì)用AI的人很可能會(huì)取代那些不會(huì)用AI的人。從供給和需求的角度來(lái)看,新技術(shù)的出現(xiàn)總是伴隨著對(duì)人類福祉的提升。AI在藥物研發(fā)中的應(yīng)用,將使得研發(fā)過程更加高效,推動(dòng)新藥的快速發(fā)現(xiàn)和開發(fā),最終惠及整個(gè)人類社會(huì)。
來(lái)源 | 醫(yī)藥魔方Pro