日前,啟明創(chuàng)投投資企業(yè)后摩智能正式發(fā)布首款存算一體智駕芯片——鴻途?H30,最高物理算力256TOPS,典型功耗35W,成為國內(nèi)率先落地存算一體大算力AI芯片的公司。
本次發(fā)布會上,后摩智能同步推出了基于鴻途?H30芯片打造的智能駕駛硬件平臺——力馭?。依靠鴻途?H30極高的計算效率和計算密度,力馭?平臺CPU算力高達200Kdmips,AI算力高達256TOPS,支持多傳感器輸入,能夠為智能駕駛提供更充沛的算力支持,進一步提升了系統(tǒng)的可靠性。力馭?平臺功耗僅為85W,可采用更加靈活的散熱方式,實現(xiàn)更低成本的便捷部署,有利于推動大算力智能駕駛場景的普及應(yīng)用。
為了讓客戶擁有更好的產(chǎn)品使用體驗,后摩智能還基于鴻途?H30芯片自主研發(fā)了一款軟件開發(fā)工具鏈——后摩大道?,支持PyTorch、TensorFlow、ONNX等主流開源框架,編程兼容CUDA前端語法,同時支持SIMD和SIMT兩種編程模型,兼顧運行效率和開發(fā)效率,以無侵入式的底層架構(gòu)創(chuàng)新保障了通用性的同時,進一步實現(xiàn)了鴻途?H30的高效、易用。
在人工智能技術(shù)飛速發(fā)展的今天,高效的AI計算能力成為了智能駕駛普及應(yīng)用的重要基石。后摩智能以底層技術(shù)創(chuàng)新為驅(qū)動力,采用存算一體架構(gòu)突破芯片算力和功耗的瓶頸,實現(xiàn)了芯片能效比的階段性躍升,為快速發(fā)展的智能汽車產(chǎn)業(yè)帶來了全新的解決方案。
啟明創(chuàng)投合伙人周志峰、中國電動汽車百人會副理事長兼秘書長張永偉等作為嘉賓出席本次產(chǎn)品發(fā)布會。
01/
通過底層架構(gòu)創(chuàng)新
實現(xiàn)AI計算效率的極致突破
計算效率的提升一直以來都是科技發(fā)展和變革的底層驅(qū)動力。如今,一部小小的智能手機,計算能力和效率已經(jīng)比2000年代的個人PC提高了至少1000倍。這種計算能力的提升,為人們帶來了豐富多彩的生活和便捷體驗。從大型機到PC再到手機,技術(shù)發(fā)展與應(yīng)用變革的趨勢也表明,每1000倍效率提升將會創(chuàng)造一個新的計算時代,并改變?nèi)藗兊纳罘绞健?strong>伴隨著AI技術(shù)的不斷發(fā)展,未來萬物智能時代的計算系統(tǒng),和今天的芯片相比,在計算能力和效率上至少要再有1000倍以上的提升。
后摩智能創(chuàng)始人兼首席執(zhí)行官吳強
后摩智能創(chuàng)始人兼首席執(zhí)行官吳強表示:“2年前,后摩智能成立,我們堅定地選擇以存算一體的底層架構(gòu)創(chuàng)新,來實現(xiàn)AI計算效率的極致突破。存算一體架構(gòu)將存儲和計算功能融合,比傳統(tǒng)架構(gòu)更接近人腦的計算方式,具備遠高于傳統(tǒng)方式的計算效率。隨著GPT等大模型的出現(xiàn),存算一體芯片越來越受到行業(yè)關(guān)注,我們很高興看到更多的創(chuàng)業(yè)公司加入進來,與我們一起推動硬科技的創(chuàng)新與應(yīng)用?!?/span>
發(fā)布會上,中國電動汽車百人會副理事長兼秘書長張永偉指出,智能駕駛市場規(guī)模龐大,仍處于加速滲透的階段,為新技術(shù)和新企業(yè)提供了創(chuàng)新發(fā)展的巨大機遇。存算一體作為一種創(chuàng)新技術(shù),對工藝制程依賴度低,具有極高的競爭力,為智能駕駛芯片提供了更具前瞻性的技術(shù)路徑選擇。采用多種技術(shù)路徑實現(xiàn)芯片國產(chǎn)化布局,將有利于解決汽車芯片供應(yīng)鏈中存在的同質(zhì)化競爭問題,助力提升產(chǎn)業(yè)鏈的韌性和供應(yīng)鏈的安全性。
02/
存算一體
為智能駕駛打造高效計算引擎
后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮表示,鴻途?H30以存算一體創(chuàng)新架構(gòu)實現(xiàn)了六大技術(shù)突破,即大算力、全精度、低功耗、車規(guī)級、可量產(chǎn)、通用性。鴻途?H30基于SRAM存儲介質(zhì),采用數(shù)字存算一體架構(gòu),擁有極低的訪存功耗和超高的計算密度,在Int8數(shù)據(jù)精度條件下,其AI核心IPU(處理器架構(gòu))能效比高達15TOPS/W,是傳統(tǒng)架構(gòu)芯片的7倍以上。為了更好地實現(xiàn)車規(guī)級,后摩智能基于鴻途?H30自主研發(fā)了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
為了充分發(fā)揮存算一體帶來的高計算效率,后摩智能面向智能駕駛場景打造了專用IPU——天樞架構(gòu),采用多核、多硬件線程的方式擴展算力,實現(xiàn)了計算效率與算力靈活擴展的完美均衡,AI計算可以在核內(nèi)完成端到端處理,保證通用性。天樞架構(gòu)的設(shè)計理念源自于庭院式的中國傳統(tǒng)住宅,以大布局設(shè)計保障計算資源利用效率的同時,再進一步結(jié)合現(xiàn)代住宅多層/高層的設(shè)計優(yōu)勢,以多核/多硬件線程的方式靈活擴展算力。得益于靈活、高效的硬件架構(gòu)設(shè)計,鴻途?H30實現(xiàn)了性能2倍提升的同時,還降低了50%功耗。
據(jù)陳亮介紹,天樞架構(gòu)是后摩智能自主研發(fā)的第一代IPU,第二代天璇架構(gòu)已經(jīng)在研發(fā)中,將采用Mesh互聯(lián)結(jié)構(gòu),可根據(jù)應(yīng)用場景的不同配置計算單元的數(shù)量,整體性能、效率和靈活性將進一步躍升,支持多場景應(yīng)用,例如成本和功耗敏感的智能終端、大模型等場景。第三代天璣架構(gòu)已經(jīng)開始規(guī)劃,將為萬物智能打造。
03/
顛覆式技術(shù)賦能智能駕駛
鴻途?H30再創(chuàng)性能新高
發(fā)布會上,后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭對鴻途?H30的產(chǎn)品性能與優(yōu)勢做了詳細介紹。得益于存算一體的架構(gòu)優(yōu)勢,鴻途?H30基于12nm工藝制程,在Int8數(shù)據(jù)精度下實現(xiàn)高達256TOPS的物理算力,所需功耗不超過35W,整個SoC能效比達到了7.3TOPS/W,具有高計算效率、低計算延時以及低工藝依賴等特點。在實際的性能測試中,鴻途?H30基于Resnet 50模型的Benchmark,在Batch Size等于1和8的條件下分別達到了8700幀/秒和10300幀/秒的性能。
目前,基于鴻途?H30已成功運行常用的經(jīng)典CV網(wǎng)絡(luò)和多種自動駕駛先進網(wǎng)絡(luò),包括當前業(yè)內(nèi)最受關(guān)注的BEV網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的PointPillar網(wǎng)絡(luò)模型。以鴻途?H30打造的智能駕駛解決方案已經(jīng)在合作伙伴的無人小車上完成部署,這是業(yè)界第一次基于存算一體架構(gòu)的芯片成功運行端到端的智能駕駛技術(shù)棧。
信曉旭透露,鴻途?H30將于6月開始給Alpha客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途?H50已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶2025年的量產(chǎn)車型。
鴻途?H30的發(fā)布,開啟了存算一體大算力芯片商用落地的新階段。后摩智能將堅定不移地專注于底層技術(shù)創(chuàng)新,打造極致效率的計算芯片,與生態(tài)鏈上的合作伙伴密切合作,共同推進萬物智能的實現(xiàn)。