文|在洲
冷靜,理性,且對芯片行業(yè)充滿敬畏。
和后摩智能聯合創(chuàng)始人、研發(fā)副總裁陳亮對話的一個小時的時間里,他少有情緒上的變化,不過每次談及技術相關的話題,他總會加重語氣,講起來滔滔不絕,對芯片制造和設計問題如數家珍。
5月10日,是后摩智能成立兩年來最重要的里程碑,公司研發(fā)兩年的存算一體大算力AI芯片產品——鴻途H30亮相,“就像自己培養(yǎng)的孩子開始接受檢驗一樣?!?/p>
鴻途H30是國內第一款量產存算一體智駕芯片,于行業(yè)來說,將多了一個底層架構完全不同的大算力AI芯片的選擇,于后摩來說,公司第一款產品,終于等到推向市場的時刻。
存算一體的優(yōu)勢在于,打破了現代計算機技術中馮·諾伊曼架構的存儲墻和能效墻的瓶頸,既存儲數據也能處理數據,可以顯著提升能效比,實現大算力、低功耗。而且存算一體芯片,不需要依賴先進制程工藝和封裝技術,成本大大降低。
基于這種底層邏輯的創(chuàng)新,讓鴻途H30有了和大廠產品掰手腕的底氣。
從賬面數據來看,這款后摩花兩年打造的芯片足夠驚艷。鴻途H30基于 SRAM 存儲介質,最高物理算力可以達到256TOPS,典型功耗 35W,在 Int8 數據精度條件下,其 AI 核心IPU 能效比高達15Tops/W,是傳統架構芯片的7倍以上。
鴻途H30還支持運行點云網絡,以及BEV網絡,能夠支持 L2+ 到L4 級自動駕駛。此外,這顆芯片采用了更加靈活的散熱方式,車企可以實現更低成本的部署,開源的通用計算平臺,也大大降低了主機廠開發(fā)的成本,并縮短適配周期。
在陳亮看來,車企搭載存算一體芯片,無論耗費的時間還是資金,都是一筆非常劃算的買賣。
作為公司首款產品,鴻途H30的重要性不言而喻,但面對如此重要的時間節(jié)點,陳亮并沒有太大波動,“平常心就好”。
在他看來,舉辦產品發(fā)布會只是第一步,后面還有很多工作要做,比如要做到量產,要滿足客戶的要求,還要卡在6月節(jié)點送測等。
雖然存算一體芯片行業(yè)站在爆發(fā)前夜,但產業(yè)化尚處于起步階段,無論是初期開發(fā)還是產業(yè)鏈上下游適配,都在摸著石頭過河。
陳亮清楚,作為存算一體行業(yè)的先行者,前路定會荊棘遍布?!氨粍e人趕超也是好事,即便我們這個公司做不成,做這件事的價值還是非常有意義?!?/p>
作為在芯片行業(yè)扎根十幾年的老人,陳亮認定了公司選定的方向不會錯?;谛酒讓蛹夹g創(chuàng)新,其存算一體產品在同樣的性能下功耗會低很多,同樣功耗下性能會高很多。即便行業(yè)處于拓荒階段,陳亮仍然篤定地認為,存算一體將會是未來人工智能發(fā)展的必然方向。
“我們用兩年時間做到了業(yè)界沒有人做到過的事情,真心為公司每一個人感到驕傲?!?/p>
在后摩智能這家初創(chuàng)公司里,還有很多像陳亮這種對于技術有著極致追求的研發(fā)人員,他們在待遇和公司體量都稍遜的情況下,仍然選擇了后摩智能?!翱粗械木褪菑牡讓幼銎?,還擁有技術創(chuàng)新?!?/p>
陳亮本碩博畢業(yè)于清華大學,曾任海思CPU芯片資深架構師、地平線AI芯片首席架構師具備10余年高性能CPU/FPGA/ASIC芯片內核設計及量產經驗,主導過多款AI芯片設計,擁有美國及中國芯片相關發(fā)明專利近20項。
站在2023年這個時間節(jié)點,即便一些自動駕駛解決方案供應商大打價格戰(zhàn),并把產品做到幾千元的成本,陳亮也不擔心鴻途H30的產品力,因為“不能只看價格,還要看價值?!?/p>
以下是獵云網與后摩智能聯合創(chuàng)始人、研發(fā)副總裁陳亮的對話:(略經整理)
時機已成熟
Q:兩年前為什么會選擇加入后摩智能?
A:2021年初,吳強(后摩智能創(chuàng)始人兼CEO)給我打了一個電話,說可以一起做存算一體芯片,當知道了他的想法和對公司的戰(zhàn)略時,我沒有考慮太久,很快就選擇加入進來。因為后摩智能創(chuàng)立之初就選擇從底層做起,還有技術創(chuàng)新。
而且存算一體帶來的技術和產品的優(yōu)勢,和智能駕駛的關鍵需求天然吻合,因為智能駕駛的終局是要替代人的駕駛,我們用傳感器代替人的眼睛,用各式各樣的算法填補人的意識和靈魂。底層的智能駕駛芯片又扮演著人類大腦的角色,所以從終局的角度來看,智能駕駛芯片一定要無限接近人大腦的行駛和效率。
Q:發(fā)布會現場,你說很多人選擇后摩智能的時候,薪資不是重要的考量因素。
A:是的,我們團隊每個人都在專心做好自己的事情,覺得我們做的事非常有價值,每個人在這里都可以充分發(fā)揮自己的積極性,表達自己的想法,團隊每天都非常有活力,這是他們最看重的。
Q:可以介紹一下團隊研發(fā)人員背景嗎?
A:團隊基本都是科班出身,既有來自英偉達、海思、高通、寒武紀等芯片企業(yè),也有來自阿里巴巴、百度等科技公司,主要以具有存算一體領域原創(chuàng)科研能力的人為主。
Q:現在研發(fā)部門有多少人?
A:研發(fā)團隊占公司人數一半以上,有百分之七八十都是研發(fā)人員。
Q:兩年來最大的收獲是什么?
A:最大的一個收獲就是要考慮的事情確實是更多了,比如人的因素、產品、客戶等各個方面要考慮的因素更多。而且要把一件事或者一個很好的想法變成現實,需要綜合各個方面考慮,而不能是像一個工程師一樣去處理,按照工程師的思維,沒辦法運營公司。
Q:接下來最重要的一件事是什么?
A:最重要的其實有兩件事,一個是我們第一代芯片交付,第二件事就是第二代芯片的研發(fā)。
價值比價格更重要
Q:新產品發(fā)布之際,自己的心情如何,激動嗎?
A:沒有什么特別的心情,繼續(xù)做該做的工作,激動也談不上,因為后面還有很多工作要做,要量產、要給客戶送測,然后產品很多功能都要做,平常心吧。
Q:目前這個產品節(jié)奏符合自己的預期嗎?
A:基本符合,當然我們希望能夠越快越好,不過我們的AI處理器以及存算電路等,完全都是自己做的,這就意味著需要比別人做更多的工作,也會更深1~2個層次,所以也不能著急。
Q:那你們接下來如何說服車企搭載自己的產品?
A:首先從產品角度來說,鴻途H30有著256T的AI物理算力,這么大的物理算力,在當前的國內AI芯片是第一個。它的典型功耗只有35W左右,能效是其他產品的幾倍,是目前國內效率最高的大算力智能駕駛芯片。
而且35W是我們芯片和一個主控芯片,兩個加起來的功耗,我們單個芯片的功耗其實只有20W到25W。
從開發(fā)的角度來說,存算一體技術是對開發(fā)者無侵入式的底層架構創(chuàng)新,從編程角度來看用戶感知不到任何底層硬件的影響,再有我們也會做一些車規(guī)的認證,這方面也不存在障礙。
Q:不過現在自動駕駛行業(yè)其實非常內卷,一些自動駕駛解決方案供應商都在壓低價格,很多成本都控制在了萬元以內,你們怎么看?
A:芯片的價值不在于單顆芯片的價格,不在于說賣多少錢一片,而在于長期上帶來的好處,單一價格不能等同于價值。如果真是在要問多少錢一片的話,同樣的性能,我們芯片的面積比其他產品小三倍,就是在同樣的性能條件下功耗更小,功耗小帶來的是整個系統成本的降低,其中就包括散熱成本。
我們下一代產品就會主打自然散熱,不需要風冷或者散熱這些配件,可以為主機廠節(jié)省更多的成本。所以真正有價值的東西,不用局限于單一價格的衡量標準,需要從整體來看。
Q:發(fā)布會當天你們宣布了一個彩蛋,說是要設計開源,具體開放了哪些能力?
A:我們計劃的開放是非常底層的,未來會開放整個硬件的設計,然后配合我們的軟件工具鏈,就可以把我們的硬件設計直接用在自己的產品中。
大家可以在我們網站上下載IPU設計資料,在此基礎上就可以做PPA的評估,做軟件算法的開發(fā)。我們希望有更多的人和組織能夠參與進來,相信以大家的智慧可以更好的讓這個方向落地,大家可以共建生態(tài),最終讓整個產業(yè)鏈受益。
Q:所以你們設計開源也有打造生態(tài)的考慮?
A:是的,首先我們還是把自己定位為Tier 2,我們所做得是最底層的通用計算平臺,這個計算平臺包括了硬件底層的操作系統,上層的應用算法都是交給客戶或者合作伙伴去做。
我們的芯片采用HDPL語言編程,它是我們IPU架構的CUDA語言拓展,金融CUDA的前端語法和CUDA運行時,高效解決了數據并行問題,而且支持消息傳遞機制。我們的Tile內部是有異構的計算單元組成的,所以我們在核內采用異構的SIMD編程模型。
而在核間、Tile間都是同構的設計,所以采用CMT的編程模型。像一些底層復雜的機制,比如數據共享,消息傳遞等等,都被我們出色的軟件工具鏈團隊包裝起來。大家只要使用我們的開發(fā)套件,使用一些非常簡單的簡潔易用的編程接口,就可以在我們的IPU上高效的開發(fā)自己的軟件和算法。
不擔心被趕超
Q:在創(chuàng)投圈一直有個說法,就是初創(chuàng)公司做的這件事,BBA做了怎么辦?你們怎么看待這個問題?
A:所有的初創(chuàng)公司都會面臨這個問題,但你看還是有很多公司會活下來。與其杞人憂天地揣測會不會被大廠超越,不如先關心自己怎么能把產品做得更好。
我們作為一家初創(chuàng)公司,選擇了一個相對前沿的技術路徑,就是要做出人無我有、人有我優(yōu)的產品。做芯片不是一蹴而就的,從硬件到軟件,每一個環(huán)節(jié)都依賴于有效打磨,其中的先發(fā)優(yōu)勢不僅在于時間和資源,更重要的是工程化驗證的有效經驗。
Q:存算一體雖然處于爆發(fā)階段,但智駕芯片的同行者并不多,后摩作為第一個吃螃蟹的人,會不會擔心被后來者趕超?
A:我覺得趕超也挺好的,存算一體這個賽道值得更多人加入,就算這個公司做不成,我們做這件事的價值也不會消失,無論我們最后能不能成功,對于行業(yè)來說都是具有意義的。
Q:開發(fā)第一款量產存算一體芯片,在設計過程中有沒有遇到一些難題?
A:確實有好多問題都是之前沒有遇到過的,比如去年,我們發(fā)現存算電路會在非常偶然的情況下會出現計算的錯誤,無論怎么做試驗總是找不到原因。
這個問題不解決,不管是性能還是良率都會出現問題。最后我們都幾乎絕望了,甚至懷疑是不是有三體人發(fā)射質子來封鎖我們的科技。好在反復確認后,發(fā)現就是因為電路里一個小小的行為沒有反映在行為模型里導致的。
Q:這也說明開發(fā)過程中會產生很多意想不到的問題,其實自動駕駛技術的發(fā)展迭代本就是發(fā)現問題解決問題的過程,你們又是如何在交付非常緊張的情況下,保持技術領先性和應用的?
A:從技術的角度領先性的角度來說,我們的設計本就比其他產品的更深至少1~2個層次。我們也在不斷迭代電路,優(yōu)化的過程沒有止境的,即使是用同樣的工藝,也可以不斷優(yōu)化。有專門的架構和算法的團隊去做更前沿的設計和研究,我們基本上是在實施一代、設計一代,然后再預演下一代的節(jié)奏在跟進。
Q:對于自動駕駛芯片來說,產品亮相往往是第一步,接下來還有更大的門檻,比如交付的壓力和工程化的問題,你們怎么去解決這些問題?
A:芯片良率問題我們已經解決了,我們的芯片沒有良率很低的問題。我們也會盡全力配合客戶做相應的適配工作。不過我們是做的通用的計算平臺,設計更加開源,可以最大程度保持用戶的開發(fā)習慣,所以和用戶適配的周期更短,相應地,用戶花費的時間和資金成本也會更低。
至于工程化的問題,我們從設計、封裝到成品的流程已經走通了,沒有什么障礙。
Q:在接下來和主機廠合作的過程中,如果遇到一些任務難以厘清,你們怎么辦?
A:肯定會盡全力滿足客戶的需求,如果客戶覺得應該這么做,我們盡量按照他們的方式去做適配,也會提供一些建議或參考,比如說我會告訴客戶,這么用的話芯片效率可能會更高,當然,也會提供有Plan A、Plan B等多個版本供客戶選擇。