在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    特斯拉 AI-Day 觀后感

    馬斯克:我要搶答!

    注:內(nèi)容較長,閱讀可能需要毅力,請(qǐng)酌情安排時(shí)間。多是個(gè)人見解,有不對(duì)的大家批評(píng)指正。

    前言

    我把結(jié)論先放在前面,以便節(jié)約您的時(shí)間。這次 AI-Day 都說了哪些內(nèi)容?

    從時(shí)間角度:過去部分主要介紹了算法架構(gòu)、基于向量的融合式算法創(chuàng)新、決策系統(tǒng)算法優(yōu)化、標(biāo)注數(shù)據(jù)和模擬系統(tǒng)這四塊內(nèi)容,未來部分由 Dojo AI 加速芯片及擎天柱“人形特斯拉汽車”兩部分構(gòu)成。

    過去部分我個(gè)人的感受是:強(qiáng)大的工程能力和基于向量融合算法各個(gè)部分的系統(tǒng)整合能力,讓我覺得特斯拉技術(shù)團(tuán)隊(duì)的算法創(chuàng)新可能不如 DeepMind,但工程能力方面,說他們第二可能沒幾個(gè)團(tuán)隊(duì)敢稱第一。

    幾乎所有業(yè)界流行的模型算法和光線追蹤等新技術(shù),在他們手上都變成了可塑性極強(qiáng)的橡皮泥。其次,未來押寶在自研的算法芯片的領(lǐng)先性,以及擎天柱機(jī)器人對(duì)人類勞動(dòng)力的替代。前者是內(nèi)涵的增強(qiáng),進(jìn)一步加強(qiáng)核心競爭力和護(hù)城河。后者是外延的增強(qiáng),把算力和自動(dòng)化控制技術(shù)儲(chǔ)備、地理空間理解能力等,通過擎天柱機(jī)器人輸送到更通用的應(yīng)用領(lǐng)域,即:出行=>所有人類活動(dòng)的人機(jī)協(xié)同場景。

    無論這種人機(jī)協(xié)同是實(shí)時(shí)的,如陪你一起整理房間,還是非實(shí)時(shí)的,如代替你去客戶家進(jìn)行汽車檢修,這種協(xié)同能力和用戶進(jìn)行深度耦合后,就賦予了人類如火影忍者版的影分身之術(shù)!下面,我們結(jié)合觀看 AI-Day 保存的截圖,依視頻的順序和內(nèi)容結(jié)構(gòu),以:內(nèi)容、觀察、思考、啟發(fā)的結(jié)構(gòu),分享一下自己的些許愚見。

    結(jié)構(gòu)

    識(shí)別:Linux 的萬物皆 Stream 到 特斯拉萬物皆 Vector

    決策:真實(shí)的體驗(yàn)、真實(shí)的駕駛、真實(shí)的局部最小泥潭

    標(biāo)注:機(jī)器識(shí)別和人類理解的完美結(jié)合

    仿真:真實(shí)保下限自由突上限

    計(jì)算加速:夸張的 I/O 垂直供電和散熱的模塊化硬件加速芯片群

    擎天柱:站起來用腳走路還長了手的 Model S

    結(jié)語:腳踏實(shí)地仰望星空

    識(shí)別

    內(nèi)容:

    觀察:

  • 虛擬相機(jī)融合多相機(jī)數(shù)據(jù);
  • 2、 物理運(yùn)動(dòng)學(xué)知識(shí)嵌入算法模型;

    3、 特征堆棧優(yōu)化記憶平衡性能;

    4、 多模型、多模態(tài)融合下空間理解的上帝視角。

    思考:

    1、虛擬相機(jī)融合多相機(jī)數(shù)據(jù);

    之前搞過雙目視覺和 PointCloud 3D SLAM,但是,從特斯拉基于攝像頭的自動(dòng)駕駛技術(shù)問世,我從沒想過把這兩個(gè)領(lǐng)域結(jié)合起來。其實(shí),回頭看這兩個(gè)技術(shù)的結(jié)合是非常自然的,畢竟 SLAM 源于 ROS 機(jī)器人操作系統(tǒng)的興起,彼時(shí)對(duì)空間理解的迫切需求,至今仍在掃地機(jī)器人、穿越機(jī)等領(lǐng)域長盛不衰。

    2、物理運(yùn)動(dòng)學(xué)知識(shí)嵌入算法模型;

    知識(shí)嵌入算法模型近期很火。在不斷以 SOTA 攻克自然語言、圖像、自動(dòng)化、化學(xué)、醫(yī)藥等領(lǐng)域 AI 高歌猛進(jìn)的時(shí)代,我經(jīng)歷了從皮爾遜相關(guān)度和歐幾里得距離的協(xié)同推薦,到支持向量機(jī)、多層感知器、端到端的深度神經(jīng)網(wǎng)絡(luò)、QLearn強(qiáng)化學(xué)習(xí)、DeepQLearn深度強(qiáng)化學(xué)習(xí)、卷積、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制等,再到神經(jīng)網(wǎng)絡(luò)架構(gòu)的靜態(tài)圖計(jì)算、動(dòng)態(tài)圖計(jì)算、量子計(jì)算等,AI 領(lǐng)域也在隨之發(fā)生著微妙的變化。

    知識(shí)嵌入正是這些變化中,近一段時(shí)間出現(xiàn)在頂會(huì)論文里較多的。知識(shí)嵌入我個(gè)人理解最大的好處是在于可解釋性、可控性提升。所謂可解釋性提升,是指知識(shí)嵌入能夠?qū)⒃居缮窠?jīng)網(wǎng)絡(luò)擬合的各種參數(shù),部分被嵌入的知識(shí)所約束,從而將擬合、優(yōu)化的方向限定在先驗(yàn)知識(shí)的約束內(nèi)。所謂可控性提升,是指知識(shí)嵌入對(duì)神經(jīng)網(wǎng)絡(luò)擬合的約束范圍調(diào)控,事實(shí)上在控制模型的精度。類似知識(shí)嵌入的頻繁提及和應(yīng)用,昭示了 AI 的算法模型、框架乃至硬件加速電子電路等,都在朝著更精細(xì)化、工程化和實(shí)用化的方向悄然變化。

    #Google 量子計(jì)算框架Cirq示例# https://quantumai.google/cirqimport cirq# Pick a qubit.qubit = cirq.GridQubit(0, 0)# Create a circuitcircuit = cirq.Circuit(cirq.X(qubit)**0.5,# Square root of NOT.cirq.measure(qubit, key=’m’)# Measurement.)print(“Circuit:”)print(circuit)# Simulate the circuit several times.simulator = cirq.Simulator()result = simulator.run(circuit, repetitions=20)print(“Results:”)print(result)

    3、特征堆棧優(yōu)化記憶平衡性能;

    堆棧其實(shí)沒什么,但為什么是27ms壓棧一次呢?我相信這背后有大量的測(cè)試、驗(yàn)證和優(yōu)化。其實(shí),如果把自己帶入到駕駛場景,記住周圍環(huán)境并在駕駛中不斷調(diào)整自己的預(yù)測(cè),已經(jīng)是老司機(jī)的下意識(shí)反應(yīng)了。而算法工程師和軟件工程師們,常常割裂、技術(shù)的定義和解決問題,往往容易忽視這些身邊顯而易見、樸素的事實(shí)。

    我認(rèn)為讓模型替代人在駕駛等場景思考,首先要讓模型像這些專業(yè)人士一樣進(jìn)行專業(yè)的思考。比如,我們?cè)?imgcook.com 的 D2C 設(shè)計(jì)稿生成代碼能力研發(fā)中,浙江大學(xué)的老師和同學(xué)并不懂前端,在定義和解決問題的時(shí)候往往是從學(xué)術(shù)和技術(shù)的角度孤立視角下解決問題,效果往往不盡如人意。但因?yàn)樗麄兪菍<?,又很難深刻理解我的一些建議。在應(yīng)用 AI 和機(jī)器學(xué)習(xí)技術(shù)的時(shí)候,我認(rèn)為前提是對(duì)應(yīng)用對(duì)象領(lǐng)域的深刻思考,這些深刻思考才能定義出真正的、專業(yè)的問題,并讓算法模型像專家一樣思考。

    4、多模型、多模態(tài)融合下空間理解的上帝視角。

    其實(shí),我們已經(jīng)漸漸變成了超人,當(dāng)然,不是內(nèi)褲外穿、披著斗篷、眼睛射激光的那種,而是千里眼、順風(fēng)耳、萬事通等。只要打開視頻通話,我就可以和遠(yuǎn)在深圳的老婆孩子處于同一個(gè)數(shù)字空間,彼此能夠聽見、看見。最近,臉書收購了一家提供觸覺仿真的公司,可能不遠(yuǎn)的將來我還能在數(shù)字空間里品評(píng)一下老婆買的裙子料子不錯(cuò)。信息從互聯(lián)網(wǎng)時(shí)代開始,在 Web 2.0 繁榮,到如今的過載??梢哉f,只要你愿意花點(diǎn)兒時(shí)間,總是能夠獲取到萬事萬物的信息。前陣子在 B 站上,學(xué)習(xí)了大連理工大學(xué)方老師的《現(xiàn)代顯微成像技術(shù)》,讓我知道了:傅里葉變換除了理解信號(hào)時(shí)域和頻域變化外,還能夠理解信息在空間里的概率分布,如單光子成像的空間信息分布等。萬事萬物和我之間已經(jīng)沒有距離,只要我們同在數(shù)字空間里,或許這就是世界對(duì)元宇宙的期待之根源吧。

    我依稀記得當(dāng)年玩極品飛車,我還是喜歡第三人稱視角而不是主視角。主視角帶來的是沉浸感,讓玩家覺得投入和刺激。第三人稱視角則接近于上帝視角,讓我能夠更好地判斷周圍的環(huán)境,從而提前選擇入彎的時(shí)機(jī)和角度。而我從沒想到,特斯拉竟然幫我實(shí)現(xiàn)了在現(xiàn)實(shí)生活中獲得這種超能力的夢(mèng)想,我的技能樹又點(diǎn)上了一個(gè)有趣的分支。

    啟發(fā):

    首先,萬物皆 Stream 一樣用 Vector 把不同的特征、算法模型聯(lián)系起來,系統(tǒng)化解決問題是對(duì)我的啟發(fā)。雖然,之前對(duì) Ada Net 的 SubNet Search、AutoML、聯(lián)邦學(xué)習(xí)等技術(shù)有過研究,但特斯拉的做法更實(shí)際、更貼近問題和場景,而不僅僅是在純技術(shù)層面考慮問題。

    其次,當(dāng)我把《我是個(gè)怪圈》、羅素悖論、哥德爾不完備定理、集合論和自然數(shù)論的危機(jī)聯(lián)系在一起,再想想特斯拉的很多做法,讓我愈發(fā)對(duì)“內(nèi)觀俯察”篤定不已。一切都在于“自指向性”帶來的強(qiáng)大破壞力和強(qiáng)大創(chuàng)造力??赡芤?yàn)槌砷L歷程坎坷,自幼就習(xí)慣于在自己身上找問題、改變自己適應(yīng)環(huán)境以生存下去。但是,觀察四周真正理解自指向性、內(nèi)觀俯察的技術(shù)人不常有,有則皆是我學(xué)習(xí)的榜樣。就像特斯拉,并沒有沉浸在海量數(shù)據(jù)和 ShadowSystem 帶來的巨大成就,而是進(jìn)一步下沉貼近駕駛者和駕駛場景,去解決駕乘本身和車與環(huán)境的問題。我在這方面做得還遠(yuǎn)遠(yuǎn)不夠,技術(shù)慣性和技術(shù)偏執(zhí)還時(shí)常如迷霧縈繞。

    最后,突破人的慣性思維。今天,不論是內(nèi)涵還是外延“人”已經(jīng)不再是簡簡單單的雙足直立行走會(huì)使用工具等定義了。但是,不可否認(rèn)的是作為靈長類動(dòng)物我與生俱來的優(yōu)越感和慣性,限制了我的思想?!吧系垡暯恰焙唵蔚乃膫€(gè)字,其實(shí)突破了對(duì)人的認(rèn)知和慣性,上帝、外星人可能就是未來的人類而已,就像無數(shù)科幻小說中的構(gòu)想成為現(xiàn)實(shí),蜥蜴人可能并不是老高說的藏在地底的外星人,而是未來某些人類希望外表更酷做的基因改造或換裝、Avatar 而已。因此,這種視角下重新看待手上的業(yè)務(wù),我能否用技術(shù)讓淘寶變成用戶手里的阿拉丁神燈,摸一摸就能變出自己想要的東西?雖然是個(gè)比喻,但超出用戶預(yù)期才是真的體驗(yàn)創(chuàng)新,而實(shí)現(xiàn)它的技術(shù)就是護(hù)城河與核心競爭力。下面,來看看特斯拉在路線規(guī)劃的決策中如何進(jìn)行體驗(yàn)創(chuàng)新的。

    決策

    內(nèi)容:

    觀察:

    1、多目標(biāo)優(yōu)化控制的駕駛平滑性;

    2、“實(shí)用的自動(dòng)駕駛”實(shí)現(xiàn)智能會(huì)車;

    3、導(dǎo)航能力協(xié)同解決局部最小值問題。

    思考:

    1、多目標(biāo)優(yōu)化控制的駕駛平滑性;

    安全性、舒適性和轉(zhuǎn)彎便利性多目標(biāo)優(yōu)化控制下的平滑駕駛,蘊(yùn)含了豐富的科技人文思考。加速會(huì)帶來推背感,爽!加速轉(zhuǎn)彎呢?剎車呢?不爽!可是,在城市擁塞的車流中,錯(cuò)過變道的機(jī)會(huì)可能會(huì)更加不爽吧?當(dāng)然,安全還是要放到第一,爽著、爽著人沒了也不行。

    但是,我發(fā)現(xiàn)多目標(biāo)優(yōu)化控制其實(shí)是非常難的。比如,在芯片領(lǐng)域 PPA(Performance性能、Power功耗、Area尺寸)問題、在算法領(lǐng)域精度和泛化能力問題、搜索推薦的精度和重復(fù)、探索型匱乏之間的矛盾問題等等,只要稍微留意一下周圍,我就能發(fā)現(xiàn)眾多類似的問題。因?yàn)?,簡單的問題都解決得七七八八,留給我們的都是復(fù)雜的、系統(tǒng)性的問題。

    說到系統(tǒng)性問題,就不得不提維納的《控制論》,如何把復(fù)雜系統(tǒng)符號(hào)化并進(jìn)行數(shù)學(xué)分析,理解系統(tǒng)的應(yīng)用對(duì)象、瞬態(tài)、穩(wěn)態(tài)、性能參數(shù)、穩(wěn)態(tài)誤差、PID 控制、根軌跡和勞斯-赫爾維茨公式判據(jù)法選取合適開環(huán)增益等等。還有現(xiàn)代控制論中:時(shí)域綜合方法里狀態(tài)反饋、輸出反饋、極點(diǎn)配置、觀測(cè)器、解耦控制、最優(yōu)控制等;頻域綜合方法里調(diào)節(jié)器超前、滯后、超滯后、Bode圖、Nichols圖、多項(xiàng)式矩陣綜合方法等。

    留心細(xì)看,我總能在特斯拉的工程實(shí)踐中找到這些理論和方法的影子,這是在一眾國內(nèi)自動(dòng)駕駛公司的 PPT 和演講中看不到的,國內(nèi)公司看到的更多是跟隨、應(yīng)用、優(yōu)化,為什么?因?yàn)椋夹g(shù)變革初期和中期成功太容易了,真正沉下心“自指向性”的“內(nèi)觀俯察”搞研究的人,往往被認(rèn)作“不是瘋了就是傻了”,大家都撈錢去了。如今,從 Matlab、Sketch、EDA 等軟件再到芯片等硬件,被卡脖子的時(shí)候,很多大數(shù)據(jù)、新能源、智慧城市啥的赤裸著身子站在沙灘上茫然無措。反觀特斯拉的技術(shù)團(tuán)隊(duì),能夠從方案的思考和實(shí)現(xiàn)細(xì)節(jié)上尋得的蛛絲馬跡,無不透露出其對(duì)基礎(chǔ)知識(shí)和底層原理的重視,以及團(tuán)隊(duì)扎實(shí)的功底。

    2、“實(shí)用的自動(dòng)駕駛”實(shí)現(xiàn)智能會(huì)車;

    其實(shí),看直播中的視頻畫面會(huì)更有體感,我簡單用文字描述一下:AutoPilot 先減速觀察對(duì)面企圖通行的轎車,發(fā)現(xiàn)轎車停下,立即毫不猶豫地開到其面前的右側(cè)空位讓其通過,然后自己并線后駛離。說真的,估計(jì)我這個(gè)開了十幾年車的老司機(jī)都沒 AutoPilot 這么果敢、流暢。這背后,我的感受是特斯拉對(duì)實(shí)用主義原則的堅(jiān)持。不管是特斯拉的自動(dòng)駕駛、超級(jí)工廠、SpaceX 的火箭回收、Boring 的 Hyperloop 還是最新的一體化房屋,無處不透露著實(shí)用主義,大部分都在解決資金、人力和時(shí)間成本問題。

    駕駛領(lǐng)域的基本問題就那么多,上過駕校且經(jīng)歷過筆試、路考的話大抵都門兒清??勺鲎詣?dòng)駕駛的團(tuán)隊(duì)們大多買個(gè)激光雷達(dá)往車頂一裝,車上搞個(gè)車機(jī)跑個(gè)端到端的強(qiáng)化學(xué)習(xí)模型了事,然后就去忽悠投資人和老板。我很少聽自動(dòng)駕駛技術(shù)團(tuán)隊(duì),站在駕駛場景里實(shí)實(shí)在在討論駕駛的問題,更多的是在宣傳自己的算法多牛逼、準(zhǔn)確率召回率有多高云云。

    3、導(dǎo)航能力協(xié)同解決局部最小值問題。

    這塊兒沒太多好說的,不能只見樹木不見森林,全局最優(yōu)和跨技術(shù)棧的協(xié)同良好解決了問題。

    啟發(fā):

    馬斯克說他眼中的“第一性原理思維模型”是:回溯事物本質(zhì),重新思考該怎么做。什么叫回溯事物本質(zhì),其實(shí)就是要對(duì)事物最基本要素進(jìn)行解構(gòu)。第一性原理就是建立在這種解構(gòu)基礎(chǔ)上,找到實(shí)現(xiàn)目標(biāo)最優(yōu)路徑的方法。此哲學(xué)觀點(diǎn)源于亞里士多德:“每個(gè)系統(tǒng)中存在一個(gè)最基本的命題,他不能被違背或刪除?!?/p>

    馬斯克對(duì)這個(gè)觀點(diǎn)的運(yùn)用,在特斯拉電動(dòng)車普及上,起到了關(guān)鍵作用。其時(shí),馬斯克回溯阻礙電動(dòng)車普及的問題,發(fā)現(xiàn)鋰電池價(jià)格昂貴影響大眾消費(fèi)意愿,能量密度低影響續(xù)航。而這兩個(gè)實(shí)用的“最基本命題”,經(jīng)過馬斯克對(duì)電池原材料、制造工藝的解構(gòu),自建超級(jí)工廠研發(fā)制造不僅采購成本下降 30% 還自主可控的迭代能量密度。當(dāng)然,最新的電動(dòng)車電機(jī)碳纖維套筒也是類似。只要稍微花點(diǎn)兒時(shí)間,我發(fā)現(xiàn)從發(fā)夾電極、定子永磁體封裝和排列、降溫油管道和位置、碳纖維套筒等等,特斯拉真的是在每個(gè)“最基本命題”上把實(shí)用主義和第一性原理發(fā)揮到極致。

    反觀自己,十年前 GDB 一行行查匯編指令去摳幾十 KB 內(nèi)存的精神今天已蕩然無存,每次開會(huì)討論的都是:能做還是不能做?你做還是我做?排期對(duì)不對(duì)得上?你改還是我改?哎……雖然我承認(rèn)有些事情不應(yīng)該用老眼光看待,或許應(yīng)用比底層更容易出成績,但是,Google 在為 C/C++ 推出繼任者 Carbon,The V Programming Language 都已經(jīng)出 Vinix 并且完成了 X.org 的支持,社區(qū)已經(jīng)完成了 Stable Diffusion 對(duì) M1 芯片的支持,在蘋果 M1 芯片的筆記本上 15 秒就可以生成圖片。(用 M1 的小伙伴兒請(qǐng)看:https://www.toutiao.com/article/7138755607221748264/)在自己的領(lǐng)域內(nèi)產(chǎn)出一些真正有價(jià)值、實(shí)用且基本的技術(shù),將是 imgcook.com 的 D2C 需要思考的問題。

    標(biāo)注

    內(nèi)容:

    觀察:

    特斯拉標(biāo)注的不是數(shù)據(jù),是對(duì)多特征融合的理解,以此訓(xùn)練的 AutoPilot 在路上“全知全能”。

    思考:

    前文上帝視角是怎么產(chǎn)生的?創(chuàng)新的數(shù)據(jù)標(biāo)注功不可沒。比如,時(shí)空里一輛車駛過路口,路人或車輛被遮擋后特征和場景的時(shí)空關(guān)系發(fā)生了什么變化?如何理解這種變化對(duì)駕駛的影響并將其標(biāo)注出來?定義問題、用標(biāo)注數(shù)據(jù)描述問題、用模型解決問題被放在一起,還解決的很好,強(qiáng)!

    啟發(fā):

    忽的想起小時(shí)候,雄心壯志且信誓旦旦的把機(jī)械鬧鐘拆開發(fā)誓要修好,數(shù)十年后那些齒輪、機(jī)簧還在靜靜躺在抽屜里。我老臉一紅,想想特斯拉的天才工程師們,把這么復(fù)雜的系統(tǒng)有條不紊的協(xié)同在一起,共同的、實(shí)用的、深入且細(xì)致的解決一個(gè)個(gè)“基本命題”,不禁有些汗顏。近期在推動(dòng)設(shè)計(jì)生產(chǎn)一體化解決業(yè)務(wù)需求迭代問題,我也想業(yè)務(wù)和產(chǎn)品能夠參與到產(chǎn)品研發(fā)中,一體化分析、定義、設(shè)計(jì)、約束、生成、發(fā)布、驗(yàn)證、迭代產(chǎn)品的 UI、交互,讓用戶獲得更優(yōu)秀且個(gè)性化的信息表達(dá)從而提升瀏覽體驗(yàn)??吹教厮估墓ぷ鞲訄?jiān)定了我的信心,畢竟到了深水區(qū),需要對(duì)產(chǎn)品和業(yè)務(wù)精雕細(xì)琢的時(shí)候了。

    仿真

    內(nèi)容:

    觀察:

    用光線追蹤提升模擬的實(shí)用性。

    思考:

    看到特斯拉的演示,回想起之前看過的自動(dòng)駕駛技術(shù)分享,高下立判。撇開攝像頭和激光雷達(dá)之爭不談,單純從模擬技術(shù)來看就差了一大截。我從沒看到那個(gè)自動(dòng)駕駛技術(shù)團(tuán)隊(duì)分享時(shí)強(qiáng)調(diào)模擬的精確性,而且,這里精確性是從識(shí)別方案的第一性原理出發(fā)。如果說攝像頭的原理,就是感光元件捕獲光線這種特殊的電磁波產(chǎn)生電信號(hào)再 ADC 模數(shù)轉(zhuǎn)換后產(chǎn)生數(shù)字信號(hào),這些數(shù)字信號(hào)就是我們所謂的圖像,因此,光線的真實(shí)性直接決定了這些數(shù)字信號(hào)的信噪比,信噪比決定了模型用這些信號(hào)訓(xùn)練的效果。

    然而,數(shù)字信號(hào)包含的信息量巨大,除了電子波頻率、電磁波強(qiáng)弱還有很多可分辨的信息,比如前文中說空間中光的信號(hào)傅里葉分析等,擁有巨大的改進(jìn)空間。而激光雷達(dá)的原理是什么?發(fā)出激光根據(jù)發(fā)射角度和反射回來的時(shí)延和角度來計(jì)算一個(gè)點(diǎn)的位置,從而得到精確位置信息,能夠直接采集點(diǎn)云 PointCloud 而不用視覺方案里復(fù)雜的校準(zhǔn)和計(jì)算,多簡單?但是,應(yīng)用的簡單背后其實(shí)是簡陋,很多人其實(shí)誤解了視覺方案的含金量。這就像拿 Kindle 的屏幕和 iPhone 的屏幕對(duì)比,高下立判、云泥之別。

    啟發(fā):

    在實(shí)現(xiàn)設(shè)計(jì)稿生成代碼的時(shí)候,模型訓(xùn)練中并沒有模擬能力。輸入的是設(shè)計(jì)稿,怎么能夠生成接近真實(shí)卻又能夠難到模型、啟發(fā)算法的設(shè)計(jì)稿?應(yīng)該是個(gè)不錯(cuò)的思路。其實(shí),再稍微延展一下,日常的自動(dòng)化測(cè)試亦如此,怎么模擬用戶真實(shí)的環(huán)境?真實(shí)的操作?如何才能真實(shí)?如何將模擬的設(shè)計(jì)和軟件設(shè)計(jì)、程序設(shè)計(jì)、接口設(shè)計(jì)等聯(lián)系起來?才是真正有趣的事兒。

    計(jì)算加速

    內(nèi)容:

    觀察:

    1、OP 的電子電路化是 NPU 大趨勢(shì);

    2、夸張的帶寬和創(chuàng)新的垂直供電冷卻系統(tǒng);

    3、易用性夸張到框架后端設(shè)置一下即可;

    4、任意縮放。

    思考:

    自從曠視科技和商湯讓攝像頭可以磨皮開始,AI 對(duì)消費(fèi)電子的滲透就已經(jīng)勢(shì)不可擋。從個(gè)人電腦的顯卡加速運(yùn)算到ARM 的 Neon 指令集,再疊加云計(jì)算和最近的元宇宙,讓整個(gè)世界變成了算力黑洞。大體看兩大陣營:通用硬件加速和專用硬件加速,世界的奇妙輪回把 GPU 從 CPU 分化的路又走了一遍,只是,這次是在 Nvidia 在 Cuda 和 AMD 跟進(jìn)的 ROCM 為始,慢慢從 GPU 里分化出來。

    通用硬件加速的好處就是應(yīng)用廣泛,但勢(shì)必在性能上比專用硬件加速差,甚至在一些情況下可能還不如 DSP,這也是為何 Apple 的芯片保留 DSP 和一眾專用芯片的原因:更低功耗、更快速度。但是,在大多數(shù)情況下圖計(jì)算需要的硬件加速能力差異被上層機(jī)器學(xué)習(xí)框架所屏蔽了,因此才會(huì)有 JAX 和 TVM 等技術(shù),這也是標(biāo)準(zhǔn)的力量。特斯拉的 Dojo 受益于這些紅利,設(shè)計(jì)研發(fā)了自己的通用硬件加速芯片,料堆滿、帶寬拉滿、模塊化縮放,怎么看都像極了 Apple 的 M 系列自研處理器,M1、M1 Pro、M1 Max、M1 Ultra。從 iPad、MacBook Air、MacBook Pro 到 Mac Studio,特斯拉也是從擎天柱機(jī)器人、特斯拉汽車到超算中心,一套方案縮放應(yīng)用到不同場景。

    啟發(fā):

    首先,D2C 現(xiàn)在主要解決的是前臺(tái)業(yè)務(wù)問題,未來,是否可以模仿特斯拉芯片的一套方案縮放應(yīng)用到不同場景?比如在源碼頁面、搭建頁面、中后臺(tái)頁面、承接頁等,縮放 D2C 技術(shù)體系的能力,而不需要重新設(shè)計(jì)研發(fā)。

    其次,在廣州 UC 的時(shí)候就經(jīng)常和身邊的小伙伴兒們一起 YY,如何用光計(jì)算替代現(xiàn)有的電子電路。說白了從電子管到晶體管之后,濕法光刻和極紫外光也基本到頭了,這兩天看新聞上各芯片制造企業(yè)都在探索光計(jì)算領(lǐng)域。如果未來有機(jī)會(huì)做芯片的話,我一定會(huì)嘗試一下物理計(jì)算,把我對(duì)計(jì)算本質(zhì)的理解和對(duì)物理的理解融合起來做點(diǎn)兒有意思的事情。喜歡下圖的小伙伴兒可以私信聊聊,:)。

    擎天柱

    內(nèi)容:

    觀察:

    那么,當(dāng)勞動(dòng)力不短缺時(shí)會(huì)發(fā)生什么?當(dāng)程序員不加班時(shí)會(huì)發(fā)生什么?當(dāng)業(yè)務(wù)不再半夜匯報(bào)方案會(huì)發(fā)生什么?當(dāng)然是去玩兒啦!不然呢?小扎把臉書公司名字都改了,難道大家都瘋了?美國經(jīng)濟(jì)脫虛向虛難道那么多名校、智庫和學(xué)者都是傻子?一定有什么我不理解的東西存在,嗯!我估計(jì)是精神層面消費(fèi)的崛起。

    思考:

    從 ROS 開始就對(duì)機(jī)器人技術(shù)很感興趣,之前做雙目視覺和 SLAM 就是從編譯 ROS 開始的。實(shí)時(shí)操作系統(tǒng)無論是設(shè)計(jì)還是實(shí)現(xiàn)上,都和我們所熟悉的操作系統(tǒng)有巨大差異,疊加上特斯拉汽車會(huì)穿梭于城市的安全性要求,可以想見特斯拉在實(shí)時(shí)操作系統(tǒng)領(lǐng)域的強(qiáng)大實(shí)力。而 AutoPilot 又賦予了實(shí)時(shí)操作系統(tǒng)以實(shí)時(shí)智能化能力,這就讓自動(dòng)駕駛成為現(xiàn)實(shí)。而 AutoPilot 駕駛汽車還是駕駛一具人形機(jī)器,解決的“基本命題”是一致的。

    同時(shí),用人形機(jī)器人替代人從事一些勞動(dòng),實(shí)用場景比掃地機(jī)器人、擦玻璃機(jī)器人等可廣泛太多了,很實(shí)用。全球勞動(dòng)力人口約 34.5億(數(shù)據(jù)來源世界銀行:https://data.worldbank.org.cn/indicator/SL.TLF.TOTL.IN),馬斯克很可能借助擎天柱成為全球最大的勞務(wù)公司,用擎天柱進(jìn)行勞務(wù)輸出。

    如果工廠里用的是擎天柱機(jī)器人會(huì)怎么樣?7×24 不眠不休、不會(huì)罷工、成本大幅降低等等。哪怕工作內(nèi)容復(fù)雜,像美軍遠(yuǎn)程操作無人機(jī)一樣,雇個(gè)人在家里遠(yuǎn)程操作擎天柱完成勞動(dòng)生產(chǎn),也會(huì)大幅度降低成本且改善工作環(huán)境,比如遠(yuǎn)程挖煤、遠(yuǎn)程保潔等。當(dāng)然,家庭環(huán)境端茶倒水、收拾房子、買菜做飯等,也能夠大幅度提升生活質(zhì)量。

    估計(jì),未來可能會(huì)有公司買一些擎天柱去給人當(dāng)做飯阿姨,現(xiàn)在雇個(gè)阿姨每天做兩頓飯需要 5k 一個(gè)月,擎天柱 2k 一個(gè)月還是很有吸引力的。就像特斯拉股價(jià)大跌的 2016 年初我跟靜靜說我看好特斯拉一樣,如果擎天柱這事兒能像汽車一樣一步一個(gè)腳印,特斯拉的未來會(huì)更猛。除了行業(yè)機(jī)會(huì),最重要的是特斯拉這群實(shí)用主義和第一性原理奉為神祇的工程師。當(dāng)然,馬斯克作為一個(gè)專業(yè)的老板,也很重要。這次 AI-Day 上馬斯克一如既往地?fù)尨?,但專業(yè)的回答無不透著他對(duì)技術(shù)細(xì)節(jié)的理解和解構(gòu)能力。

    啟發(fā):

    如果地雷是最簡單的機(jī)器人,擎天柱是智能人形機(jī)器人,imgcook.com 就是設(shè)計(jì)稿生成代碼機(jī)器人。我覺得機(jī)器人只是個(gè)概念,就像客服機(jī)器人一樣,智能化軟件本質(zhì)上就是個(gè)數(shù)字機(jī)器人。那么,擎天柱是馬斯克在特斯拉之外找到的延伸領(lǐng)域,imgcook 設(shè)計(jì)稿生成代碼機(jī)器人的底層能力是否能找到一個(gè)全新的延伸領(lǐng)域?我打算好好琢磨琢磨。

    其實(shí),我覺得擎天柱也是第一性原理的產(chǎn)物。如果把特斯拉解構(gòu)一下,電機(jī)、驅(qū)動(dòng)、電池、電控、實(shí)時(shí)操作系統(tǒng)、智能體,這些都是特斯拉長期沉淀的能力,如果把他們放在人形機(jī)器人上,幾乎是可以不做任何修改平移的。因此,馬斯克和這群優(yōu)秀的工程師或許就是這樣得到靈感的吧?

    結(jié)語:腳踏實(shí)地仰望星空

    首先,腳踏實(shí)地容易理解,字里行間到處都透著實(shí)用主義。畢竟是工程師不是科研人員,做工程不同于學(xué)術(shù)研究,實(shí)用是基本要求。不論是基于特征向量構(gòu)建的復(fù)雜智能體,還是在決策智能的安全、體驗(yàn)和效果多目標(biāo)優(yōu)化,以及在標(biāo)注、仿真等方面的務(wù)實(shí)創(chuàng)新,再到硬件加速芯片的垂直供電制冷和縮放,以及復(fù)用現(xiàn)有能力延伸到全新賽道替代人勞動(dòng)。處處是創(chuàng)新,但處處都是在解決“基本命題”。

    其次,仰望星空。推廣清潔能源保護(hù)地球,探索宇宙殖民火星給人類創(chuàng)造兜底方案,用機(jī)器人替代人做低價(jià)值的勞動(dòng),每一件事都描繪了一幅宏偉的藍(lán)圖。為什么特斯拉有這么多優(yōu)秀的工程師?因?yàn)?,他們真的在踐行這些藍(lán)圖,這份赤子之心能夠感染、吸引和凝聚世界最頂尖的人才。

    最后,小小的我也有大大的夢(mèng)想,雖然我不能像喬布斯、馬斯克和特斯拉工程師們一樣優(yōu)秀,但是,我希望在自己的技術(shù)工程領(lǐng)域和業(yè)務(wù)場景中,效仿他們用實(shí)用主義和第一性原理,堅(jiān)定的、務(wù)實(shí)的去做點(diǎn)兒有價(jià)值的事情。給自己加油!

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
    上一篇 2022年9月9日 15:35
    下一篇 2022年9月9日 15:35

    相關(guān)推薦

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息