果然只有雷軍和小米,能搶走風(fēng)口上大模型的熱度。
在雷軍的年度演講分享中,講武大求學(xué)經(jīng)歷,分享學(xué)霸4年大學(xué)2年完課經(jīng)驗(yàn);講被《硅谷之火》點(diǎn)燃,勤奮練習(xí)寫最好的代碼,開啟第一次創(chuàng)業(yè)的往事;最后加入金山、創(chuàng)辦小米,一路堅(jiān)持夢想、實(shí)現(xiàn)夢想、不斷成長的知行合一……
于是雷軍超燃演講刷屏之下,自家大模型前腳刷新的紀(jì)錄、引發(fā)的熱議,都被蓋過了。
不僅如此,發(fā)布會上一系列小米技術(shù)的最新進(jìn)展,也被蓋過了——但再回頭來看,其實(shí)都很重要很值得關(guān)注,比如AI大模型裝進(jìn)手機(jī)、小愛同學(xué)的大模型升級、仿生四足機(jī)器人新落地……
以及雷軍還親自公布了小米的科技戰(zhàn)略、AI公式,AI即將對小米展開的全方位刷新。
這也是為什么小米的這波AI新進(jìn)展值得詳談。
我們先從四兩撥千斤的小米大模型說起。
AI全面賦能,把大模型塞進(jìn)手機(jī)
小米自研大模型MiLM,在雷軍演講前一日就現(xiàn)身GitHub,也卷也不卷。
不卷在規(guī)模,主打6B、1.3B(64億參數(shù),13億參數(shù))版本,妥妥的輕量級選手。
卷在了性能,把更小巧的1.3B參數(shù)版本塞進(jìn)手機(jī),做到在很多場景上可以媲美云端大模型效果。
小米大模型團(tuán)隊(duì)由欒劍帶隊(duì),向小米集團(tuán)技術(shù)委員會AI實(shí)驗(yàn)室主任王斌博士匯報。從今年4月開始研發(fā),短短4個月時間已經(jīng)交卷。
成績?nèi)绾?,先上評測結(jié)果:
6B參數(shù)版本,在C-eval權(quán)威榜單上取得同參數(shù)量級排名第一,CMMLU中文向大模型取得排名第一。
具體來說,C-eval數(shù)據(jù)集是一個全面的中文基礎(chǔ)模型評測數(shù)據(jù)集,涵蓋了52個學(xué)科和四個難度的級別。
CMMLU 數(shù)據(jù)集是一個綜合性的中文評估基準(zhǔn),專門用于評估語言模型在中文語境下的知識和推理能力。CMMLU涵蓋了從基礎(chǔ)學(xué)科到高級專業(yè)水平的67個主題。
自去年11月ChatGPT來襲,最先行動起來的多是云計算公司如微軟谷歌亞馬遜。
但隨著技術(shù)進(jìn)一步成熟,端側(cè)大模型成為行業(yè)下一個發(fā)力點(diǎn),蘋果方面已有傳聞,而小米搶先跑進(jìn)第一梯隊(duì)。
把大模型塞到手機(jī)里,好處在哪?
首先,本地運(yùn)行不用擔(dān)心信號差、飛機(jī)無網(wǎng)絡(luò)等情況,且響應(yīng)速度更快。
同時,用戶隱私更有保障,也便于提供更個性化的服務(wù)。
總結(jié)一下就是:隨時隨地享受AI帶來的先進(jìn)生產(chǎn)力。
與此同時,量子位也獲得了新版小愛同學(xué)邀測資格。
還是那個熟悉的聲音,不過在大模型加持下,小愛同學(xué)真的可以說進(jìn)化成智能助手了 。
先按能力推薦,解釋一下最近很火的超導(dǎo)概念,不成問題。
還記得當(dāng)初難倒一眾國內(nèi)外大模型的弱智吧難題“我爸媽結(jié)婚為什么不邀請我”嗎?
小愛同學(xué)表示根本不上這個當(dāng)好吧。
如果一時不知道小愛大模型還有什么玩法,也可以來到探索專區(qū)找找靈感。
從這里也可以看出,小愛大模型還與系統(tǒng)做了一定程度的融合。
比如在小米金牌客服模式,剛剛上新沒幾天的旗艦折疊手機(jī)也介紹的頭頭是道,并能一鍵跳轉(zhuǎn)去商城。
據(jù)小米透露,小米搞大模型就是瞄準(zhǔn)系統(tǒng)級能力,或許未來整個手機(jī)操作系統(tǒng)都會像這樣進(jìn)化成“智能操作系統(tǒng)”也說不定。
但手機(jī)大模型并不是小米AI唯一的發(fā)力方向,這次一起亮相的機(jī)器狗二代鐵蛋就藏著不少AI秘密。
為什么二代鐵蛋能比一代體型更小、運(yùn)動能力更強(qiáng)呢?
背后小米自研的CyberGear力控微電機(jī),就是通過AI算法模擬,讓電機(jī)在性能優(yōu)化的同時,還輕了20%。
行為方面為了更加仿生,小米也基于真狗的動作,在小米機(jī)器人強(qiáng)化學(xué)習(xí)平臺,模擬了3萬只機(jī)器狗進(jìn)行并行訓(xùn)練。
AI技術(shù)像這樣離開純虛擬環(huán)境,來到手機(jī)、機(jī)器狗,未來到更多智能家居設(shè)備上,不單純是一種“賦能”,還能發(fā)現(xiàn)新的創(chuàng)新優(yōu)化方向。
過去我們就曾看到,小愛同學(xué)語音交互技術(shù)用在機(jī)器狗上,就與手機(jī)、音箱的環(huán)境大不一樣。
機(jī)器狗自身會移動,也常出現(xiàn)在室外噪音較大的環(huán)境,給語音識別和降噪算法提出了更高的要求,反過來推動了算法的進(jìn)化。
語言大模型、多模態(tài)大模型將來同樣會遇到類似的情況,最終把新應(yīng)用場景需要的特性內(nèi)化到模型本身。
這也就是學(xué)術(shù)界也在探索的具身智能,大模型之后最重要的新方向之一了。
我們可以看到,今年小米發(fā)布會除了新機(jī)型之外,AI的比重明顯更高了。
對于背后更深層次的思考,雷軍從一個公式開始講起。
小米的科技戰(zhàn)略,為什么有AI次方?
在小米給出的(軟件×硬件)??公式里暗含了一層意思:
這也更進(jìn)一步體現(xiàn)出小米對于AI的重視。
而背后原因不難理解,結(jié)合AI趨勢本身的發(fā)展以及小米所處終端市場的動向,便能找到答案。
先來看AI領(lǐng)域內(nèi)。
大模型趨勢之所以轟轟烈烈,是因?yàn)樗o技術(shù)底層、行業(yè)應(yīng)用都帶來深刻影響。
一方面,ChatGPT騰空出世驗(yàn)證了當(dāng)模型規(guī)模突破一定量級后,會出現(xiàn)智能涌現(xiàn)的現(xiàn)象。這種特性讓大模型具備“舉一反三”的能力,更進(jìn)一步讓AI應(yīng)用規(guī)?;涞爻蔀榭赡堋?/p>
同時ChatGPT、Stable Diffusion也推動AI向生成式方向發(fā)展。當(dāng)AI具備更豐富的創(chuàng)造力后,人機(jī)交互方式也會因此發(fā)生改變。最直觀的體現(xiàn)便是當(dāng)智能助手接入大模型后,能推動人機(jī)交互向更加自然便捷的語言溝通方式發(fā)展。
另一方面,ChatGPT引發(fā)全球全社會熱議,讓AI概念迅速破壁,走進(jìn)千行百業(yè)和普羅大眾認(rèn)知中,這使得AI應(yīng)用落地及商業(yè)化腳步加快。
業(yè)內(nèi)普遍認(rèn)為,在基礎(chǔ)大模型之上搭建的行業(yè)大模型,將會成為未來大模型市場中的主要構(gòu)成,也是帶動實(shí)際應(yīng)用的主力之一。
大模型側(cè),廠商們在過去半年來都在積極推動和產(chǎn)業(yè)界合作;垂直領(lǐng)域內(nèi),也有以大模型為底層技術(shù)的玩家開始展露頭角,如InflectionAI—一個主打感情陪伴的聊天機(jī)器人公司估值已達(dá)40億美元。
透過這些當(dāng)下最新的趨勢變化,不難感受到一個事實(shí)——
AI作為一項(xiàng)底層、基礎(chǔ)且核心的技術(shù),正在快速變革當(dāng)下時代。
而在以往技術(shù)周期里,能夠承擔(dān)如此角色的代表技術(shù),分別是蒸汽技術(shù)、電力驅(qū)動、計算機(jī)。
換言之,如今的AI也能如同它們一樣,成為未來生產(chǎn)力,帶來指數(shù)級增長。
那么,怎么利用好這一未來生產(chǎn)力,就成為各行業(yè)當(dāng)下最關(guān)心的事。
以小米所處的終端市場為例,大模型趨勢正在向這里演進(jìn)。
現(xiàn)在,手機(jī)接入大模型成為諸多廠商的“大招”。
不僅是讓智能助手和云端大模型結(jié)合,并從自身場景出發(fā)大力開拓端側(cè)模型。
比如谷歌被視為拿來對標(biāo)GPT-4的PaLM2,就在發(fā)布時推出了最小“壁虎”版本,可在移動設(shè)備上快速運(yùn)行,包括離線狀態(tài),每秒可處理20個token。
更底層的芯片層面,也在為端側(cè)部署大模型做好準(zhǔn)備。
高通目前通過量化、編譯和硬件加速優(yōu)化,能夠在搭載第二代驍龍8移動平臺手機(jī)上,以15步20步推理的速度應(yīng)用Stable Diffusion,生成512×512像素的圖片。
這背后反映出,大模型和手機(jī)終端正在雙向奔赴。
對于大模型來說,手機(jī)場景構(gòu)建了最為豐富、廣闊的移動應(yīng)用,是離普羅大眾最近的一塊屏幕,是大模型加速落地的關(guān)鍵地帶。所以為了適應(yīng)手機(jī)場景,更輕量化、可端側(cè)部署的模型一定要出現(xiàn)。
對于手機(jī)而言,大模型正在加速重構(gòu)移動應(yīng)用、變革人機(jī)交互,手機(jī)行業(yè)一定會受到影響。在激烈變革下,抓住趨勢就能抓住新的增長動力,所以對于手機(jī)乃至終端廠商而言,擁抱大模型也是必然。
綜上,也就不難理解小米的最新動向里,為何AI含量如此高。
無論是推出大模型版小愛同學(xué),還是發(fā)布自研端側(cè)模型,都是從小米自身出發(fā),擁抱趨勢后的成果。
雷軍在今年個人演講中提出(軟件×硬件)??這一公式,也更深入揭示了小米當(dāng)下對于最新AI趨勢的理解。
今年,雷軍的年度演講主題選定了“成長”這一主題,在三小時的演講和年度新品發(fā)布中,他分享了過去30多年經(jīng)歷的幾次關(guān)鍵成長和感悟。
對應(yīng)來看,在這個AI發(fā)展史上一定會被重點(diǎn)標(biāo)記的年份里,小米也站在了新的關(guān)鍵節(jié)點(diǎn)上——
小米集團(tuán)宣布進(jìn)行科技戰(zhàn)略升級,公布科技理念,明確科技探索原則。
而這些新變化里,AI含量非常高。
AI成為新小米的關(guān)鍵變量
在小米最新升級的科技戰(zhàn)略里,確立了四個原則:
深耕底層技術(shù)
長期持續(xù)投入
軟硬件深度融合
AI全面賦能
里里外外傳遞出一層信息:AI將成為新小米的關(guān)鍵變量。
實(shí)際上,趨勢內(nèi)外,小米這次直接生在風(fēng)口里。
首先,最新一波AI浪潮引發(fā)的變革,與小米技術(shù)布局和長板“天然適配”。
在2016年,AlphaGo騰空出世把AI概念更進(jìn)一步推向大眾時,小米成立了首支AI團(tuán)隊(duì)。
當(dāng)時AI趨勢里,深度學(xué)習(xí)和計算機(jī)視覺領(lǐng)域快速發(fā)展,這不僅體現(xiàn)在基礎(chǔ)算法上,也體現(xiàn)在應(yīng)用落地方面。如國內(nèi)AI四小龍,最初都是以計算機(jī)視覺起家。
小米成立的第一支AI團(tuán)隊(duì),錨定的也是計算機(jī)視覺方向。
緊接著2017年,“Attention is all you need”來了。
Transformer架構(gòu)的出現(xiàn),不僅直接推動NLP領(lǐng)域發(fā)展,同樣影響計算機(jī)視覺、語音等領(lǐng)域,更是當(dāng)今AIGC趨勢的核心底層技術(shù)——要知道,目前市面上絕大多數(shù)大模型,底層都是基于Transformer架構(gòu)。
這一年,小米在AI方面的動作更大,正式成立AI實(shí)驗(yàn)室,多方位布局,覆蓋聲學(xué)、語音、NLP、知識圖譜等領(lǐng)域,甚至大模型也被列入其中。
之后幾年里,AI趨勢正酣,有了較為堅(jiān)實(shí)的底層算法做基礎(chǔ),行業(yè)應(yīng)用落地腳步更快,尤其是細(xì)分領(lǐng)域進(jìn)展迅速。
從手機(jī)這一場景來看,典型的兩個例子是智能助手和AI影像。
它們都需要和產(chǎn)品深度結(jié)合,才能完成更進(jìn)一步的探索。這方面,小米AI有布局,更可以說是有長板。
這次全面升級的小愛同學(xué)誕生于6年前,應(yīng)用了小米NLP技術(shù),并為如今大模型的接入應(yīng)用積累了海量場景訓(xùn)練數(shù)據(jù)。AI影像算法方面,小米也專門成立團(tuán)隊(duì),如“夜梟算法”已應(yīng)用在了成熟產(chǎn)品上。
今年4月,小米大模型團(tuán)隊(duì)火速成立,完成了趨勢下的最新一次擴(kuò)展。到如今小米AI團(tuán)隊(duì)規(guī)模已超3000人。
所以AI大模型浪潮,小米生在其間,積累和蓄力早已完成,需要的只是把好鋼用到“刀刃”上,聚集資源實(shí)現(xiàn)更大的突破。
其次,技術(shù)因場景而強(qiáng)大,小米技術(shù)的天然優(yōu)勢背后,核心還是小米業(yè)務(wù)和產(chǎn)品具備的場景優(yōu)勢,而且小米上下都已經(jīng)敏銳地感知到了這一趨勢。
一方面,技術(shù)深入到場景中去,才能發(fā)揮更大價值。
遠(yuǎn)的不說,就說今天最火的概念“大模型”早在2017年就已起步,但一直以來AI研究屆以刷學(xué)術(shù)指標(biāo)測評榜單為主要前進(jìn)方向,并未掀起太多波瀾。
直到ChatGPT以直面普通消費(fèi)者的姿態(tài)問世,才打開聊天機(jī)器人和智能助手的應(yīng)用場景,以及后面的AI物種寒武紀(jì)大爆發(fā),幾乎要把每個行業(yè)改造個遍。
小米多年來正是這個理念的踐行者。這也是為什么最新提出的公式中,(軟件×硬件)作為底數(shù)。
小米的場景天生從軟硬件一體出發(fā),如智能助手小愛同學(xué),擁有1.1億月活用戶,支持5900余款智能設(shè)備。
在多終端方面,“手機(jī)是基本盤,IoT是想象空間”是很多人對小米的描述。
主陣地手機(jī)端,小米就是以軟硬件一體奠定地位的。AIoT方面,雷軍在2013年便看到智能硬件和物聯(lián)網(wǎng)的趨勢,并率先成為AIoT智能生活的定義者。
2021年,雷軍親自掛帥小米造車,補(bǔ)齊了小米在“人車家”的最后一環(huán),由此小米全場景智能生態(tài)構(gòu)建完成。
乃至仿生機(jī)器人方面,小米如今已推出兩代CyberDog、人形機(jī)器人CyberOne,提前布局未來家居場景。
另一方面,技術(shù)深入到場景中去,才有了融合進(jìn)化的空間。
比如小米手機(jī)上廣受好評的“萬物追焦”功能,其實(shí)最早是從CyberDog機(jī)器狗上的“主人追蹤”技術(shù);小米自動駕駛進(jìn)展非常快,得益于2017年創(chuàng)辦的小米人工智能實(shí)驗(yàn)室;同樣,自動駕駛部門的很多技術(shù),也應(yīng)用在CyberOne上,又構(gòu)成了仿生機(jī)器人的大腦。
而在最新大模型趨勢下,如手機(jī)、仿生機(jī)器人等,都是正被廣泛熱議的落地場景。
也正是小米擁有的如此豐富的場景,讓AI的技術(shù)應(yīng)用和迭代更加令人期待,畢竟AI歸本溯源,不論是深度學(xué)習(xí)算法還是如今的大模型范式,背后最核心的競爭力還是基于數(shù)據(jù)的迭代。而小米擁有的場景、終端、數(shù)據(jù)體量,都是AI技術(shù)落地和體驗(yàn)的絕佳保障。
以及別忘了,小米還有AI迭代的最可靠保障——米粉用戶。
在ChatGPT的一鳴驚人之后,基于人類反饋的強(qiáng)化學(xué)習(xí)機(jī)制被反復(fù)提起,而這種關(guān)鍵的機(jī)制方法要素,沒有哪個玩家比小米更有方法論和話語權(quán)。
最后,AI之所以一定會刷新小米,最關(guān)鍵的還在于決心。
這種決心,既是小米的技術(shù)底色和研發(fā)投入上的有史為鑒,更有程序員出身的雷軍始終如一對技術(shù)的堅(jiān)定和知行合一。
一直以來,小米的產(chǎn)品體驗(yàn)太強(qiáng)而讓技術(shù)被迫“失色”,以至于不少人忽略了小米的技術(shù)之強(qiáng),布局之全。
所以“新小米”并不是說小米才剛剛開始改變,而是把一直以來在技術(shù)創(chuàng)新上做出的持續(xù)努力更好地展現(xiàn)在臺面之上。
在雷軍演講現(xiàn)場,他專門強(qiáng)調(diào)了小米技術(shù)研發(fā)已布局12個技術(shù)領(lǐng)域,包括5G移動通信技術(shù)、大數(shù)據(jù)、云計算及人工智能,同時基于智能制造,進(jìn)入機(jī)器人、無人工廠、智能電動汽車等,涉及99個細(xì)分賽道。
從軟件、硬件,從微觀技術(shù)棧到宏觀產(chǎn)業(yè)賽道,都堪稱全面。
2016年以來小米在技術(shù)上的持續(xù)布局,造就了今天“新小米”開始展現(xiàn)技術(shù)的滾雪球效應(yīng)。
雷軍披露,在最體現(xiàn)實(shí)力的技術(shù)專利方面,截至2023年3月31日,小米全球授權(quán)專利數(shù)超3.2萬件。其中,在中國信息通信研究院發(fā)布的5G標(biāo)準(zhǔn)必要專利聲明有效全球?qū)@迤髽I(yè)排名中,小米全球?qū)@逭急?.1%,首次進(jìn)入前十——是最年輕玩家。
當(dāng)然,這些技術(shù)積累的背后,也離不開研發(fā)投入的持續(xù)增加,從2017年到2022年,小米在技術(shù)研發(fā)方面投入增幅為38.4%。
2022年,小米研發(fā)投入約160億,同比增長21%。預(yù)計2023年全年總研發(fā)投入將超過200億,未來五年(2022-2026)研發(fā)投入將超過1000億。
所以當(dāng)“AI成為新小米的關(guān)鍵變量”的說法一出,質(zhì)疑的聲音或許有多個維度,但沒有一個維度是關(guān)于戰(zhàn)略定力、決心和執(zhí)行力的。
小米這家公司,“永遠(yuǎn)相信美好的事情即將發(fā)生”,但這種信念背后,是知行合一、日拱一卒的執(zhí)行力,一步步把事情做成,把夢想變成目標(biāo),把目標(biāo)拆解成一個個量化指標(biāo),最后總能做好、做成。
實(shí)際上,大模型趨勢發(fā)生以來,追逐風(fēng)口、看到機(jī)遇的人很多,制定AI戰(zhàn)略規(guī)劃的公司也不在少數(shù)。
但當(dāng)小米入局,沒有人不關(guān)注,沒有人不重視。背后正是小米這種創(chuàng)業(yè)13年積累的江湖戰(zhàn)績和商譽(yù)。
不過如果非要?dú)w本溯源,小米的AI想象空間和戰(zhàn)略定力,或者小米技術(shù)相關(guān)的一切,最終都?xì)w于一個人,只要他在,外界就相信小米對于技術(shù)的認(rèn)真、堅(jiān)持和一定能成。
這個人就是雷軍,小米的掌舵者,中國最早一代程序員,也是早期最厲害的技術(shù)大佬之一——他大二寫的匯編代碼,時隔三十年后還在知乎上被熱議。
如果說中國有多少企業(yè)家真正有敏銳的技術(shù)洞察和趨勢,雷軍肯定是排在名單最前的一個,也正因如此,他能更容易看懂、看透技術(shù)趨勢,也對AI這樣的底層技術(shù)開發(fā),也會更有耐心。
技術(shù)也好,AI也好,對于小米不會是一陣風(fēng),而是始終不變的底色。
這也是為什么小米從成立以來,就始終強(qiáng)調(diào)技術(shù)為本。包括在“新小米”的戰(zhàn)略升級中,雷軍也特意強(qiáng)調(diào)了其中“小米的不變”:
這種技術(shù)為本,可以本質(zhì)到什么程度?
雷軍在今年的演講中也給出了答案:選擇對人類文明有長期價值的技術(shù)領(lǐng)域,長期持續(xù)投入。
這是一段算不上簡潔的表達(dá),但似乎琢磨幾遍之后,會發(fā)現(xiàn)一個字都不能少。
足夠遠(yuǎn)大的夢想是胸懷人類文明,判斷投入的標(biāo)準(zhǔn)是長期價值,雷軍和小米的方式是技術(shù),而一以貫之的方式則是:長期、持續(xù)、投入。