來(lái)源:獵云精選,文/王非
“商湯迎來(lái)了極其關(guān)鍵的發(fā)展時(shí)期?!?/p>
在2023年上半年財(cái)報(bào)發(fā)布后,商湯集團(tuán)董事會(huì)執(zhí)行主席兼首席執(zhí)行官徐立博士的表態(tài),是總結(jié)也是期待。
作為一家成立于2014年的AI公司,在AI領(lǐng)域已布局近十年,在大模型上也已深耕超五年。
就在8月31日,商湯日日新大模型旗下大語(yǔ)言模型應(yīng)用“商量SenseChat”正式面向公眾用戶開(kāi)放服務(wù),所有人均可通過(guò)訪問(wèn)https://chat.sensetime.com或通過(guò)商湯官網(wǎng)使用。
機(jī)會(huì)是留給有準(zhǔn)備的人的,正如風(fēng)只對(duì)能利用它的人才是動(dòng)力。于是,踩在生成式AI、ChatGPT等行業(yè)風(fēng)口上,商湯憑借提前布局的商業(yè)眼光以及多年深耕積累的技術(shù)積淀,成為當(dāng)下頗為穩(wěn)健的AI投資標(biāo)的之一 ,也給自身未來(lái)業(yè)務(wù)的拓展帶來(lái)了無(wú)限空間。
依托日日新大模型體系和AI大裝置SenseCore,2023年上半年,商湯生成式AI相關(guān)收入取得了670.4%同比增長(zhǎng),對(duì)集團(tuán)業(yè)務(wù)的貢獻(xiàn)迅速提升至20.3%。財(cái)報(bào)顯示,上半年商湯總收入為14.33億元,同比增長(zhǎng)1.3%。
在官方發(fā)布的2023年中期業(yè)績(jī)?nèi)皥D中,商湯使用其文生圖創(chuàng)作平臺(tái)“秒畫SenseMirage”,為自己創(chuàng)作了一幅科技元素滿滿的蝴蝶圖畫。
這也正昭示著,商湯迎來(lái)了屬于自己的“蝶變”時(shí)刻。
長(zhǎng)期堅(jiān)定底層技術(shù)研發(fā)投入,AGI時(shí)代占得先機(jī)
據(jù)不完全統(tǒng)計(jì),全球已發(fā)布數(shù)百個(gè)大模型,僅在中國(guó)就發(fā)布了100多個(gè)。
在被稱為AGI(通用人工智能)時(shí)代或AI 2.0的當(dāng)下,“百模大戰(zhàn)”愈演愈烈。
然而,模型訓(xùn)練成本高且頻繁、數(shù)據(jù)獲取難清洗也難、技術(shù)人才“百萬(wàn)年薪”卻又鳳毛麟角……諸多因素限制著大模型相關(guān)公司的快速增長(zhǎng)。
行業(yè)里,只有少數(shù)幾個(gè)“先行者”和“賣鏟人”,占得了先機(jī)。
放眼國(guó)內(nèi)互聯(lián)網(wǎng)大廠,BAT無(wú)需多言,天然自成“體系”。商湯則憑借“多年來(lái)一直積極投入建設(shè)超大規(guī)模的算力,也一直訓(xùn)練越來(lái)越大的模型”,得以與巨頭比肩。
其中,強(qiáng)大的AI基礎(chǔ)設(shè)施,正是商湯的立身之本、成事之基。
商湯于2020年啟動(dòng)建設(shè)的亞洲最大人工智能計(jì)算中心AIDC,已在2022年1月啟用,算力節(jié)點(diǎn)也不斷從上海拓展至廣州、重慶、深圳、福建。
2022年9月,商湯大裝置AI云對(duì)外發(fā)布,并于今年2月25日正式上線。
與此同時(shí),商湯大裝置持續(xù)擴(kuò)建,在今年3月底就完成2.7萬(wàn)塊GPU的部署并實(shí)現(xiàn)了5 ExaFLOPS的算力輸出能力,可最多支持20個(gè)千億參數(shù)量大模型(以千卡并行)同時(shí)訓(xùn)練,最高可支持萬(wàn)億參數(shù)超大模型的訓(xùn)練。
目前,商湯大裝置上線GPU數(shù)量已提升至約30000塊,峰值算力不斷擴(kuò)充,已提升20%至6 ExaFLOPS。
在訓(xùn)練數(shù)據(jù)方面,商湯每月可產(chǎn)出約2萬(wàn)億token的高質(zhì)量數(shù)據(jù),支持更加強(qiáng)大的基模型的訓(xùn)練,預(yù)計(jì)年底高質(zhì)量數(shù)據(jù)儲(chǔ)備將突破10萬(wàn)億token。同時(shí),商湯還投入了數(shù)百臺(tái)服務(wù)器搭載千卡GPU的計(jì)算資源,采用算法結(jié)合人工的方法對(duì)原始語(yǔ)料數(shù)據(jù)進(jìn)行分門別類的精細(xì)化清洗,以確保數(shù)據(jù)的質(zhì)量、安全性和價(jià)值觀都符合要求。
由于OpenAI從未公開(kāi)過(guò)其實(shí)驗(yàn)過(guò)程、數(shù)據(jù)配方等,外界無(wú)從知道他是怎么訓(xùn)練大模型的,訓(xùn)練中的一次次試錯(cuò),是需要支付較高的時(shí)間成本和金錢成本的。
憑借大裝置這一強(qiáng)力后盾,在大算力的支撐下,商湯方才有底氣堅(jiān)持做原創(chuàng)的大模型技術(shù),并進(jìn)行不斷的實(shí)驗(yàn)和試錯(cuò)。
多年的大裝置建造,以及大模型開(kāi)發(fā),自然離不開(kāi)商湯在研發(fā)上持續(xù)不斷的投入:2018年至今,商湯累計(jì)研發(fā)投入已超146億元。
3月28日,商湯公布的2022年財(cái)報(bào)就曾披露,研發(fā)人效相比2021年進(jìn)一步提高90%,人均每年研發(fā)模型數(shù)9.35個(gè);累計(jì)商用模型數(shù)提高了93%至6.7萬(wàn)個(gè)。
基模型參數(shù)提升至1230億,多項(xiàng)專業(yè)評(píng)測(cè)超GPT-4
回望商湯自2018年開(kāi)啟的大模型研發(fā)之路,可以用八個(gè)字概括:持續(xù)突破、飛速迭代。
早在2019年,商湯便具備了千卡并行的系統(tǒng)能力,使用上千張GPU卡進(jìn)行單任務(wù)訓(xùn)練,推出了10億參數(shù)量規(guī)模的視覺(jué)模型,實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。
2021年11月,商湯聯(lián)合上海人工智能實(shí)驗(yàn)室、清華大學(xué)、香港中文大學(xué)、上海交通大學(xué)共同發(fā)布“書生”大模型,并持續(xù)聯(lián)合研發(fā)。2022年,商湯成功研發(fā)了320億參數(shù)量的通用視覺(jué)模型,實(shí)現(xiàn)了高性能的目標(biāo)檢測(cè)、圖像分割和多物體識(shí)別算法,并在自動(dòng)駕駛、工業(yè)質(zhì)檢、醫(yī)療影像等多個(gè)領(lǐng)域得到廣泛應(yīng)用。
今年4月10日舉辦的技術(shù)交流日上,商湯正式公布了“日日新SenseNova”大模型體系,并同步推出了自然語(yǔ)言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。
在語(yǔ)言大模型研發(fā)上,商量SenseChat1.0是國(guó)內(nèi)最早推出基于千億參數(shù)大語(yǔ)言模型的聊天機(jī)器人產(chǎn)品之一。商湯投入超萬(wàn)塊GPU,相關(guān)技術(shù)和產(chǎn)品也一直維持在高速迭代的狀態(tài)。
6月還發(fā)布的國(guó)內(nèi)第一個(gè)綜合性能全面超越GPT-3.5-turbo的基模型“書生·浦語(yǔ)”(InternLM),參數(shù)量達(dá)1040億,使用1.6萬(wàn)億token的多語(yǔ)言語(yǔ)料訓(xùn)練,支持語(yǔ)言達(dá)20多種,并在此基礎(chǔ)上于7月初發(fā)布了商量SenseChat2.0。
今年8月,新模型InternLM-123B完成訓(xùn)練,參數(shù)量提升至1230億。這個(gè)新模型的語(yǔ)言、知識(shí)、理解、推理和學(xué)科五大能力均顯著提高,在全球51個(gè)知名評(píng)測(cè)集(包括MMLU,、AGIEVAL,、ARC,、CEval,、Race,、GSM8K等)共計(jì)30萬(wàn)道問(wèn)題集合上測(cè)試成績(jī)整體排名全球第二,超過(guò)GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。
在主要評(píng)測(cè)集中,InternLM-123B共有12項(xiàng)成績(jī)排名第一:在綜合考試中AGIEval的分?jǐn)?shù)為57.8,超越GPT-4位列第一;在知識(shí)問(wèn)答中CommonSenseQA的分?jǐn)?shù)為88.5,同樣如此;在閱讀理解中,五項(xiàng)評(píng)測(cè)成績(jī)均居榜首;在推理中,亦有五項(xiàng)評(píng)測(cè)成績(jī)排名第一。
值得關(guān)注都是,InternLM-123B還具備了自主反思及修正錯(cuò)誤的能力,并重點(diǎn)升級(jí)了代碼解釋器及插件調(diào)用能力(function calling),可使用python解釋器、API調(diào)用和搜索三類常用工具來(lái)解決復(fù)雜任務(wù)、靈活搭建AI智能體應(yīng)用。
截至目前,商湯商量已經(jīng)在金融、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過(guò)500家客戶建立了深度合作,通過(guò)提供多種靈活的API接口和服務(wù),為客戶提供大模型的各項(xiàng)AI技術(shù)和服務(wù),低門檻、低成本、高效率地實(shí)現(xiàn)各類生成式AI應(yīng)用。
經(jīng)受住真實(shí)能力和技術(shù)商用的雙重檢驗(yàn),商湯已然“蝶變”,并開(kāi)啟了新征程。
山止川行,風(fēng)禾盡起。徐立博士希望,商湯“給行業(yè)帶來(lái)更強(qiáng)的大模型能力,助力我們的用戶在生成式AI的時(shí)代做出顛覆性的產(chǎn)品,來(lái)獲得成功?!?/p>