金融行業(yè)正迎來大模型時(shí)代。
近日,度小滿正式發(fā)布千億級(jí)中文對話大模型軒轅,集中文、金融、開源特色于一身。
基于BLOOM-176B研發(fā)的軒轅大模型,在金融場景中的任務(wù)評(píng)測中,效果相較于通用大模型大幅提升,表現(xiàn)出明顯的金融領(lǐng)域優(yōu)勢。
在諸如金融名詞理解、金融市場評(píng)論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)的評(píng)測中,軒轅超越了其他四種開源大模型,贏得了150次回答中63.33%的勝率,充分凸顯了其在金融領(lǐng)域的顯著優(yōu)勢。
在通用中文領(lǐng)域,軒轅表現(xiàn)也不亞于ChatGPT。
根據(jù)實(shí)驗(yàn)結(jié)果,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT,61.22%的任務(wù)表現(xiàn)與之持平。其中涉及數(shù)學(xué)計(jì)算、場景寫作、邏輯推理、文本摘要等13個(gè)主要維度,驗(yàn)證了軒轅的通用能力。
此次發(fā)布的千億級(jí)軒轅模型,將成為國內(nèi)首個(gè)開源的中文金融大模型。
度小滿表示,軒轅大模型將有力地推動(dòng)大模型在金融行業(yè)的應(yīng)用,為客戶提供更準(zhǔn)確、全面的金融咨詢與服務(wù)。
目前,千億級(jí)的軒轅模型已可以在Huggingface中申請下載(下載地址見文末)。
國內(nèi)首個(gè)開源中文金融大模型
去年11月,ChatGPT滾滾而來,全球互聯(lián)網(wǎng)用戶為之瘋狂。
其專業(yè)、快速、精準(zhǔn)、富有情感的內(nèi)容表達(dá),無不向大家展示NLP大模型驚人的自然語言理解與生成能力。
ChatGPT的的誕生,掀起了新一輪技術(shù)革命,自此各類大模型層出不窮。而度小滿也開啟了金融大模型的研發(fā)之路。
“將ChatGPT的能力遷移到金融領(lǐng)域,會(huì)產(chǎn)生怎么樣顛覆性的影響?”,為了尋找問題的答案,度小滿將軒轅大模型定位在了三個(gè)維度:
中文、金融和開源。
軒轅大模型基于1760億的BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)語言模型訓(xùn)練而來,使用了IDRIS的Jean Zay超級(jí)計(jì)算機(jī)(來自法國,目前在最新全球超算500強(qiáng)榜單上排名第135)。
BLOOM擁有1.61TB文本,包含46種自然語言和13種編程語言。
相比meta發(fā)布的LLaMA(Large Language Model meta AI)模型,Bloom參數(shù)量更有優(yōu)勢。
度小滿依托多年行業(yè)實(shí)踐積累,構(gòu)建了具有金融垂直領(lǐng)域特色的、千億tokens的中文預(yù)訓(xùn)練數(shù)據(jù)集。
度小滿數(shù)據(jù)智能部總經(jīng)理、技術(shù)委員會(huì)執(zhí)行主席楊青表示,經(jīng)過清洗和標(biāo)注的高質(zhì)量數(shù)據(jù)集,不僅在通用性方面與ChatGPT達(dá)到持平成為可能,且顯著提升了模型在金融垂直領(lǐng)域的性能。
值得一提的是,軒轅數(shù)據(jù)集包含了諸如金融研報(bào)、股票、基金、銀行、保險(xiǎn)等方向的專業(yè)知識(shí)。
通過在訓(xùn)練過程中加入大量金融對話數(shù)據(jù)并針對金融領(lǐng)域進(jìn)行特定的預(yù)訓(xùn)練調(diào)優(yōu),軒轅在金融垂直領(lǐng)域的表現(xiàn)得到了顯著提升。
因此,軒轅在金融專有領(lǐng)域內(nèi)容理解和生成上展現(xiàn)出卓越的能力。
解釋授信額度、計(jì)算收益率、決策參考……樣樣通
作為AI新基建,大模型在金融及各個(gè)行業(yè)有著廣泛的應(yīng)用場景。
軒轅大模型開源后,將會(huì)為金融企業(yè)帶來怎么樣的幫助?如何推動(dòng)產(chǎn)業(yè)發(fā)展?
度小滿CTO許冬亮認(rèn)為,生成式大模型在內(nèi)容生成與創(chuàng)作、信息摘要與總結(jié)、知識(shí)理解與問答、自然交互與對話等方面具備非常出色的能力,在金融場景中會(huì)有廣泛的應(yīng)用。
在前臺(tái),生成式大模型將大幅提升客戶經(jīng)理的專業(yè)水平和服務(wù)能力,大幅降低客戶經(jīng)理的運(yùn)營成本,讓每個(gè)人都擁有24小時(shí)在線的專業(yè)客戶經(jīng)理成為可能。
出色的內(nèi)容生成能力也將引發(fā)營銷內(nèi)容生產(chǎn)能力的大幅提升。
在中臺(tái),生成式大模型有機(jī)會(huì)改變企業(yè)內(nèi)知識(shí)獲取、內(nèi)容創(chuàng)作、會(huì)議與溝通、代碼開發(fā)與測試的方式,進(jìn)而大幅提升企業(yè)內(nèi)部辦公效率,甚至引發(fā)研發(fā)測試模式變革,全方位的提升金融企業(yè)內(nèi)部運(yùn)營效率。
在后臺(tái),大模型將成為智能科技底座的標(biāo)配,大幅降低智能技術(shù)應(yīng)用的門檻,只需少量標(biāo)注數(shù)據(jù)甚至無需調(diào)整就可以讓智能技術(shù)覆蓋廣泛的場景。
智能客服,是AI在金融領(lǐng)域最常見的應(yīng)用方向之一。
通用語音或文本的交互方式,可以為金融用戶提供24小時(shí)在線咨詢和答疑服務(wù)。為了降低人工成本和風(fēng)險(xiǎn),引入智能客服已成為金融企業(yè)的基礎(chǔ)配置。
然而實(shí)際上,面對用戶多樣化復(fù)雜場景的詢問,智能客服常常表現(xiàn)出“智障”。以簡單的名詞解釋為例,可以看到軒轅的表現(xiàn)更為專業(yè)。
在回復(fù)中,軒轅從個(gè)人信用記錄、收入水平、負(fù)債情況和擔(dān)保能力四個(gè)方面進(jìn)行了全面的解釋,清晰的結(jié)構(gòu)、詳細(xì)的計(jì)算方法以及實(shí)用的建議,真正做到以用戶視角詳解專業(yè)概念。
此外,軒轅在股息收益率、股東權(quán)益計(jì)算等方面也有相當(dāng)不錯(cuò)的表現(xiàn)。
而這些涉及邏輯推理、數(shù)學(xué)計(jì)算的問題往往是AI的弱點(diǎn)。
現(xiàn)有的AI金融模型也經(jīng)常會(huì)犯一些愚蠢的錯(cuò)誤,比如:股息率 = 股息 ÷ 股票價(jià)格=5美元 ÷100美元=0.5。
軒轅對數(shù)據(jù)和知識(shí)的挖掘與理解,不是簡單的關(guān)鍵詞搜索,而是多語義關(guān)聯(lián)與匹配,更智能地識(shí)別出用戶的真實(shí)意圖,進(jìn)而給出更符合用戶需求的答案。
這一點(diǎn)在“智能金融顧問”應(yīng)用中,尤為明顯。
AI技術(shù)的優(yōu)勢在于海量信息的搜集、提取和分析能力,這是人類難以企及的。
例如AI大模型可以通過分析金融數(shù)據(jù)、新聞動(dòng)態(tài)、社交評(píng)論等每日信息,為投資者提供市場輿情和風(fēng)險(xiǎn)預(yù)測等服務(wù)。
度小滿認(rèn)為,軒轅大模型要想無限趨近于人類的思維能力,不能停留在標(biāo)準(zhǔn)答案上,需要能夠處理更具開放性、靈活性的復(fù)雜問題。
從下面的示例中,可以看到,軒轅會(huì)提醒客戶結(jié)合資產(chǎn)狀況、收益目標(biāo)和風(fēng)險(xiǎn)偏好,以及外部的市場動(dòng)態(tài),來進(jìn)行投資決策。
軒轅在解釋”牛市”和”熊市”含義的同時(shí),還強(qiáng)調(diào)了投資者要如何面對兩種市場狀況,以及可采取的策略。
這一點(diǎn)相比其他模型,不僅交流更充分、信息更有價(jià)值,而且更顯人性化,更有溫度。
軒轅還能針對當(dāng)下金融時(shí)事分析背后的原因,并據(jù)此從不同維度對金融市場的未來走勢進(jìn)行預(yù)測,給出總體結(jié)果評(píng)估,為投資者提供明確的決策參考。
AI算法沒有護(hù)城河,正是開源造就了當(dāng)下大模型創(chuàng)新的繁榮景象。
歷史也證明了,安卓系統(tǒng)的開源不僅使得技術(shù)的發(fā)展更加快速,也促進(jìn)了開發(fā)者之間的交流與合作,讓移動(dòng)應(yīng)用和服務(wù)得以更快地普及到全球各地,并帶來更加多樣化的用戶體驗(yàn)。
得益于開源,讓人人都可參與這個(gè)行業(yè),這也使得菜鳥和小眾開發(fā)者可以通過參與開源項(xiàng)目提高自己的技能和見識(shí),讓業(yè)界更加平等公正。
秉承這一精神,許冬亮表示,軒轅大模型是經(jīng)度小滿業(yè)務(wù)場景中積累的金融數(shù)據(jù)訓(xùn)練而來的,對金融相關(guān)問題的理解比通用大模型更有優(yōu)勢。
我們把大模型能力開放給金融機(jī)構(gòu),有利于推動(dòng)大模型在金融行業(yè)的應(yīng)用,降低大模型的應(yīng)用門檻,提升金融行業(yè)智能化水平。
軒轅模型申請下載地址:
https://huggingface.co/xyz-nlp/XuanYuan2.0
GitHub主頁:
https://github.com/Duxiaoman-DI/XuanYuan