今日,騰訊云正式發(fā)布向量數(shù)據(jù)庫(kù)Tencent Cloud VectorDB,預(yù)計(jì)8月上線騰訊云官網(wǎng)。
騰訊介紹道,該數(shù)據(jù)庫(kù)能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景,是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。
據(jù)了解,該數(shù)據(jù)庫(kù)面向大模型訓(xùn)練,可以讓企業(yè)原先花一個(gè)月時(shí)間才能完成的大模型接入,縮短到三天時(shí)間。
大模型的“黃金搭檔”
什么是向量數(shù)據(jù)庫(kù)?
向量數(shù)據(jù)庫(kù)是一種專門用于存儲(chǔ)、 管理、查詢、檢索向量的數(shù)據(jù)庫(kù),可以把復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)通過向量化,處理統(tǒng)一成多維空間里的坐標(biāo)值。
目前,向量數(shù)據(jù)庫(kù)主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域。
具體來看,向量數(shù)據(jù)庫(kù)被廣泛地用于大模型訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景:支撐訓(xùn)練階段海量數(shù)據(jù)的分類、去重和清洗,給大模型的訓(xùn)練降本增效;通過新數(shù)據(jù)的帶入,幫助大模型提升處理新問題的能力,突破預(yù)訓(xùn)練帶來的知識(shí)時(shí)間限制,避免大模型出現(xiàn)幻覺;提供一種私有數(shù)據(jù)連接大模型的方式,解決私有數(shù)據(jù)注入大模型帶來的安全和隱私問題,加速大模型在產(chǎn)業(yè)落地。
簡(jiǎn)而言之,向量數(shù)據(jù)庫(kù)可以解決大模型預(yù)訓(xùn)練成本高、沒有“長(zhǎng)期記憶”、知識(shí)更新不足、提示詞工程復(fù)雜等問題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場(chǎng)景。
據(jù)第三方調(diào)研數(shù)據(jù)預(yù)測(cè),全球向量數(shù)據(jù)庫(kù)到2030年預(yù)計(jì)將迎來超過500億美元的市場(chǎng)。國(guó)內(nèi)也將以每年超過20%的速度在增長(zhǎng)。目前全球已有的向量數(shù)據(jù)庫(kù)產(chǎn)品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超過一半的向量數(shù)據(jù)庫(kù)具有云化部署的能力。
提供10億級(jí)向量檢索能力
據(jù)介紹,騰訊云向量數(shù)據(jù)庫(kù)最高支持10億級(jí)向量檢索規(guī)模,延遲控制在毫秒級(jí),相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫(kù)檢索規(guī)模提升10倍,同時(shí)具備百萬級(jí)每秒查詢(QPS)的峰值能力。
具體而言,騰訊發(fā)布的向量數(shù)據(jù)庫(kù)有以下特點(diǎn)。
一是高性能向量存儲(chǔ)、檢索。騰訊云向量數(shù)據(jù)庫(kù)具備高性能的向量存儲(chǔ)和檢索能力,單索引能夠輕松支持10億級(jí)別的向量規(guī)模。在分布式彈性擴(kuò)展的架構(gòu)下,單實(shí)例可支持百萬級(jí)別QPS,AI場(chǎng)景下向量檢索的P99響應(yīng)延遲可控制在20ms以內(nèi),能夠覆蓋絕大多數(shù)AI場(chǎng)景對(duì)向量存儲(chǔ)和檢索的業(yè)務(wù)需求。
二是可視化數(shù)據(jù)管理。在向量存儲(chǔ)、檢索能力之上,騰訊云向量數(shù)據(jù)庫(kù)還提供了可視化的數(shù)據(jù)管理界面,進(jìn)一步降低向量數(shù)據(jù)庫(kù)的接入和使用門檻。用戶可以通過控制臺(tái)進(jìn)行數(shù)據(jù)庫(kù)、集合層面的數(shù)據(jù)管理,還可以快速執(zhí)行向量檢索等常用操作。此外,騰訊云向量數(shù)據(jù)庫(kù)還提供了可視化的數(shù)據(jù)上傳能力,幫助用戶快速構(gòu)建專屬知識(shí)庫(kù)。
三是一站式向量檢索方案。為了進(jìn)一步提升產(chǎn)品的易用性,騰訊云向量數(shù)據(jù)庫(kù)會(huì)提供一站式的向量檢索方案,實(shí)現(xiàn)從文本輸入到文本搜索的端到端檢索能力,用戶可以直接上傳.pdf、.txt等原始文本文件,通過平臺(tái)自動(dòng)化地執(zhí)行文本分割、embedding向量化,全托管地完成知識(shí)構(gòu)建和檢索任務(wù)。
騰訊官方信息稱,使用騰訊云向量數(shù)據(jù)庫(kù)后,企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右,極大降低企業(yè)的接入成本。
在具體落地應(yīng)用層面,騰訊方面表示,該向量數(shù)據(jù)庫(kù)目前已經(jīng)應(yīng)用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內(nèi)部產(chǎn)品之中。
數(shù)據(jù)顯示,使用騰訊云向量數(shù)據(jù)庫(kù)后,QQ音樂人均聽歌時(shí)長(zhǎng)提升3.2%、騰訊視頻有效曝光人均時(shí)長(zhǎng)提升1.74%、QQ瀏覽器成本降低37.9%。
騰訊方面表示,在未來“向量數(shù)據(jù)庫(kù)+大模型+數(shù)據(jù)”將產(chǎn)生“飛輪效應(yīng)”,共同助力企業(yè)步入AI Native(AI原生)時(shí)代。