8月1日,騰訊云向量數(shù)據(jù)庫(kù)(Tencent Cloud Vector DB)正式上線公測(cè)。
騰訊云向量數(shù)據(jù)庫(kù)不僅能為大模型提供外部知識(shí)庫(kù),提高大模型回答的準(zhǔn)確性,還可廣泛應(yīng)用于推薦系統(tǒng)、文本圖像檢索、自然語(yǔ)言處理等AI領(lǐng)域。騰訊云向量數(shù)據(jù)庫(kù)是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。
作為一款全托管的自研企業(yè)級(jí)分布式數(shù)據(jù)庫(kù)服務(wù),騰訊云向量數(shù)據(jù)庫(kù)專用于存儲(chǔ)、檢索、分析多維向量數(shù)據(jù)。該數(shù)據(jù)庫(kù)支持多種索引類型和相似度計(jì)算方法,單索引支持10億級(jí)向量規(guī)模,可支持百萬(wàn)級(jí)QPS及毫秒級(jí)查詢延遲。
向量數(shù)據(jù)庫(kù)通過(guò)把數(shù)據(jù)向量化然后進(jìn)行存儲(chǔ)和查詢,可以極大地提升效率和降低成本。它能解決大模型預(yù)訓(xùn)練成本高、沒有“長(zhǎng)期記憶”、知識(shí)更新不足、提示詞工程復(fù)雜等問(wèn)題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場(chǎng)景。
統(tǒng)計(jì)顯示,將騰訊云向量數(shù)據(jù)庫(kù)用于大模型預(yù)訓(xùn)練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實(shí)現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫(kù)作為外部知識(shí)庫(kù)用于模型推理,則可以將成本降低2-4個(gè)數(shù)量級(jí)。
企業(yè)原先接入一個(gè)大模型需要花1個(gè)月左右時(shí)間,使用騰訊云向量數(shù)據(jù)庫(kù)后,3天時(shí)間即可完成,極大降低了企業(yè)的接入成本。
此前,騰訊云向量數(shù)據(jù)庫(kù)的向量化能力(embedding)曾多次獲得權(quán)威機(jī)構(gòu)認(rèn)可,2021年曾登頂MS MARCO榜單第一、相關(guān)成果已發(fā)表于NLP頂會(huì)EMNLP。