8月1日,騰訊云向量數(shù)據(jù)庫(Tencent Cloud Vector DB)正式上線公測。
騰訊云向量數(shù)據(jù)庫不僅能為大模型提供外部知識庫,提高大模型回答的準確性,還可廣泛應(yīng)用于推薦系統(tǒng)、文本圖像檢索、自然語言處理等AI領(lǐng)域。騰訊云向量數(shù)據(jù)庫是國內(nèi)首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。
作為一款全托管的自研企業(yè)級分布式數(shù)據(jù)庫服務(wù),騰訊云向量數(shù)據(jù)庫專用于存儲、檢索、分析多維向量數(shù)據(jù)。該數(shù)據(jù)庫支持多種索引類型和相似度計算方法,單索引支持10億級向量規(guī)模,可支持百萬級QPS及毫秒級查詢延遲。
向量數(shù)據(jù)庫通過把數(shù)據(jù)向量化然后進行存儲和查詢,可以極大地提升效率和降低成本。它能解決大模型預(yù)訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,突破大模型在時間和空間上的限制,加速大模型落地行業(yè)場景。
統(tǒng)計顯示,將騰訊云向量數(shù)據(jù)庫用于大模型預(yù)訓練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數(shù)量級。
企業(yè)原先接入一個大模型需要花1個月左右時間,使用騰訊云向量數(shù)據(jù)庫后,3天時間即可完成,極大降低了企業(yè)的接入成本。
此前,騰訊云向量數(shù)據(jù)庫的向量化能力(embedding)曾多次獲得權(quán)威機構(gòu)認可,2021年曾登頂MS MARCO榜單第一、相關(guān)成果已發(fā)表于NLP頂會EMNLP。