騰訊云向量數(shù)據(jù)庫正式上線公測!提供10億級向量檢索能力

來源:騰訊云數(shù)據(jù)庫
作者:騰訊云數(shù)據(jù)庫
時間:2023-08-02
3107
8月1日,騰訊云向量數(shù)據(jù)庫(Tencent Cloud Vector DB)正式上線公測。

8月1日,騰訊云向量數(shù)據(jù)庫(Tencent Cloud Vector DB)正式上線公測。

騰訊云向量數(shù)據(jù)庫不僅能為大模型提供外部知識庫,提高大模型回答的準確性,還可廣泛應(yīng)用于推薦系統(tǒng)、文本圖像檢索、自然語言處理等AI領(lǐng)域。騰訊云向量數(shù)據(jù)庫是國內(nèi)首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。

作為一款全托管的自研企業(yè)級分布式數(shù)據(jù)庫服務(wù),騰訊云向量數(shù)據(jù)庫專用于存儲、檢索、分析多維向量數(shù)據(jù)。該數(shù)據(jù)庫支持多種索引類型和相似度計算方法,單索引支持10億級向量規(guī)模,可支持百萬級QPS及毫秒級查詢延遲。

640 (2).png

向量數(shù)據(jù)庫通過把數(shù)據(jù)向量化然后進行存儲和查詢,可以極大地提升效率和降低成本。它能解決大模型預(yù)訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,突破大模型在時間和空間上的限制,加速大模型落地行業(yè)場景。

統(tǒng)計顯示,將騰訊云向量數(shù)據(jù)庫用于大模型預(yù)訓練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數(shù)量級。

企業(yè)原先接入一個大模型需要花1個月左右時間,使用騰訊云向量數(shù)據(jù)庫后,3天時間即可完成,極大降低了企業(yè)的接入成本。

此前,騰訊云向量數(shù)據(jù)庫的向量化能力(embedding)曾多次獲得權(quán)威機構(gòu)認可,2021年曾登頂MS MARCO榜單第一、相關(guān)成果已發(fā)表于NLP頂會EMNLP。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:騰訊云數(shù)據(jù)庫
版權(quán)說明:本文內(nèi)容來自于騰訊云數(shù)據(jù)庫,本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多