面向大模型!騰訊云發(fā)布向量數(shù)據(jù)庫(kù)

來(lái)源:騰訊云
作者:騰訊云
時(shí)間:2023-07-05
1374
如果大模型是一個(gè)智能的處理器,那向量數(shù)據(jù)庫(kù)就是配合這臺(tái)處理器的”外置緩存。今天,我們正式發(fā)布國(guó)內(nèi)首個(gè)AI原生(AI Native)的向量數(shù)據(jù)庫(kù)。

大模型正在重塑產(chǎn)業(yè)。

但想要真正擁抱大模型,仍然面臨很多現(xiàn)實(shí)問(wèn)題:

·如何高效率、低成本地處理數(shù)據(jù)?

·模型數(shù)據(jù)如何動(dòng)態(tài)更新?

·私有數(shù)據(jù)如何安全地接入大模型?

640.jpg

想要解決這些問(wèn)題,我們需要在數(shù)據(jù)和大模型之間搭建一座橋梁。

過(guò)往,承擔(dān)數(shù)據(jù)組織的是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)。但它更適合用來(lái)應(yīng)對(duì)結(jié)構(gòu)化的數(shù)據(jù)。

大模型和神經(jīng)網(wǎng)絡(luò),更多面對(duì)的是海量的非結(jié)構(gòu)化數(shù)據(jù),比如文本、音頻、視頻、關(guān)系等。

它們有一種專(zhuān)門(mén)的處理方式:“向量化”:

想要按這種”腦回路“組織數(shù)據(jù),需要一個(gè)專(zhuān)門(mén)的數(shù)據(jù)庫(kù)——向量數(shù)據(jù)庫(kù)。

把復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)通過(guò)向量化(embedding),處理統(tǒng)一成多維空間里的坐標(biāo)值,通過(guò)計(jì)算向量之間的相似度或距離,快速定位最相關(guān)的近似值。

640 (1).jpg

它被廣泛地用于大模型訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景:

·支撐訓(xùn)練階段海量數(shù)據(jù)的分類(lèi)、去重和清洗,給大模型的訓(xùn)練降本增效;

·通過(guò)新數(shù)據(jù)的帶入,幫助大模型提升處理新問(wèn)題的能力,突破預(yù)訓(xùn)練帶來(lái)的知識(shí)時(shí)間限制,避免大模型出現(xiàn)幻覺(jué);

·提供一種私有數(shù)據(jù)連接大模型的方式,解決私有數(shù)據(jù)注入大模型帶來(lái)的安全和隱私問(wèn)題,加速大模型在產(chǎn)業(yè)落地;

……

簡(jiǎn)而言之,如果大模型是一個(gè)智能的處理器,那向量數(shù)據(jù)庫(kù)就是配合這臺(tái)處理器的”外置緩存"。

今天,我們正式發(fā)布國(guó)內(nèi)首個(gè)AI原生(AI Native)的向量數(shù)據(jù)庫(kù):

騰訊云向量數(shù)據(jù)庫(kù)

Tencent Cloud VectorDB

它最高支持業(yè)界領(lǐng)先的10億級(jí)向量檢索規(guī)模,并將延遲控制在毫秒級(jí)。相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫(kù)檢索規(guī)模提升10倍,同時(shí)具備百萬(wàn)級(jí)每秒查詢(QPS)的峰值能力。

640 (2).jpg

針對(duì)大模型場(chǎng)景,它在接入層、計(jì)算層、存儲(chǔ)層實(shí)現(xiàn)了全面AI化:

·在接入層,智能化支持自然語(yǔ)言文本的直接檢索;

·在計(jì)算層,通過(guò)AI算子替代企業(yè)尋找/調(diào)優(yōu)AI算法,將接入工期從一個(gè)月縮短到3天;

·在存儲(chǔ)層,融合智能壓縮算法,把向量存儲(chǔ)成本降低50%。

統(tǒng)計(jì)顯示,將騰訊云向量數(shù)據(jù)庫(kù)用于大模型預(yù)訓(xùn)練數(shù)據(jù)的分類(lèi)、去重和清洗,相比傳統(tǒng)方式可以實(shí)現(xiàn)10倍效率的提升。

如果將向量數(shù)據(jù)庫(kù)作為外部知識(shí)庫(kù)用于模型推理,則可以將成本降低2~4個(gè)數(shù)量級(jí)。

640 (3).jpg

其實(shí),騰訊云向量數(shù)據(jù)庫(kù)經(jīng)歷了鵝廠內(nèi)部業(yè)務(wù)的長(zhǎng)期錘煉:

·覆蓋騰訊視頻、QQ瀏覽器、QQ音樂(lè)等上百個(gè)業(yè)務(wù)場(chǎng)景,每日調(diào)用量超千億次;

·支撐QQ音樂(lè)人均聽(tīng)歌時(shí)長(zhǎng)提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時(shí)長(zhǎng)提升1.74%;

·向量化能力(embedding)多次獲得權(quán)威機(jī)構(gòu)認(rèn)可,曾登頂MS MARCO榜單第一。

640 (4).jpg

展望未來(lái),“向量數(shù)據(jù)庫(kù)+大模型+數(shù)據(jù)”將產(chǎn)生“飛輪效應(yīng)”,共同助力企業(yè)步入AI Native(AI原生)時(shí)代。

我們也將繼續(xù)打磨技術(shù)能力,提供更堅(jiān)實(shí)的AI基礎(chǔ)設(shè)施。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:騰訊云
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于騰訊云,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
一站式落地AI實(shí)時(shí)語(yǔ)音對(duì)話,騰訊云TRTC開(kāi)啟AI交互新玩法
一站式落地AI實(shí)時(shí)語(yǔ)音對(duì)話,騰訊云TRTC開(kāi)啟AI交互新玩法
在人工智能技術(shù)日益普及的今天,GPT-4o所展現(xiàn)出的實(shí)時(shí)語(yǔ)音對(duì)話能力再次吸引了大量關(guān)注。
AI
騰訊云
2024-09-09
媲美游戲原生效果的《黑神話》直播畫(huà)質(zhì),全靠背后這套AI黑科技
媲美游戲原生效果的《黑神話》直播畫(huà)質(zhì),全靠背后這套AI黑科技
上線首日總銷(xiāo)量超450萬(wàn)份,3天全平臺(tái)銷(xiāo)量破千萬(wàn)……國(guó)產(chǎn)現(xiàn)象級(jí)游戲《黑神話:悟空》正式發(fā)布之后,熱度不斷持續(xù)。
AI
騰訊云
游戲市場(chǎng)
2024-09-09
助力Robotaxi商業(yè)化,騰訊云音視頻實(shí)現(xiàn)開(kāi)放道路遠(yuǎn)程駕駛”0“卡頓
助力Robotaxi商業(yè)化,騰訊云音視頻實(shí)現(xiàn)開(kāi)放道路遠(yuǎn)程駕駛”0“卡頓
中國(guó)自動(dòng)駕駛商業(yè)化處于快速發(fā)展階段,各車(chē)企在不斷推動(dòng)自動(dòng)駕駛技術(shù)創(chuàng)新的基礎(chǔ)上,也在創(chuàng)新思路,通過(guò)給運(yùn)營(yíng)中的自動(dòng)駕駛車(chē)配備遠(yuǎn)程安全員,進(jìn)一步保證安全性。
騰訊云
云服務(wù)
2024-09-03
騰訊云音視頻+AI重構(gòu)泛心理服務(wù),助力心言測(cè)測(cè)擁抱新機(jī)遇
騰訊云音視頻+AI重構(gòu)泛心理服務(wù),助力心言測(cè)測(cè)擁抱新機(jī)遇
面對(duì)日益復(fù)雜的現(xiàn)代社會(huì),事業(yè)、情感、前途……太多的不確定性難免會(huì)讓人感到茫然和無(wú)助。在社會(huì)壓力大、普遍焦慮的大環(huán)境下,當(dāng)代人在精神方面面臨著更多危機(jī),心理咨詢和泛心理健康服務(wù)逐步走入了大眾的視野。
AI
騰訊云
2024-08-04
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家