近日,為了更好地滿足客戶在AI業(yè)務(wù)場(chǎng)景下的需要,UCloud鏡像市場(chǎng)上線支持了Milvus向量數(shù)據(jù)庫鏡像。
隨著時(shí)代發(fā)展,文檔資料、圖片、語音、視頻影像等非結(jié)構(gòu)化數(shù)據(jù)開始海量涌現(xiàn)。為了能夠更好地使用這些數(shù)據(jù),可以使用embedding將它們轉(zhuǎn)換為向量,并將這些向量存儲(chǔ)到向量數(shù)據(jù)庫中,建立索引方便檢索。檢索時(shí)通過計(jì)算兩個(gè)向量的相似度來分析它們之間的相關(guān)性。如果兩個(gè)向量非常相似,則表示原始數(shù)據(jù)源也非常相似,從而找到目標(biāo)數(shù)據(jù)。
利用這樣的存儲(chǔ)和檢索的能力,在大語言模型(LLM)的技術(shù)架構(gòu)中,向量數(shù)據(jù)庫可以作為一個(gè)持久性的記憶體,滿足對(duì)私有知識(shí)庫文檔和數(shù)據(jù)的存儲(chǔ)管理、保存大模型的處理結(jié)果、保存AI智能體產(chǎn)生的新知識(shí)和交互上下文等需求,并在模型需要時(shí)隨時(shí)快速調(diào)用,提高模型結(jié)果輸出的準(zhǔn)確性和效率。
此次UCloud鏡像市場(chǎng)新增支持的Milvus,正是一款在Github上擁有兩萬多星的開源向量數(shù)據(jù)庫,專門為向量的快速查詢檢索而設(shè)計(jì),能夠?qū)θf億規(guī)模的向量數(shù)據(jù)創(chuàng)建索引。Milvus具備高性能、高可擴(kuò)展性等特點(diǎn),數(shù)據(jù)可持久化存儲(chǔ)在本地或者支持s3協(xié)議的對(duì)象存儲(chǔ),且支持?jǐn)?shù)據(jù)分區(qū);除了向量,Milvus還支持布爾值、整數(shù)、浮點(diǎn)數(shù)等數(shù)據(jù)類型,可以更好地存儲(chǔ)表達(dá)業(yè)務(wù)數(shù)據(jù)的特性;Milvus還將標(biāo)量過濾和向量相似度搜索相結(jié)合,支持混合查詢的能力;同時(shí),Milvus還支持多種開發(fā)語言SDK,有豐富的周邊配套工具。
目前UCloud鏡像市場(chǎng)提供的Milvus向量數(shù)據(jù)庫是Standalone版本,只需4個(gè)步驟,即可通過云主機(jī)鏡像快速獲得向量數(shù)據(jù)庫能力。
1、登錄UCloud控制臺(tái)
(https://console.ucloud.cn/uhost/uhost/create)
2、選擇快杰O型云主機(jī),推薦配置8核CPU、16G內(nèi)存、系統(tǒng)盤不低于100G
3、在鏡像市場(chǎng)選擇“向量數(shù)據(jù)庫Milvus”鏡像
4、立即創(chuàng)建,開機(jī)后系統(tǒng)將自動(dòng)啟動(dòng)Milvus向量數(shù)據(jù)庫。同時(shí),云主機(jī)內(nèi)還預(yù)裝了milvus_cli客戶端工具,可以直接訪問
連接訪問Milvus以及數(shù)據(jù)操作的更多使用細(xì)節(jié)可參考官方文檔:
https://milvus.io/docs/manage_connection.md
如若向量數(shù)據(jù)庫所需要的CPU/內(nèi)存/硬盤需要擴(kuò)展,可以通過云主機(jī)的改配功能,數(shù)秒內(nèi)即可完成升級(jí)。
UCloud在云主機(jī)鏡像市場(chǎng)中發(fā)布的向量數(shù)據(jù)庫鏡像,旨在為AI業(yè)務(wù)場(chǎng)景的客戶提供技術(shù)架構(gòu)中所需要的一個(gè)重要拼圖,尤其是在圖片/語音/視頻檢索、文本檢索、NLP語言問答等業(yè)務(wù)場(chǎng)景中,向量數(shù)據(jù)庫可以很好的應(yīng)用。同時(shí),該向量數(shù)據(jù)庫還可以與不久前鏡像市場(chǎng)發(fā)布的大模型鏡像相結(jié)合,形成更完整的解決方案,滿足業(yè)務(wù)技術(shù)架構(gòu)需要。