“GAI代理(Agent)將會(huì)反轉(zhuǎn)開發(fā)者、企業(yè)與運(yùn)算設(shè)備和Web的互動(dòng)的方式?!盙oogle Cloud首席執(zhí)行官Thomas Kurian在今年Next大會(huì)開場時(shí)這樣強(qiáng)調(diào),不分產(chǎn)業(yè),企業(yè)紛紛利用生成式AI推動(dòng)業(yè)務(wù)增長、增強(qiáng)用戶體驗(yàn),以及改善開發(fā)者生產(chǎn)力和提升IT運(yùn)維效率,“許多行業(yè)正因?yàn)镚AI而開始改變?!?/p>
過去一年,企業(yè)GAI應(yīng)用的風(fēng)潮席卷全球,成了三大公有云積極搶攻的新戰(zhàn)場,微軟靠著OpenAI助攻,去年在這場云計(jì)算GAI大戰(zhàn)中取得先機(jī),而Google后來居上,靠著自家PaLM模型和GAI生產(chǎn)力工具來迎戰(zhàn),AWS則是到去年底年會(huì)上,對于企業(yè)GAI應(yīng)用布局才有比較完整的布局與披露。
Google在生成式AI布局動(dòng)作頻頻。去年8月的Next大會(huì)成了Google生成式AI的火力展示,更是對微軟Copilot戰(zhàn)略的反擊。進(jìn)到2024年,Google更加快GAI產(chǎn)品發(fā)布和更新的腳步,積極布局新一代企業(yè)生成式AI構(gòu)建需求。
在今年的Next大會(huì)上,Google Cloud首席執(zhí)行官Thomas Kurian在開場時(shí)強(qiáng)調(diào),今年的策略將聚焦于加速企業(yè)業(yè)務(wù)和產(chǎn)業(yè)數(shù)字轉(zhuǎn)型,他同時(shí)也披露了在AI布局的多項(xiàng)成果,其中包括不到一年,已有上百家主要企業(yè)都已經(jīng)開始在內(nèi)部應(yīng)用中采用Gemini,包括了麥當(dāng)勞、德國銀行、HCA健康、USS、Mayo Clinic醫(yī)療機(jī)構(gòu)等,在今年大會(huì)期間,更舉辦超過300場企業(yè)GAI應(yīng)用實(shí)例,涵蓋金融業(yè)、零售業(yè)、醫(yī)療業(yè)、制造業(yè)等。
Vertex AI和各種云計(jì)算服務(wù)中開始引進(jìn)新一代Gemini 1.5模型
Google在今年2月發(fā)布性能更強(qiáng)大、能夠支持超長文本的Gemini 1.5多模態(tài)模型,更成為今年Next最受矚目的焦點(diǎn)。
在Next大會(huì),Google將這款最新版Gemini模型上架到生成式AI開發(fā)平臺Vertex AI的模型花園中,Gemini 1.5模型不僅可同時(shí)支持文本、圖片、視頻、聲音及程序代碼的輸入,而且在Token處理數(shù)量上也比1.0版多出了31倍,甚至比GPT-4 Turbo高出7.8倍,最多可支持輸入長達(dá)100萬個(gè)Token,相當(dāng)于一次能處理1小時(shí)的視頻、11小時(shí)的音頻或超過70萬字的內(nèi)容。
Vertex AI先提供了中端款模型Gemini 1.5 Pro的公開預(yù)覽,并推出兩個(gè)不同規(guī)模的版本,分別能處理12.8萬個(gè)和100萬個(gè)Token數(shù)量的數(shù)據(jù)。Google強(qiáng)調(diào),Gemini 1.5 Pro模型在輸出品質(zhì)上足以媲美前一版最高端Gemini 1.0 Ultra模型,同時(shí)能減少運(yùn)算量。
Gemini 1.5 Pro還支持處理語音音頻流媒體和視頻的音頻,并具備跨模態(tài)分析功能,能夠同時(shí)分析文本、圖片、視頻和音頻等不同類型的數(shù)據(jù),此外,提供高品質(zhì)的轉(zhuǎn)錄功能,可用于搜索和分析。例如,可以使用Gemini 1.5 Pro對財(cái)報(bào)電話會(huì)議或投資人會(huì)議視頻或錄音進(jìn)行搜索、分析和回答問題。
目前已有United Wholesale Mortgage、SAP、TBS、Replit等企業(yè)開始在Vertex AI平臺上使用新版模型創(chuàng)建新的AI應(yīng)用,包含AI驅(qū)動(dòng)的顧客服務(wù)代理、學(xué)術(shù)指導(dǎo)導(dǎo)師,還能用AI分析大量復(fù)雜的財(cái)務(wù)文件、檢測文件中資訊不一致,以及用自然語言進(jìn)行數(shù)據(jù)集的探索。
最新的Gemini 1.5 Pro,現(xiàn)在也能在Gemini Cloud Assist云計(jì)算助手服務(wù)中以私人預(yù)覽方式提供,一次可以輸入最多30萬行的程序代碼,意味著,可以在程序庫中執(zhí)行大規(guī)模程序代碼檢索、調(diào)試及測試,也有助于加快企業(yè)許多老舊系統(tǒng)的現(xiàn)代化改造,將大批老舊程序語言轉(zhuǎn)為現(xiàn)代語言。Google Cloud平臺與技術(shù)基礎(chǔ)架構(gòu)宏觀經(jīng)濟(jì)理Brad Calder強(qiáng)調(diào),Gemini程序開發(fā)AI助手讓開發(fā)人員的工作效率因此提高30%。
在Next大會(huì)上,Google提出了5種企業(yè)上云轉(zhuǎn)型的新路徑,可從五種云計(jì)算服務(wù)類型開始上云,分別是基礎(chǔ)架構(gòu)云、開發(fā)者云、數(shù)據(jù)云、安全云、協(xié)作云。Google也將最新Genini模型集成到這幾類云服務(wù)中,像是協(xié)助回答問題,提供AI預(yù)測等。
以基礎(chǔ)架構(gòu)云為例,Google開始在企業(yè)數(shù)據(jù)中心部署的GDC分布式邊緣設(shè)備上提供各種開放AI模型,如Gemma、Llama等,并推出生成式AI搜索支持功能,讓用戶可以通過自然語言搜索從本地?cái)?shù)據(jù)中心或邊緣環(huán)境上快速檢索和分析內(nèi)部相關(guān)的數(shù)據(jù)和內(nèi)容,從而提高員工工作效率和知識共享。
Google更推出了多項(xiàng)基礎(chǔ)架構(gòu)的技術(shù)創(chuàng)新,可以用來支持龐大AI發(fā)展的需求,像是正式推出新版的TPU v5p,還推出A3 Mega、Nvidia Blackwell GPU運(yùn)算平臺,支持大規(guī)模的GAI模型訓(xùn)練與推論。Google更展示首款專為數(shù)據(jù)中心設(shè)計(jì)的Arm架構(gòu)處理器Axion,跟同級的x86虛擬機(jī)相比, Axion性能提高了50%,能源效率也提升60%,未來有可能將其與TPU一同用于GAI模型服務(wù)。目前這款處理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube廣告服務(wù)中使用。
在云計(jì)算應(yīng)用生命周期管理上,Google推出名為Gemini Cloud Assist的云計(jì)算運(yùn)維助手的私人預(yù)覽, 也就是先前專用于IT運(yùn)維設(shè)計(jì)的Duet AI助手進(jìn)化版,不只采用最新Gemini模型,能夠涵蓋應(yīng)用程序生命周期的管理,提供包括目標(biāo)設(shè)計(jì)、安全、運(yùn)維指導(dǎo)、故障排除等多方面輔助功能。另外提供性能和成本優(yōu)化的建議。
Google公布新生成式AI產(chǎn)品架構(gòu)
Google Cloud在會(huì)中提出一個(gè)生成式AI產(chǎn)品架構(gòu)藍(lán)圖,將生成式AI產(chǎn)品架構(gòu)從過去生成式AI開發(fā)工具為主的開發(fā)架構(gòu),變成是擴(kuò)大延伸到各種云計(jì)算服務(wù)的產(chǎn)品架構(gòu)。
這個(gè)產(chǎn)品技術(shù)框架可以進(jìn)一步分為4層,雖然和過去生成式AI開發(fā)平臺Vertex AI都是4層架構(gòu),但兩者在本質(zhì)上有很大的差別。新架構(gòu)最底層是AI Hypercomputer超級計(jì)算機(jī)基礎(chǔ)架構(gòu),專門針對生成式AI強(qiáng)化推出的基礎(chǔ)架構(gòu),提供AI模型訓(xùn)練和服務(wù)所需的各種AI加速硬件、軟件框架和相關(guān)系統(tǒng)資源,與Vertex AI的底層是以一般性的云計(jì)算基礎(chǔ)架構(gòu)為主有所不同。
再上一層是Gemini模型。原本Gemini只是Vertex AI模型花園中的一個(gè)模型,現(xiàn)在被拆分出來,成為與Vertex AI開發(fā)工具并重的另外一個(gè)重要的功能。這是因?yàn)镚emini模型已經(jīng)變成支持Google Cloud所有產(chǎn)品的重要核心基礎(chǔ)模型。第三層是生成式AI平臺Vertex AI,包含了AI Studio、Colab、VS Code等各種GAI開發(fā)工具。最上層則是Google云計(jì)算服務(wù)和辦公生產(chǎn)力Workspace專用的Gemini助手,以及企業(yè)自建的生成式AI代理。
新產(chǎn)品架構(gòu)下的Vertex AI平臺,現(xiàn)在進(jìn)一步加強(qiáng)企業(yè)GAI代理開發(fā)的支持。
例如在模型構(gòu)建上,Google將Google搜索作為可信來源的參考基準(zhǔn),推出Grounding with Google Search新服務(wù),利用Google搜索結(jié)果比對模型生成的內(nèi)容,借此提高回應(yīng)品質(zhì)并減少幻覺。在模型微調(diào)方面,Vertex AI提供簡化提示設(shè)計(jì),讓開發(fā)者更容易撰寫出高品質(zhì)的提示,并推出新提示管理工具,可用于管理、關(guān)注,比較不同提示版本的回應(yīng)品質(zhì)。此外,模型部署到正式環(huán)境前,開發(fā)人員也能利用新的模型評估機(jī)制AutoSxS比較兩個(gè)LLM模型版本的差異對于最后模型推論的影響,以此選擇最佳模型版本用于生產(chǎn)環(huán)境。
Google這次推出了一站式AI解決方案,稱作Vertex Al Agent Builder,該方案進(jìn)一步結(jié)合“搜索”和“對話”兩類GAI應(yīng)用組件,能快速在企業(yè)內(nèi)部應(yīng)用創(chuàng)建和部署No Code對話式生成式AI代理,且可與企業(yè)系統(tǒng)相連接,讓生成的回復(fù)內(nèi)容可以貼近企業(yè)的實(shí)際情況。
Thomas Kurian指出,企業(yè)在Vertex AI中可以快速自建GAI代理,來執(zhí)行不同任務(wù),像是有顧客服務(wù)的AI代理、員工管理的AI代理,還有創(chuàng)意設(shè)計(jì)、數(shù)據(jù)分析、程序撰寫和安全等不同的AI代理?!懊恳粋€(gè)GAI代理都具有多模態(tài)執(zhí)行能力,能夠同時(shí)處理多種資訊?!?/p>
Google公開了最新的TPU模塊機(jī)架式機(jī)柜(左圖)和云計(jì)算GPU機(jī)柜(右圖),用來提供包含Gemini在內(nèi)的GAI模型訓(xùn)練和服務(wù)。每臺TPU模塊機(jī)柜最多可容納64個(gè)TPUv5p模塊。
云計(jì)算AI運(yùn)維助手不只提供云成本優(yōu)化的建議,還支持目標(biāo)驅(qū)動(dòng)設(shè)計(jì)
Google今年云計(jì)算產(chǎn)品發(fā)布中另一個(gè)重要焦點(diǎn),著重在加強(qiáng)其云計(jì)算服務(wù)GAI集成能力,與去年剛推出時(shí)相比,現(xiàn)在在Google云計(jì)算服務(wù)中不僅可以使用GAI助手完成更多任務(wù),進(jìn)一步也將其擴(kuò)大到更多的服務(wù)中。
Google今年開始以生成式AI助手Gemini為品牌,應(yīng)用在各種云計(jì)算服務(wù)中,推出軟件開發(fā)AI助手、應(yīng)用生命周期平臺的AI運(yùn)維助手、數(shù)據(jù)分析平臺的AI分析助手,BI平臺的AI洞察助手,數(shù)據(jù)庫的A管理助手,以及安全的AI防護(hù)助手。
AI運(yùn)維助手的最大特色是,引進(jìn)最新Gemini模型,涵蓋應(yīng)用程序生命周期的運(yùn)維管理。
例如,AI運(yùn)維助手現(xiàn)在能支持目標(biāo)驅(qū)動(dòng)設(shè)計(jì)的功能,讓運(yùn)維人員可以用自然語言描述創(chuàng)建待測試的目標(biāo)和用戶旅程流程,進(jìn)而產(chǎn)生自訂的測試腳本,根據(jù)需求進(jìn)一步提供架構(gòu)配置、部署或設(shè)置,例如提供網(wǎng)絡(luò)配置或協(xié)助三層架構(gòu)應(yīng)用程序部署、理解Terraform腳本等。
此外,還能搜集和分析Cloud Logging中各種日志,提供IT團(tuán)隊(duì)相關(guān)摘要和解釋,并提供故障排除的建議。甚至在身份權(quán)限管控上也能使用AI運(yùn)維助手提供IAM身份識別與訪問管理的建議,例如根據(jù)企業(yè)數(shù)據(jù)、加密偏好以及合規(guī)性需求在加密密鑰創(chuàng)建過程中提供協(xié)助。
服務(wù)性能和成本優(yōu)化也是AI運(yùn)維助手這次添加的功能之一。例如可以偵測哪些集群是在開發(fā)或測試環(huán)境中執(zhí)行,或是被用于實(shí)驗(yàn)的集群,還可識別資源過剩的集群并提供建議,讓管理者可以重新調(diào)整資源分配,降低云計(jì)算花費(fèi)。
在數(shù)據(jù)服務(wù)的AI助手上,Google Cloud持續(xù)強(qiáng)化旗下數(shù)據(jù)產(chǎn)品與Gemini的集成。舉例來說,現(xiàn)在在BigQuery數(shù)據(jù)倉庫中,數(shù)據(jù)分析人員可以自然語言方式向Gemini助手提需求進(jìn)行數(shù)據(jù)準(zhǔn)備、查找、分析及治理,并且能夠使用Gemini 1.0 Pro,執(zhí)行多模態(tài)和高端推理的功能。
不僅如此,BigQuery與Vertex AI之間的結(jié)合更緊密,用戶可以直接在BigQuery中訪問Vertex AI中的AI型,代表企業(yè)可以將這些AI模型、ML operators和統(tǒng)計(jì)分析功能納入到企業(yè)內(nèi)部數(shù)據(jù)工作流程中,進(jìn)行多模態(tài)析,包括結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)。在BigQuery中能通過Vertex AI模型API處理文件文件和音頻。不過目前這些Gemini功能大多處于預(yù)覽階段。
在應(yīng)用開發(fā)輔助方面,Google宣布其程序撰寫AI助手現(xiàn)已達(dá)企業(yè)級的安全和可靠,并支持最新的Gemini 1.5 Pro,可以在程序庫中執(zhí)行大規(guī)模程序代碼檢索、調(diào)試及測試。在云計(jì)算安全防護(hù)方面也強(qiáng)化了與Gemini的集成。例如,將Gemini集成至SecOps運(yùn)維流程中,并開始在威脅智能情報(bào)服務(wù)與SCC安全指揮中心中提供相關(guān)的Gemini服務(wù)。
除了推出算力更強(qiáng)的AI硬件,Google首款數(shù)據(jù)中心設(shè)計(jì)的Arm架構(gòu)處理器Axion首次公開亮相,未來有可能將其與TPU一同用于GAI模型服務(wù)。目前這款處理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube廣告服務(wù)中使用。
企業(yè)辦公生產(chǎn)力工具深度集成Gemini能力,還增添視頻創(chuàng)作AI助手Vids
企業(yè)生產(chǎn)力應(yīng)用是另一大云計(jì)算GAI戰(zhàn)場。為了力抗微軟M365,Google Workspace在今年二月開始引進(jìn)Gemini模型,加強(qiáng)對Workspace內(nèi)容的多模態(tài)高端理解能力,Google同時(shí)也將Workspace的AI助手Duet AI改名為Gemini,并推出商用版與企業(yè)版,提供更多企業(yè)級功能。
Workspace目前擁有超過30億用戶和超過1,000萬付費(fèi)訂閱客戶。Google Workspace的副總裁兼宏觀經(jīng)濟(jì)理Aparna Pappu表示,在近8個(gè)月內(nèi),在Workspace中使用Gemini服務(wù)的用戶超過一百萬人,還有上千家企業(yè)采用,包括Uber、Verizon、Sports Basement等。
Workspace今年產(chǎn)品更新一大重點(diǎn)就是GAI。Gemini現(xiàn)在已經(jīng)能夠跨Workspace產(chǎn)品線生成內(nèi)容,Chat和Docs中都開始使用最新的Gemin模型。
在Gmail中添加語音提示和即時(shí)潤色,只需向Gemin說出“幫助我寫作”,就能完成草稿,并且一鍵轉(zhuǎn)換為完整的電子郵件。Meet上添加了AI會(huì)議和通訊的擴(kuò)展功能,每位用戶每月10美元,可以提供“為我做筆記”、“為我翻譯”等功能。還可以自動(dòng)檢測和翻譯Meet中的字幕,最多支持69種語言,并在預(yù)覽版Chat中自動(dòng)翻譯消息、對話摘要和問題回答,將于今年稍后推出。
Google也通過AI加強(qiáng)Workspace的安全防護(hù),推出AI Security商用附加服務(wù),能夠協(xié)助安全人員自動(dòng)分類Google硬盤中的敏感文件并提供防護(hù)。此外在測試版Gmail中開始提供DLP數(shù)據(jù)外泄防護(hù)的控制和分類標(biāo)簽功能,甚至之后將實(shí)驗(yàn)后量子加密PQC算法納入其中。
Workspace這次還推出了全新的AI視頻創(chuàng)作生產(chǎn)力服務(wù)Google Vids。這是一個(gè)集成視頻、寫作、制作和編輯的AI助手,讓即使是不熟悉視頻創(chuàng)作的營銷人員也能快速制作出各種視頻內(nèi)容,用于產(chǎn)品營銷、人才培訓(xùn)、團(tuán)體慶祝等活動(dòng)。 Vids雖然采用了Gemini模型,但與OpenAI的短片生成AI模型Sora不同,并非生成完整的視頻內(nèi)容,而是根據(jù)用戶的描述從視頻數(shù)據(jù)庫中找出相應(yīng)的視頻、圖片和背景音樂的場景,然后將它們集成在一起,協(xié)助用戶完成分鏡腳本、后期和編輯。這項(xiàng)實(shí)驗(yàn)性服務(wù)預(yù)計(jì)在6月推出。
隨著GAI應(yīng)用在2024年大爆發(fā),Thomas Kurian強(qiáng)調(diào),企業(yè)正在迎來一個(gè)GAI代理的新時(shí)代,并且創(chuàng)建在全新、完全開放的AI平臺之上,“我們正在重塑云計(jì)算基礎(chǔ)架構(gòu),以應(yīng)對該趨勢?!?/p>
不只搶攻云計(jì)算GAI,Google正在通過在手機(jī)上執(zhí)行的輕量Gemini模型,以及用相同技術(shù)所開發(fā)的開源邊緣AI模型Gemma,瞄準(zhǔn)企業(yè)邊緣GAI應(yīng)用需求。