對整合和簡化運營監(jiān)督的渴望不僅限于云基礎設施。越來越多的客戶要求我們采用“單一窗格”方法來監(jiān)控和管理他們的應用程序組合。
這些客戶告訴我們,檢測和調查應用程序問題需要花費額外的時間和精力,由于通常會使用多個控制臺、工具和信息來源(如資源使用指標、日志等),所以其開發(fā)運維工程師能夠獲取正在調查的應用程序問題的上下文。在這里,“應用程序”不僅意味著應用程序代碼,還指作為托管應用程序的單元發(fā)揮作用的資源邏輯組,以及操作員的所有權限以及開發(fā)、暫存和生產(chǎn)等環(huán)境的所有權限。
今天,我很高興地宣布AWS Systems Manager的一項新功能,稱為應用程序管理器。應用程序管理器將來自多個AWS服務和Systems Manager功能的操作信息匯總到一個控制臺中,使您可以更輕松地查看應用程序的運行數(shù)據(jù)。
為了更加方便,該服務可以自動發(fā)現(xiàn)您的應用程序。今天,自動發(fā)現(xiàn)可用于在AWS CloudFormation堆棧和Amazon Elastic Kubernetes Service(EKS)集群中運行的應用程序,或使用AWS啟動向導。還可以從資源組中發(fā)現(xiàn)應用程序。
自動發(fā)現(xiàn)的一個特別好處是,應用程序組件和資源會自動持續(xù)保持最新狀態(tài),但是您也可以隨時通過手動添加或刪除組件來根據(jù)需要修訂應用程序。
通過發(fā)現(xiàn)應用程序并將其整合到單個控制臺中,您可以更輕松地診斷操作問題,并用最少的時間和精力解決這些問題??梢赃\行針對應用程序組件或資源的自動化Runbook,以幫助修復操作問題。對于任何給定的應用程序,您可以選擇資源并瀏覽相關詳細信息,而無需離開控制臺。
例如,該應用程序可以顯示Amazon CloudWatch日志、運營指標、AWS CloudTrail日志和配置更改,從而無需使用多個工具或控制臺。這意味著您的待命工程師可以更快地理解問題并縮短解決問題所需的時間。
使用應用程序管理器探索應用程序
我可以從Systems Manager主頁訪問應用程序管理器。打開后,會看到發(fā)現(xiàn)的應用程序的概述,并且可以立即看到有一些警報,而無需將上下文切換到Amazon CloudWatch控制臺,以及一些我可能需要注意的操作項目(“OpSitems”)。我還可以切換到Applications(應用程序)選項卡以查看應用程序集合,或者單擊Applications(應用程序)面板中對應感興趣集合的按鈕。
在下面的屏幕截圖中,我導航到一個示例應用程序,然后再次有指示器顯示警報已被激發(fā)。通過各種選項卡,我可以深入了解更多詳細信息,以查看應用程序使用的資源、配置資源和規(guī)則合規(guī)性、監(jiān)控警報、日志和與應用程序相關的自動化Runbook。
單擊 Alarm(警報)指示器將我?guī)?Monitoring(監(jiān)控)選項卡,它顯示 ConsumedWriteCapacityUnits 警報已被激發(fā)。我可以在事件發(fā)生時將時間尺度更改為零,也可以使用查看最近警報控制面板鏈接跳轉到 Amazon CloudWatch 警報控制臺以查看更多詳細信息。
Logs(日志)選項卡顯示應用程序的日志組的綜合列表,單擊日志組名稱直接轉到 CloudWatch Logs,在那里我可以檢查日志流,并利用 Log Insights 更深入地查詢?nèi)罩緮?shù)據(jù)。
OpSitems 顯示與應用程序資源相關的操作問題,并使我能夠指出問題的當前狀態(tài)(打開、進行中、已解決)。下面,我將把已停止的 EC2 實例的調查標記為進行中。
最后,Runbook 顯示與應用程序關聯(lián)的自動化文檔及其執(zhí)行狀態(tài)。下面,它顯示我運行 AWS-RestartEC2Instance 自動化文檔來重啟已停止的 EC2 實例,現(xiàn)在我將解決 OpSitems 選項卡中記錄的問題。
通過將這些信息整合到單個控制臺中,工程師可以在單一起始位置監(jiān)控和調查與其應用程序相關的問題,自動發(fā)現(xiàn)應用程序和資源,從而使入門變得簡單。AWS Systems Manager 應用程序管理器目前在提供 Systems Manager 的所有公共 AWS 區(qū)域可免費使用。