我們?cè)谥暗奈恼隆皞鹘y(tǒng)IT向云遷移的實(shí)踐指南”介紹過云遷移是一個(gè)復(fù)雜的過程,回顧遷移項(xiàng)目實(shí)施流程通常為:
1、需求調(diào)研
2、遷移方案詳細(xì)設(shè)計(jì)
3、技術(shù)驗(yàn)證
4、實(shí)施及切割
5、遷移結(jié)果驗(yàn)證及驗(yàn)收
本篇我們將重點(diǎn)分享實(shí)施及切割及上線環(huán)節(jié)的注意事項(xiàng)。
根據(jù)云遷移項(xiàng)目應(yīng)用復(fù)雜程度,上線切割過程通常會(huì)有一個(gè)或多個(gè)短暫的窗口期,如果客戶是擁有眾多核心關(guān)鍵業(yè)務(wù)的中大型企業(yè),通常應(yīng)用切割上云(業(yè)務(wù)中斷)窗口期會(huì)在非業(yè)務(wù)繁忙期的8-24小時(shí)(借助工具,線上遷移方式時(shí)間會(huì)短一些)。一個(gè)遷移項(xiàng)目前期的需求調(diào)研、遷移設(shè)計(jì)、遷移驗(yàn)證可能需要花費(fèi)幾個(gè)月的時(shí)間,而完成遷移成功的結(jié)果就在這樣的幾個(gè)切割窗口期里體現(xiàn),如果經(jīng)驗(yàn)不足的遷移團(tuán)隊(duì)在切割的環(huán)節(jié)出現(xiàn)問題,導(dǎo)致切割失敗,參與人(客戶、遷移服務(wù)商等)可能有嚴(yán)重的挫敗感。
切割上線前的準(zhǔn)備
針對(duì)切割上線的重要性,也許各方領(lǐng)導(dǎo)都會(huì)叮囑:“認(rèn)真、謹(jǐn)慎、仔細(xì)”,具體在實(shí)施切割上線的時(shí)候如何執(zhí)行這樣主觀空洞但“正確”的指示呢。
在遷移設(shè)計(jì)環(huán)節(jié)會(huì)設(shè)計(jì)一個(gè)遷移實(shí)施切割計(jì)劃,這個(gè)計(jì)劃的嚴(yán)謹(jǐn)程度也許很大程度上決定了遷移成功率。優(yōu)秀的云遷移服務(wù)商會(huì)從之前的項(xiàng)目中不斷地總結(jié)成功的經(jīng)驗(yàn)和失敗的教訓(xùn),沉淀出自己的一套體系化的遷移方法。以下給出幾個(gè)經(jīng)驗(yàn):
1)切割前需要嚴(yán)格確認(rèn)是否所有需要預(yù)先準(zhǔn)備的工具、遷移環(huán)境(客戶本地?cái)?shù)據(jù)中心端、網(wǎng)絡(luò)、云端)等已經(jīng)就緒。
2)檢查和確認(rèn)云環(huán)境著陸區(qū)(Landing Zone,云上使用的資源)已經(jīng)就緒,并且確認(rèn)云環(huán)境中的規(guī)模,安全,控制,網(wǎng)絡(luò)以及身份驗(yàn)證與設(shè)計(jì)保持一致。
3)切割上線時(shí)需多方人員參與,軟硬件廠商、集成商、用戶方、云廠商、網(wǎng)絡(luò)運(yùn)營商等,確認(rèn)這些相關(guān)人員是否已經(jīng)就緒。支持的方式是現(xiàn)場、遠(yuǎn)程還是電話。
4)風(fēng)險(xiǎn)預(yù)案是否就緒。切割過程好像在打一場大的戰(zhàn)役,很多的任務(wù)或子任務(wù)會(huì)分配半小時(shí)內(nèi)計(jì)劃執(zhí)行結(jié)束,整個(gè)過程可能會(huì)緊張到心臟要跳出來了。為降低壓力,退一步海闊天空,即使因?yàn)槟硞€(gè)主客觀原因?qū)е逻w移無法成功進(jìn)行,如果有補(bǔ)救措施會(huì)讓整個(gè)遷移團(tuán)隊(duì)降低很多壓力。這個(gè)補(bǔ)救措施之一就是回退預(yù)案,也即是失敗后回退到客戶的原數(shù)據(jù)中心恢復(fù)業(yè)務(wù)應(yīng)用,需要在切割時(shí)預(yù)留回退執(zhí)行的時(shí)間?;赝藞?zhí)行后,然后擁有充足的時(shí)間排查問題,以備下一個(gè)切割窗口期內(nèi)再次切割。
5)向Azure遷移的項(xiàng)目,可以參考一些工具來設(shè)計(jì)一個(gè)檢查列表,比如:遷移評(píng)估及準(zhǔn)備工具(SMART),Azure遷移向?qū)?Azure實(shí)施向?qū)А_@個(gè)計(jì)劃表里面包含了遷移切割過程的全部任務(wù)、時(shí)間段、各方執(zhí)行人員、備崗支持人員等?!罢J(rèn)真、謹(jǐn)慎、仔細(xì)”的按照這個(gè)切割計(jì)劃表執(zhí)行就好了。下圖給出一個(gè)示例模板,在具體的項(xiàng)目中可以根據(jù)項(xiàng)目需求來設(shè)計(jì)定制的遷移切割計(jì)劃
云遷移切割計(jì)劃
切割上線
如之前提到,遷移項(xiàng)目是復(fù)雜的,大部分遷移切割的時(shí)候都會(huì)或多或少的遇到一些無法預(yù)料的問題。如何保證切割成功率,降低失敗的風(fēng)險(xiǎn)?從過去遇到的失敗案例說起,有主觀原因和客觀因素。主觀原因可能因?yàn)檫w移調(diào)研問題、遷移方案設(shè)計(jì)缺陷、遷移驗(yàn)證過程不夠全面等??陀^因素通常是客戶IDC、運(yùn)營商網(wǎng)絡(luò)、云數(shù)據(jù)中心故障等。無論那種問題導(dǎo)致,都可能會(huì)對(duì)遷移切割造成失敗。以下分享一些切割經(jīng)驗(yàn),
1)數(shù)據(jù)驗(yàn)證,確認(rèn)切割時(shí)與切割前數(shù)據(jù)保持一致。通??蛻舻拇蟛糠址?wù)器鏡像及數(shù)據(jù)會(huì)在切割前預(yù)先在云端復(fù)制完成。在切割窗口期開啟后需要確保云端復(fù)制的數(shù)據(jù)與客戶數(shù)據(jù)中心下線前保持一致。
2)并非所有問題都會(huì)導(dǎo)致遷移失敗。遇到問題的時(shí)候,先不用荒,首先評(píng)估問題的嚴(yán)重程度,如果不是關(guān)鍵業(yè)務(wù)應(yīng)用的重要的問題,可以將切割流程繼續(xù)進(jìn)行,同時(shí)該問題繼續(xù)解決。與客戶協(xié)商,該問題是否會(huì)會(huì)對(duì)業(yè)務(wù)有很大影響,如果客戶可以接受的話,可以先上線,然后盡快解決該問題。
3)遷移時(shí)間拖延問題處理。如果切割時(shí)不夠順利,因?yàn)榉N種主客觀原因?qū)е逻w移切割時(shí)間長于計(jì)劃時(shí)間,可以與客戶協(xié)調(diào),一起決定是否可以延遲一些時(shí)間上線。基于經(jīng)驗(yàn),通常設(shè)計(jì)切割計(jì)劃時(shí)都會(huì)留出一些緩沖時(shí)間,如果需要延遲的時(shí)間過長是客戶無法接受的,那就只能失望的遷移過程回退了。
4)網(wǎng)絡(luò)切換問題處理。比如IP,端口,網(wǎng)絡(luò)配置,DNS等問題,在之前的調(diào)研和檢查中出現(xiàn)遺漏(這個(gè)信息提供方可能由客戶的IT部門,第三方IT運(yùn)維公司,應(yīng)用系統(tǒng)集成商以及自動(dòng)工具提供)。這種問題在切割時(shí)經(jīng)常會(huì)遇到,出現(xiàn)這種問題緊急聯(lián)系相關(guān)負(fù)責(zé)方盡快解決,但并不一定會(huì)影響切割整體進(jìn)行。
5)遷移的不僅是服務(wù)器或數(shù)據(jù)。而是整個(gè)企業(yè)的IT應(yīng)用及環(huán)境,客戶應(yīng)用需要的身份管理、安全配置、數(shù)據(jù)及系統(tǒng)備份、高可用性架構(gòu)配置,容災(zāi)方案等都需要完成。
6)嚴(yán)格按照遷移設(shè)計(jì)方案中指定的云服務(wù)型號(hào)(SKU)匹配云上資源。拿VM舉例,通常云上會(huì)提供十幾個(gè)系列,數(shù)百種VM型號(hào),使用錯(cuò)誤的VM即使能夠?qū)⒎?wù)啟動(dòng)起來,但會(huì)帶來性能、功能以及成本的問題。當(dāng)使用了錯(cuò)誤的VM型號(hào)后,可以通過云上提供的型號(hào)切換功能切換到正確的VM型號(hào),無需刪除VM。
7)遷移過程確保安全合規(guī)。數(shù)據(jù)遷移嚴(yán)格使用加密數(shù)據(jù)傳輸,加密數(shù)據(jù)存儲(chǔ)。證書、密碼、權(quán)限按照合規(guī)的方式申請(qǐng)和使用,杜絕泄露隱患。避免因安全合規(guī)性問題帶給客戶嚴(yán)重?fù)p失。
切割上線后驗(yàn)證和結(jié)果討論
切割后對(duì)遷移的結(jié)果進(jìn)行驗(yàn)證,通常有先后兩個(gè)部分,即遷移服務(wù)商驗(yàn)證和客戶驗(yàn)證。分享以下一些經(jīng)驗(yàn):
1)衡量遷移是否成功需要按照遷移之前定義的參考指標(biāo)進(jìn)行。通常遷移服務(wù)商會(huì)在遷移切割時(shí)確定遷移的服務(wù)器、數(shù)據(jù)、網(wǎng)絡(luò)等IT服務(wù)資源是否已經(jīng)能夠在新的云環(huán)境下運(yùn)行起來。這種技術(shù)驗(yàn)證只是一個(gè)最初級(jí)的,在這基礎(chǔ)之上還要驗(yàn)證數(shù)據(jù)一致性、性能指標(biāo)、安全標(biāo)準(zhǔn)、成本狀況等,這些驗(yàn)證信息的定義都會(huì)在遷移設(shè)計(jì)時(shí)定義清楚。當(dāng)滿足了整個(gè)應(yīng)用的全面運(yùn)維指標(biāo)時(shí)才能算驗(yàn)證成功。
2)當(dāng)遷移服務(wù)商驗(yàn)證遷移結(jié)果后,會(huì)由客戶進(jìn)行驗(yàn)證,這時(shí)客戶會(huì)對(duì)應(yīng)用IT環(huán)境及業(yè)務(wù)功能進(jìn)行驗(yàn)證,驗(yàn)證過程會(huì)更加權(quán)威,當(dāng)遇到一些問題的時(shí)候需要運(yùn)維服務(wù)商和客戶一起討論,此環(huán)節(jié)可能因?yàn)榭蛻羝谕c遷移結(jié)果的差異對(duì)遷移后的環(huán)境做局部的調(diào)整,這時(shí)需要評(píng)估工作量和實(shí)現(xiàn)時(shí)間,盡量避免不明確的問題產(chǎn)生,導(dǎo)致驗(yàn)收結(jié)果拖延。
總結(jié)
云遷移需要一個(gè)體系化的流程來實(shí)施上線,它不僅需要依靠工具還需要正確的流程、完備的支持人員以及解決緊急問題經(jīng)驗(yàn)來支撐,希望以上的經(jīng)驗(yàn)分享能夠?qū)τ性七w移訴求的技術(shù)人員有所幫助。