突破傳統(tǒng)開發(fā)模式,亞馬遜云科技助力中科院加速推動(dòng)合成生物學(xué)

來源:亞馬遜云科技
作者:亞馬遜云科技
時(shí)間:2023-02-13
1392
當(dāng)數(shù)字技術(shù)成為整個(gè)社會(huì)運(yùn)行的底座,生物科學(xué)也能借力云計(jì)算,從諸多繁瑣重復(fù)的工作中解放出來,專注于生物設(shè)計(jì)與創(chuàng)新,來看看亞馬遜云科技如何與TIBCAS合作,推動(dòng)合成生物學(xué)的發(fā)展。

當(dāng)數(shù)字技術(shù)成為整個(gè)社會(huì)運(yùn)行的底座

生物科學(xué)也能借力云計(jì)算

從諸多繁瑣重復(fù)的工作中解放出來

專注于生物設(shè)計(jì)與創(chuàng)新

來看看亞馬遜云科技如何與TIBCAS合作

推動(dòng)合成生物學(xué)的發(fā)展

中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所(TIBCAS)是一家從事工業(yè)生物技術(shù)研發(fā)的科研機(jī)構(gòu),由中國(guó)科學(xué)院和天津市人民政府共建。2019年,由TIBCAS牽頭建設(shè)的國(guó)家合成生物技術(shù)創(chuàng)新中心正式啟動(dòng)建設(shè),生物設(shè)計(jì)中心是其重要的平臺(tái)實(shí)驗(yàn)室之一。從創(chuàng)立之初,生物設(shè)計(jì)中心就在探索一種不同于傳統(tǒng)實(shí)驗(yàn)室的研發(fā)新模式,以數(shù)據(jù)和算法為核心,通過構(gòu)建生物技術(shù)和信息技術(shù)相結(jié)合(BT+IT)的技術(shù)體系,在未來將菌種設(shè)計(jì)構(gòu)建的主要工作交由計(jì)算機(jī)完成。

自2019年TIBCAS就開始和亞馬遜云科技共同探索,如何通過云計(jì)算助力TIBCAS在菌種計(jì)算設(shè)計(jì)和業(yè)務(wù)關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)檢索方面的創(chuàng)新。借助亞馬遜云科技豐富的Serverless服務(wù)和圖數(shù)據(jù)庫(kù)Amazon Neptune技術(shù),TIBCAS構(gòu)建了高通量編輯序列設(shè)計(jì)云平臺(tái)AutoESD和完整的大腸桿菌調(diào)控知識(shí)圖譜ERMer,大幅提升一線研究人員的研發(fā)效率。

1 明確核心需求,選擇合作伙伴

640.jpg

“圍繞細(xì)胞工廠設(shè)計(jì)創(chuàng)制的核心任務(wù),生物設(shè)計(jì)中心主要有兩大方面的工作,其一是研發(fā)計(jì)算機(jī)輔助生物設(shè)計(jì)工具;其二是開發(fā)核心數(shù)據(jù)庫(kù)”TIBCAS項(xiàng)目研究員廖小平介紹說。

在合成生物學(xué)實(shí)驗(yàn)過程中,一個(gè)重要的步驟就是編輯序列設(shè)計(jì),關(guān)系到最終目標(biāo)細(xì)胞工廠是否能夠成功構(gòu)建。目前的編輯序列設(shè)計(jì)仍然依靠人工或“半自動(dòng)化”的模式:人工設(shè)計(jì)高度依賴研究者自身的經(jīng)驗(yàn),因其主觀性和偏好性會(huì)導(dǎo)致結(jié)果千差萬別;而“半自動(dòng)化”設(shè)計(jì),雖由計(jì)算機(jī)輔助,但因?yàn)閱我还ぞ咄荒芨采w遺傳操作的部分環(huán)節(jié),研究過程必須協(xié)同使用多款軟件,既增加了學(xué)習(xí)成本,又由于彼此間的數(shù)據(jù)交換標(biāo)準(zhǔn)不一致,導(dǎo)致出錯(cuò)的風(fēng)險(xiǎn)。

如今,大規(guī)模合成生物制造平臺(tái)——生物鑄造廠(BioFoundry)高速發(fā)展,使高通量的遺傳操作成為可能,相關(guān)實(shí)驗(yàn)流程也越來越模塊化、標(biāo)準(zhǔn)化,人工或“半自動(dòng)化”模式很難實(shí)現(xiàn)高通量、自動(dòng)化的微生物構(gòu)建,影響開發(fā)效率。

而對(duì)于“開發(fā)核心數(shù)據(jù)庫(kù)”的需求,廖小平解釋到:“細(xì)胞中的代謝調(diào)控非常復(fù)雜,不同類型的調(diào)控?cái)?shù)據(jù)通常散落在各個(gè)不同的數(shù)據(jù)庫(kù),很難對(duì)這些調(diào)控關(guān)系實(shí)現(xiàn)全局性認(rèn)識(shí),只有重新設(shè)計(jì)一個(gè)存儲(chǔ)和分析高連接數(shù)據(jù)的新框架,將這些不同類型的代謝調(diào)控相互作用匯集在一起,并提供方便的交互方式,才能方便生物學(xué)家挖掘和理解生物體內(nèi)的復(fù)雜調(diào)控關(guān)系?!?/p>

TIBCAS之所以選擇與亞馬遜云科技合作,一是亞馬遜云科技針對(duì)科研領(lǐng)域提供了具有行業(yè)深度的解決方案,在云服務(wù)上能夠滿足不同業(yè)務(wù)場(chǎng)景的需求,并具備典型的成功案例,同時(shí),亞馬遜云科技有豐富工業(yè)生物行業(yè)經(jīng)驗(yàn),能夠理解TIBCAS行業(yè)應(yīng)用場(chǎng)景,并提供有深度的指導(dǎo)意見;二是亞馬遜云科技Serverless技術(shù)成熟,多項(xiàng)創(chuàng)新托管服務(wù)極大簡(jiǎn)化了行業(yè)應(yīng)用創(chuàng)新難度;三是亞馬遜云科技專業(yè)服務(wù)團(tuán)隊(duì)提供全生命周期技術(shù)支持,能加速項(xiàng)目落地;四是通過亞馬遜云科技創(chuàng)新研究資助計(jì)劃,可以對(duì)TIBCAS科研項(xiàng)目提供支持。

2 亞馬遜云科技的多項(xiàng)服務(wù)

助力TIBCAS實(shí)現(xiàn)行業(yè)應(yīng)用創(chuàng)新

·基于Serverless架構(gòu)開發(fā)AutoESD云平臺(tái),實(shí)現(xiàn)自動(dòng)化和高通量的編輯序列設(shè)計(jì)

Serverless服務(wù)輕量化且易于使用,與生物工程真實(shí)的業(yè)務(wù)場(chǎng)景結(jié)合,能更便捷地實(shí)現(xiàn)復(fù)雜的工作流編排和異常處理,提供輕量化且足夠彈性的算力需求,能夠進(jìn)行模塊化封裝和復(fù)用的組件等需求。為此,TIBCAS通過對(duì)遺傳操作技術(shù)的模塊化解構(gòu)與標(biāo)準(zhǔn)化處理,結(jié)合亞馬遜云科技提供的Serverless服務(wù),實(shí)現(xiàn)了全流程、自動(dòng)化和高通量的編輯序列設(shè)計(jì),開發(fā)出云平臺(tái)AutoESD。該平臺(tái)支持多種基于篩選標(biāo)記的同源重組技術(shù)變種,理論上支持所有基因組序列已知的微生物,并可以在單批次任務(wù)中處理針對(duì)不同目標(biāo)序列(CDS或基因間區(qū)域)的多種類型的遺傳操作(敲除、插入和替換)。

640 (4).png

廖小平介紹說:“基于云上的無服務(wù)器架構(gòu)模式,我們構(gòu)建了第一個(gè)適用所有操作類型、任何基因組位點(diǎn)和跨物種的精確、自動(dòng)化和高通量編輯序列設(shè)計(jì)的云平臺(tái)AutoESD,大大降低了一線科研人員使用工具的門檻,為將來實(shí)現(xiàn)快速高效的‘設(shè)計(jì)—構(gòu)建—測(cè)試—學(xué)習(xí)’合成生物學(xué)工程循環(huán)奠定了基礎(chǔ)?!?/p>

此外,TIBCAS開發(fā)的IMODB、BioTools等工具也采用同樣的底層架構(gòu),由Amazon Simple Storage Service(Amazon S3)和Amazon DynamoDB分別為靜態(tài)資源和動(dòng)態(tài)資源的存儲(chǔ)提供支持,Amazon API Gateway實(shí)現(xiàn)API接口,后端通過Amazon Lambda和Amazon Batch來承載不同算力需求的任務(wù),Amazon Step Functions能夠幫助工程師更好的管理序列設(shè)計(jì)工作流,以及處理工作流中復(fù)雜的任務(wù)依賴關(guān)系。在部署上,基礎(chǔ)架構(gòu)部分都通過CDK完成基礎(chǔ)架構(gòu)代碼化,能夠?qū)崿F(xiàn)自動(dòng)化部署和版本管理,在業(yè)務(wù)層面如頁(yè)面前端、后端復(fù)雜計(jì)算過程,通過CI/CD實(shí)現(xiàn)自動(dòng)化集成和部署。

·借助Amazon Neptune設(shè)計(jì)ERMer,探索完整的大腸桿菌調(diào)控知識(shí)圖譜

在“開發(fā)核心數(shù)據(jù)庫(kù)”時(shí),TIBCAS聯(lián)合亞馬遜云科技針對(duì)微生物領(lǐng)域真實(shí)業(yè)務(wù)場(chǎng)景需求,基于Amazon Neptune圖數(shù)據(jù)庫(kù)、無服務(wù)器架構(gòu)和圖形可視化引擎,設(shè)計(jì)出一款存儲(chǔ)和分析高連接數(shù)據(jù)的新框架,實(shí)現(xiàn)了有效的交互式檢索和可視化,該框架具有很好的通用性和擴(kuò)展性,可以非常方便地延伸到生物學(xué)多個(gè)應(yīng)用領(lǐng)域和物種的研究中。利用該框架,TIBCAS開發(fā)了目前第一個(gè)基于圖數(shù)據(jù)庫(kù)的大腸桿菌調(diào)控知識(shí)圖譜ERMer。ERMer實(shí)現(xiàn)了多種復(fù)雜調(diào)控級(jí)聯(lián)或模式的快速檢索和可視化,讓科研人員能夠以交互式、無需編程的方法探索完整的大腸桿菌調(diào)控圖譜。

640 (1).jpg

TIBCAS基于亞馬遜云科技的系統(tǒng)架構(gòu)示意圖

“Amazon Neptune是我們知識(shí)的載體,能夠高效存儲(chǔ)和檢索高度復(fù)雜關(guān)聯(lián)的數(shù)據(jù),在業(yè)務(wù)場(chǎng)景應(yīng)用中相比傳統(tǒng)數(shù)據(jù)庫(kù)提升了數(shù)百倍的性能,”廖小平表示,“同時(shí),Amazon Neptune也是我們實(shí)現(xiàn)圖譜核心能力的載體,能夠?qū)⒌湫汀?fù)雜的生物學(xué)問題轉(zhuǎn)化為圖論問題,科研人員只需要輸入所關(guān)注的途徑名稱,即可獲得所有調(diào)控代謝物的可視化結(jié)果,提升了科研工作效率。”

為了進(jìn)一步發(fā)揮知識(shí)圖譜的價(jià)值,TIBCAS還采用了Amazon Neptune ML來訓(xùn)練模型,通過使用圖譜神經(jīng)網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)了轉(zhuǎn)錄因子預(yù)測(cè)和轉(zhuǎn)錄因子靶點(diǎn)預(yù)測(cè)等功能。

3 獲得的收益

TIBCAS通過亞馬遜云科技提供的多項(xiàng)創(chuàng)新托管服務(wù),尤其是Serverless服務(wù)和架構(gòu)優(yōu)化,在流量峰值、訪問穩(wěn)定、成本優(yōu)化和運(yùn)維簡(jiǎn)化等方面都取得了令人滿意的成效,極大地簡(jiǎn)化了行業(yè)應(yīng)用創(chuàng)新與發(fā)展的難度,加速了通過數(shù)字化能力對(duì)合成生物學(xué)的推動(dòng)。

·無服務(wù)器架構(gòu)實(shí)現(xiàn)強(qiáng)大高通量性能

通過采用無服務(wù)器架構(gòu)模式,AutoESD云平臺(tái)具有非常強(qiáng)大的高通量性能,可以同時(shí)支撐幾百個(gè)終端用戶,每個(gè)用戶可以提交幾千個(gè)編輯目標(biāo)設(shè)計(jì)需求,并且僅需幾分鐘時(shí)間便可得到反饋結(jié)果,即使面對(duì)研究成果發(fā)布或迭代時(shí),TIBCAS也可從容應(yīng)對(duì)流量峰值。

·簡(jiǎn)化運(yùn)維,讓研究人員專注于業(yè)務(wù)代碼和創(chuàng)新

系統(tǒng)依托Serverless技術(shù)實(shí)現(xiàn)原生高可用、高性能,且基于CDK對(duì)基礎(chǔ)設(shè)施進(jìn)行代碼化后,能夠?qū)崿F(xiàn)基礎(chǔ)設(shè)施的自動(dòng)化部署與更新,同時(shí)保證生產(chǎn)與測(cè)試環(huán)境的一致性,降低人工運(yùn)維壓力,且開發(fā)實(shí)踐時(shí)間大幅縮短,僅為之前的四分之一,大幅提升了研發(fā)效率。

·成本節(jié)約,資源精準(zhǔn)匹配業(yè)務(wù)

無需硬件成本投入,即能保證業(yè)務(wù)在被請(qǐng)求時(shí)可以及時(shí)獲得響應(yīng),且大部分服務(wù)都能夠按秒甚至毫秒計(jì)費(fèi),成本投入能夠更精細(xì)地匹配到業(yè)務(wù),相比傳統(tǒng)方案TCO降低了50%,實(shí)現(xiàn)更細(xì)粒度的按需付費(fèi)。

未來,TIBCAS希望基于亞馬遜云科技先進(jìn)的服務(wù)技術(shù)和能力,進(jìn)一步助力研究所在合成生物領(lǐng)域的科研探索,如進(jìn)一步通過AI、量子計(jì)算等服務(wù)開展科研創(chuàng)新等。此外,也期望依托于亞馬遜云科技的全球科研領(lǐng)域輻射能力,提升TIBCAS國(guó)際影響力,為世界各國(guó)的合成生物學(xué)科研工作者提供最優(yōu)質(zhì)的服務(wù)。

4 關(guān)于TIBCAS

中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所(以下簡(jiǎn)稱TIBCAS)成立于2012年,是由中國(guó)科學(xué)院和天津市人民政府共建、從事生物技術(shù)創(chuàng)新推動(dòng)工業(yè)領(lǐng)域生態(tài)發(fā)展的科研機(jī)構(gòu)。TIBCAS圍繞綠色低碳和經(jīng)濟(jì)社會(huì)可持續(xù)發(fā)展的重大需求,面向國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng)和工業(yè)生物科技前沿,以生物設(shè)計(jì)為核心,開展工業(yè)生物技術(shù)戰(zhàn)略性、前瞻性的基礎(chǔ)與應(yīng)用基礎(chǔ)研究,集聚工業(yè)生物科技力量,創(chuàng)新生物產(chǎn)業(yè)關(guān)鍵核心技術(shù)與重大顛覆性技術(shù),構(gòu)建工業(yè)經(jīng)濟(jì)發(fā)展的生態(tài)路線,服務(wù)我國(guó)綠色生物經(jīng)濟(jì)與社會(huì)經(jīng)濟(jì)可持續(xù)的發(fā)展。截至目前,TIBCAS已經(jīng)承擔(dān)了各類科研項(xiàng)目約700項(xiàng),在生物醫(yī)藥、化工產(chǎn)業(yè)、紡織、發(fā)酵等領(lǐng)域?yàn)?8個(gè)省市的幾百家企業(yè)提供服務(wù)。

TIBCAS在與亞馬遜云科技的合作中,重點(diǎn)使用了這些產(chǎn)品:Amazon S3、Amazon Lambda、Amazon Neptune、Amazon Batch、Amazon DynamoDB和Amazon API Gateway。同時(shí),也離不開如下的重點(diǎn)領(lǐng)域科研支持:亞馬遜云科技科研支持計(jì)劃(Amazon Cloud Credit for Research)、亞馬遜云科技杰出研發(fā)獎(jiǎng)(Amazon Research Awards)、亞馬遜云科技科學(xué)頻道(Amazon Sciences)。未來,雙方也會(huì)繼續(xù)努力在合成生物領(lǐng)域達(dá)成更堅(jiān)實(shí)更深入的合作。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來源:亞馬遜云科技
版權(quán)說明:本文內(nèi)容來自于亞馬遜云科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家