基因測(cè)序性能提升5倍,華為云FPGA基因加速方案彰顯技術(shù)創(chuàng)新能力
近期,華為云攜手峰科計(jì)算(以下簡(jiǎn)稱“峰科”)發(fā)布基于FPGA的基因加速云解決方案,該方案采用GATK(The Genome Analysis Toolkit)標(biāo)準(zhǔn)分析流程,將全基因組測(cè)序(WGS)性能提升5倍,比傳統(tǒng)模式提升3~5倍,同時(shí)測(cè)序精度可達(dá)99.95%以上,在大幅縮短測(cè)序時(shí)間的同時(shí)實(shí)現(xiàn)TCO大幅降低。
基因測(cè)序數(shù)據(jù)分析加速面臨的挑戰(zhàn)
首先,基因測(cè)序分析流程BWT+GATK當(dāng)前被業(yè)界廣泛采納,但采用此流程的傳統(tǒng)測(cè)序方法需要消耗高額算力及存儲(chǔ)資源,且耗時(shí)較長(zhǎng)。
其次,針對(duì)基因測(cè)序中高算力需求的smith-waterman,pair-h(huán)mm等算法處理,其具有計(jì)算并行性,不連續(xù),非規(guī)則的存儲(chǔ)訪問,低bit操作等特性,計(jì)算依賴不規(guī)則區(qū)域的操作會(huì)對(duì)CPU消耗很大,性能難以提升。
華為云FPGA基因加速解決方案的三大優(yōu)勢(shì)
為了更好的解決基因測(cè)序行業(yè)面臨的基因組分析標(biāo)準(zhǔn)流程不經(jīng)濟(jì)高效,以及跨不同云和硬件(CPUs,F(xiàn)PGAs)加速實(shí)現(xiàn)的雙重挑戰(zhàn)。華為云和峰科計(jì)算強(qiáng)強(qiáng)聯(lián)合,合作推出符合行業(yè)標(biāo)準(zhǔn)的GATK加速流程,通過對(duì)基因測(cè)序數(shù)據(jù)分析流程進(jìn)行軟、硬件聯(lián)合優(yōu)化實(shí)現(xiàn)端到端加速。華為云FPGA基因加速方案具備如下優(yōu)勢(shì):首先,華為云提供業(yè)界領(lǐng)先的FPGA加速云服務(wù)平臺(tái),采用業(yè)界領(lǐng)先的Xilinx 16nm Virtex UltraScale+ VU9P FPGA,并針對(duì)基因場(chǎng)景推出32核CPU224GB內(nèi)存1 VU9P FPGA和64核CPU448GB內(nèi)存2 VU9P FPGA規(guī)格的實(shí)例,實(shí)現(xiàn)了GATK軟件處理流程和FPGA加速流程的完美結(jié)合,從而將加速效率提升3~5倍。
其次,峰科采用GATK標(biāo)準(zhǔn)分析流程,精準(zhǔn)性與GATK標(biāo)準(zhǔn)流程完全吻合,精度可達(dá)99.95%以上。
第三,不修改GATK標(biāo)準(zhǔn)流程,可訪問讀取從原始測(cè)序數(shù)據(jù)到生成vcf文件整個(gè)過程中的中間數(shù)據(jù),便于科研用戶使用比對(duì)。
1. 華為云FPGA基因加速解決方案解析
華為云FPGA基因加速解決方案集成峰科的加速IP,為用戶提供一種易于使用,經(jīng)濟(jì)實(shí)惠的基于FPGA的基因組分析流程加速服務(wù),在該方案中,華為云配備了32核CPU,單個(gè)VU9P FPGA的實(shí)例。華為云FPGA基因加速解決方案使用GATK最佳方案對(duì)種系突變和體細(xì)胞突變進(jìn)行變異檢測(cè),將計(jì)算密集型算法如Smith-Waterman、PairHMM等確定為加速對(duì)象。每種算法都經(jīng)過FPGA內(nèi)核優(yōu)化,并且實(shí)現(xiàn)CPU-FPGA協(xié)同執(zhí)行和資源分配。如圖2所示,用戶通過分析應(yīng)用程序,把每個(gè)流程的數(shù)據(jù)傳給華為云峰科加速平臺(tái),平臺(tái)里的Kestrel運(yùn)行時(shí)管理工具來管理CPU-FPGA協(xié)同執(zhí)行和資源分配。利用多線程,I / O優(yōu)化和擴(kuò)展使用FPGA加速器,華為云FPGA基因加速服務(wù)的基因組學(xué)分析流程在保證精準(zhǔn)度情況下提供顯著的加速。
華為云FPGA基因加速方案結(jié)構(gòu)圖
與GATK最佳使用流程相對(duì)稱,典型的基因測(cè)序數(shù)據(jù)分析流程始于原始FASTQ序列兩端讀長(zhǎng)(paired-end reads),進(jìn)一步獲取一組經(jīng)過濾的變體,對(duì)其進(jìn)行標(biāo)記以供進(jìn)一步分析。圖3描述了華為云基因加速服務(wù)種系變異調(diào)用流水線的具體流程,中間面板指示開始的通常工作流程,上下分別顯示華為云FPGA基因加速方案中的峰科加速流程和GATK最佳使用流程命令實(shí)現(xiàn)方式的工作流程。
華為云峰科基因加速流程和GATK最佳使用流程對(duì)比
基于華為云FPGA加速服務(wù),使用FPGA優(yōu)化加速GATK流程,基因組分析流程可以實(shí)現(xiàn)3~5倍速度提升和99.95%以上的準(zhǔn)確度。華為云FPGA基因加速解決方案最快基因組序列分析標(biāo)準(zhǔn)流程可在一天內(nèi)完成5個(gè)全基因組或24個(gè)整體外顯子組分析。
Performance comparison for GATK 3.8 WGS from Alignment to Variant Calling using Hoplotypecaller
Cloud based comparisonTotal(Hrs.)Speedup
WGS(30X)Falcon on Huawei7.464.84x
Original 36.11x
注:測(cè)試數(shù)據(jù)使用的是30X的WGS樣本,堿基數(shù)量103G華為云基因加速服務(wù)“0”元體驗(yàn)
為了能讓更多的用戶體驗(yàn)華為云FPGA加速云服務(wù)器,針對(duì)基因加速場(chǎng)景,華為云聯(lián)合峰科(Falcon)推出“基因加速服務(wù)0元體驗(yàn)套餐”,套餐規(guī)格為32核CPU224GB內(nèi)存500GB數(shù)據(jù)盤5M帶寬。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 諾和諾德腰斬:醫(yī)藥股為何難給高估值?