每日經(jīng)濟新聞 2018-09-15 13:24:04
新華社報道,在2017年新一期的全球超級計算機500強榜單中,中國超算“神威·太湖之光”和“天河二號”連續(xù)第四次分列冠亞軍。不過,“跑”得快、性能好的國產(chǎn)高性能計算機,在實現(xiàn)應用落地上仍需發(fā)力。聯(lián)想數(shù)據(jù)中心中國區(qū)方案營銷總監(jiān)李煒對《每日新聞記者》介紹,性能上我國產(chǎn)品已經(jīng)足夠好,但國產(chǎn)的高性能集群應用領域比較窄,硬件之外,需要軟件層面的升級。
每經(jīng)記者 劉春山 每經(jīng)編輯 張海妮
中科院遺傳所博士生導師梁承志 圖片來源:采訪對象供圖
9月14日,中科院遺傳所與聯(lián)想數(shù)據(jù)中心相關人員在北京舉辦了一場小型溝通會,希望在高性能計算領域,科研界與產(chǎn)業(yè)界能架起更為緊密的橋梁。
“我們的日常工作以計算為主,分析生物大數(shù)據(jù),沒有高性能的計算機群來支撐的話,整個工作沒有辦法開展。”中科院遺傳所博士生導師梁承志如此介紹高性能計算對現(xiàn)代生物信息學研究的重要性。今年五月份,在國際著名學術刊物《Nature》上,梁承志課題組首次揭示了小麥A基因組序列精細圖譜,其實驗過程中涉及大量的生物數(shù)據(jù)計算分析。
聯(lián)想數(shù)據(jù)中心中國區(qū)方案營銷總監(jiān)李煒表示,中國企業(yè)目前基本上可以補全高性能計算機硬件領域所有空白點,無論性能是否足夠好,國內(nèi)已經(jīng)可以做了。但是在軟件領域國內(nèi)很多地方是空白,中國需要世界級工業(yè)軟件公司。
HPC是高性能計算機群的簡稱,是執(zhí)行一般個人電腦無法處理的大資料量與高速運算的電腦,運算力更為強大的被稱之為超級計算機。氣候氣象、海洋、航空航天、生物、材料、高能物理、藥物、生命科學等領域的發(fā)展都少不了它,高性能計算機曾為天宮系列衛(wèi)星路徑預測、國產(chǎn)大飛機C919精細數(shù)值模擬立下汗馬功勞。
梁承志在接受《每日經(jīng)濟新聞》記者采訪時表示,2000年左右生物信息學科開始起步發(fā)展,呼喚更多研究人才。加之少年時代對于計算機的強烈興趣,自己所在的群體遺傳的分析又需要最新的方法、技術,最終選擇了遺傳學和生物信息的交叉領域。
1995年梁承志于中科院遺傳所獲得遺傳學博士學位,而在2001年,梁承志在加拿大Waterloo大學又獲得數(shù)學與計算機科學碩士學位。實現(xiàn)了從生物學到計算機科學的跨越,主要研究方向是基因組學和生物信息分析,這也成為梁承志學術生涯最重要的選擇之一。梁承志于《Nature》所刊發(fā)的文中,繪制了小麥A基因組序列精細圖譜,可以加速栽培小麥的遺傳改良和分子設計育種。
在研討會上,梁承志表示,生物大數(shù)據(jù)有著 “三高”的特征:高復雜性、高不確定性和高維度。這就導致了計算量的復雜,需要高性能計算機集群。如果沒有高性能集群支撐的話,對數(shù)據(jù)的分析是沒有辦法實現(xiàn)的,因為數(shù)據(jù)量太大,對存儲和計算都有很高的要求。
“以前我們做生物研究,相對來講實驗為主,做實驗過程漫長,花費很高,積累數(shù)據(jù)量有限?,F(xiàn)在實驗能力提高了,十年前你要做實驗可能要花費一年,現(xiàn)在一個月或者一周,甚至一兩天就做完了。” 梁承志指出,現(xiàn)在我們得到了越來越多的數(shù)據(jù),通過生物信息學的方法和分析過程,可以產(chǎn)生更多規(guī)律性的東西。
梁承志指出,隨著生物信息技術的爆發(fā),高性能計算力的提升更為迫切。其同時指出,科研及其他高精尖技術研發(fā)的特殊性決定了安全性上的保證更為重要。
在中科院遺傳所的一處小小的機房所在地,一位科研人員介紹,中科院和聯(lián)想合建的計算機集群,16年之間在這里不斷更換,更新到了現(xiàn)在第四代深騰8810。計算力也從當時的萬億次,提升了千萬億次,提升了千倍。
深騰8810高性能計算機系統(tǒng) 圖片來源:采訪對象供圖
回顧歷史,我國高性能計算機確實實現(xiàn)了迅猛發(fā)展。1983年,我國“銀河Ⅰ號”的運算速度達每秒1億次,同時標志著我國巨型計算機研制成功。2002年8月,聯(lián)想研制成功了深騰1800超級計算機,實際運算速度超過萬億次。這是中國超算系統(tǒng)首次進入全球TOP500,排名第43位。
新華社報道,在2017年新一期的全球超級計算機500強榜單中,中國超算“神威·太湖之光”和“天河二號”連續(xù)第四次分列冠亞軍。
不過,“跑”得快、性能好的國產(chǎn)高性能計算機,在實現(xiàn)應用落地上仍需發(fā)力。李煒對《每日新聞記者》介紹,性能上我國產(chǎn)品已經(jīng)足夠好,但國產(chǎn)的高性能集群應用領域比較窄,硬件之外,需要軟件層面的升級。
在高性能集群最早誕生的時候,最大的技術挑戰(zhàn)在于計算能力的損耗。李煒解釋,一個計算節(jié)點是兩萬億次,一百個節(jié)點是兩百萬億次,但計算的時候不能做到一加一等于二,會有能量的損耗。牛頓的能量轉(zhuǎn)化定律決定了,現(xiàn)實狀況下不可能實現(xiàn)理想狀態(tài)下的能量轉(zhuǎn)化的話,計算力轉(zhuǎn)化就有流失,這就要靠軟件。
梁承志對生物信息研究領域所面臨的瓶頸進行了介紹。其表示,生物數(shù)據(jù)復雜性的特點使得其對軟件的要求越來越高,目前很多軟件能力比較弱。市場上現(xiàn)在生物信息的軟件比十年前好太多了,但總的來講,生物信息學分成不同的小的領域,每個小的領域的軟件大家都是各做各的,還沒有真正的好的融合,這需要一個過程。梁承志這樣表達目前所遇到的阻礙,希望在HPC軟件應用生態(tài)上更為協(xié)同完善。
中國有華為、聯(lián)想等這些大的硬件企業(yè),也有阿里巴巴、百度這樣的互聯(lián)網(wǎng)巨頭,現(xiàn)在中國更需要世界級的工業(yè)軟件公司。李煒指出,聯(lián)想當時做集群的時候,已經(jīng)自己開發(fā)了集群調(diào)優(yōu)并行軟件,特別是數(shù)學計算、遺傳、物理、氣象等領域里有專項團隊在做算法開發(fā),努力保證集群效率做到更高。
華金證券在研究報告中指出,從高性能計算機應用機構來看,HPC 應用正在從政府、研究機構轉(zhuǎn)向商用,互聯(lián)網(wǎng)企業(yè)漸漸成為HPC 應用的主戰(zhàn)場。這主要得益于人工智能研發(fā)對高性能計算需求的增加,隨著互聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)等新興負載的出現(xiàn),有望改變高性能計算軟件應用的短板。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP