精品主題,實戰(zhàn)科普,最新行業(yè)熱點話題,隨時掌握云上咨訊。
作為世界上首顆可持續(xù)發(fā)展目標監(jiān)測衛(wèi)星,可持續(xù)發(fā)展科學(xué)衛(wèi)星1號預(yù)計將于今年9月向全球開放,屆時將產(chǎn)生大批科學(xué)數(shù)據(jù)。這些數(shù)據(jù)如何管理、怎么用,牽動著全球科研界的神經(jīng)。
“我們承諾獲得的數(shù)據(jù)可以提供給聯(lián)合國成員國共享,在未來數(shù)據(jù)開放期內(nèi),國內(nèi)外授權(quán)用戶可以通過相應(yīng)的數(shù)據(jù)共享服務(wù)系統(tǒng)進行數(shù)據(jù)獲取?!敝袊茖W(xué)院網(wǎng)絡(luò)安全和信息化專家咨詢委員會主任委員、可持續(xù)發(fā)展大數(shù)據(jù)國際研究中心(以下簡稱SDG中心)主任郭華東院士表示。
這份承諾的背后,是近年來我國科研界不斷推動科學(xué)數(shù)據(jù)開放共享的實踐。當科研步入數(shù)據(jù)密集型的“第四范式時代”,如何才能開發(fā)好、利用好科學(xué)數(shù)據(jù)這座“富礦”?
作為國家戰(zhàn)略科技力量主力軍,中科院一直高度重視科學(xué)數(shù)據(jù)管理與開放共享工作。啟動科學(xué)數(shù)據(jù)庫建設(shè)40年來,中科院已積累超過80PB的科學(xué)數(shù)據(jù)存儲量,初步建成了由總中心、18個學(xué)科中心和13個所級中心組成的院科學(xué)數(shù)據(jù)中心體系,在支撐國家重大戰(zhàn)略、支持科技創(chuàng)新等方面發(fā)揮了重要作用。
促進共享
開放為常態(tài),不開放為例外
做好科學(xué)數(shù)據(jù)管理,關(guān)鍵的第一步是“收集數(shù)據(jù)”。
科學(xué)數(shù)據(jù)公開還是“僅自己可見”?科學(xué)數(shù)據(jù)的共享邊界在哪里?這些問題也讓科學(xué)數(shù)據(jù)的收集困難重重。
2018年3月,國務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》,明確了“開放為常態(tài),不開放為例外”的原則,同時要求政府預(yù)算資金資助的各級科技計劃(專項、基金等)項目所形成的科學(xué)數(shù)據(jù)要向科學(xué)數(shù)據(jù)中心匯交。
“《科學(xué)數(shù)據(jù)管理辦法》的頒布強調(diào)了法人單位的主體責任,使得廣大普通科學(xué)工作者可以介入到數(shù)據(jù)共享,而不必承擔共享數(shù)據(jù)的成本,這必然會帶來整個生態(tài)的繁榮?!敝袊茖W(xué)院網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組辦公室執(zhí)行副主任褚大偉說。
2019年6月我國首批發(fā)布的20個國家科學(xué)數(shù)據(jù)中心中,有11個依托中科院單位建設(shè),在國家科學(xué)數(shù)據(jù)中心體系建設(shè)中發(fā)揮了重要作用。
為了進行科學(xué)管理,中科院制定了《中國科學(xué)院科學(xué)數(shù)據(jù)管理與開放共享辦法(試行)》,并明確提出了建立“先制訂數(shù)據(jù)管理計劃再立項”的項目數(shù)據(jù)匯交機制及“論文關(guān)聯(lián)數(shù)據(jù)的匯交與管理機制”。
為了消除科技工作者發(fā)布共享數(shù)據(jù)的門檻,中科院面向科學(xué)數(shù)據(jù)匯交業(yè)務(wù)場景,提出了數(shù)據(jù)中心建設(shè)、項目科學(xué)數(shù)據(jù)匯交、匯交數(shù)據(jù)質(zhì)量管理和共享等方面的一系列工作指南,并由中科院科學(xué)數(shù)據(jù)總中心研制了一系列支撐科學(xué)數(shù)據(jù)中心業(yè)務(wù)的軟件工具。
目前,中科院各國家科學(xué)數(shù)據(jù)中心已支持150項國家重點研發(fā)計劃項目數(shù)據(jù)匯交,匯交數(shù)據(jù)總量4.80PB。褚大偉表示,長遠來看,匯交科學(xué)數(shù)據(jù)的總量和增長速度必然會有所增加,知識從研究過程轉(zhuǎn)化為共享數(shù)據(jù)的流程縮短,“科學(xué)數(shù)據(jù)會成為比論文更加快捷的科學(xué)信息傳播與協(xié)作渠道”。
隨著科學(xué)管理的推進,中科院科學(xué)數(shù)據(jù)中心的國際影響力也在進一步提升。微生物、基因組、天文、空間科學(xué)、地球系統(tǒng)、青藏高原等科學(xué)數(shù)據(jù)中心得到了國際知名出版機構(gòu)認證,基因組科學(xué)數(shù)據(jù)中心被國際同行稱為“全球主要生物數(shù)據(jù)中心”,微生物科學(xué)數(shù)據(jù)中心已處于國際合作主導(dǎo)地位,牽頭開展了全球微生物菌種保藏目錄等國際合作計劃和國際科學(xué)數(shù)據(jù)庫共建工作。
在不久前落幕的金磚國家可持續(xù)發(fā)展大數(shù)據(jù)論壇上,SDG中心面向金磚國家發(fā)布了4套可持續(xù)發(fā)展數(shù)據(jù)產(chǎn)品,為金磚國家開展可持續(xù)發(fā)展目標科學(xué)研究提供支撐。
服務(wù)創(chuàng)新
不要為了數(shù)據(jù)而“數(shù)據(jù)”
如何確保科學(xué)數(shù)據(jù)的質(zhì)量以及更好地服務(wù)科技創(chuàng)新,是收集海量科學(xué)數(shù)據(jù)之后更為重要的一個命題。
郭華東曾擔任國際科學(xué)院聯(lián)盟國際科技數(shù)據(jù)委員會主席。在他看來,科學(xué)數(shù)據(jù)共享“不是拿著U盤去拷貝,更不能為了數(shù)據(jù)而數(shù)據(jù),而是要在需求牽引、技術(shù)推動的理念下,充分發(fā)揮大數(shù)據(jù)支撐科技創(chuàng)新的作用”。
在這樣的理念下,SDG中心遵循“FAIR”(可發(fā)現(xiàn)、可訪問、可互操作和可重用)原則,在數(shù)據(jù)共享模式上進行創(chuàng)新。
郭華東說:“我們共享的不僅僅是數(shù)據(jù),也是算法、模型和服務(wù),實現(xiàn)多學(xué)科數(shù)據(jù)關(guān)聯(lián)分析和融合應(yīng)用,驅(qū)動重大科學(xué)發(fā)現(xiàn)與決策支持,形成可持續(xù)發(fā)展目標監(jiān)測與評估的科學(xué)研究新范式。”
我國科技界在利用地球大數(shù)據(jù)服務(wù)可持續(xù)發(fā)展方面已開展了全面實踐。SDG中心研發(fā)的可持續(xù)發(fā)展大數(shù)據(jù)平臺系統(tǒng),截至目前已匯聚地球科學(xué)數(shù)據(jù)達14PB,可提供DOI、CSTR、PID三種科學(xué)數(shù)據(jù)標識,已有174個國家和地區(qū)超過43萬獨立IP用戶訪問,瀏覽量超過6900萬次,數(shù)據(jù)下載超93萬次。
同樣,為了讓高質(zhì)量科學(xué)數(shù)據(jù)服務(wù)科技創(chuàng)新,中科院科學(xué)數(shù)據(jù)中心推出了一套參考科技論文審核流程的工作機制,形成相關(guān)的工作指南,確保匯交數(shù)據(jù)附帶充足的質(zhì)量描述。
而從長遠角度看,科學(xué)數(shù)據(jù)服務(wù)科技創(chuàng)新,需要在整個科學(xué)研究環(huán)境中形成一個閉環(huán),“使共享數(shù)據(jù)能夠像現(xiàn)在的科技論文那樣,作者權(quán)益有保障,共享發(fā)表產(chǎn)生的效益可以得到評估、評價,那么科學(xué)工作者生產(chǎn)高質(zhì)量科學(xué)數(shù)據(jù)、推動其公開傳播的動力就會得到提升?!瘪掖髠ケ硎尽?/span>
郭華東建議,可以建立一個全新的數(shù)據(jù)引用指數(shù),以公開發(fā)表數(shù)據(jù)集的他引次數(shù)乘以引用文章影響因子權(quán)重,作為衡量數(shù)據(jù)共享效果與數(shù)據(jù)影響力等的重要指標。
“科技資源標識、科學(xué)數(shù)據(jù)影響力評價等科學(xué)數(shù)據(jù)公共服務(wù)將成為科學(xué)數(shù)據(jù)共享生態(tài)的新型基礎(chǔ)設(shè)施,連接起科學(xué)研究的各個環(huán)節(jié)?!瘪掖髠フf。
自主可控
加強數(shù)據(jù)全生命周期管理
“很多國際期刊要求,論文發(fā)表需要在它們認證的存儲庫中發(fā)布論文關(guān)聯(lián)數(shù)據(jù),導(dǎo)致我國學(xué)者的很多研究數(shù)據(jù)在國內(nèi)還沒發(fā)布,就首先發(fā)到國外去了?!辈簧倏蒲泄ぷ髡叨加羞^類似的經(jīng)歷。
為了把我國的關(guān)鍵科學(xué)數(shù)據(jù)“牢牢掌握在手中”,中科院加強我國自主產(chǎn)權(quán)的存儲庫建設(shè),自主研發(fā)的ScienceDB (科學(xué)數(shù)據(jù)銀行)目前已經(jīng)獲得施普林格·自然、愛思唯爾等多家國際出版商的認證,為我國的廣大學(xué)者發(fā)表論文提供了強有力的數(shù)據(jù)存儲支撐,同時也匯聚了全球的優(yōu)質(zhì)科學(xué)數(shù)據(jù)資源,為全球160余個國家和地區(qū)的科研人員提供數(shù)據(jù)共享與獲取服務(wù)。
“在中科院數(shù)據(jù)中心體系內(nèi)部,我們也推動數(shù)據(jù)中心快速達到相關(guān)認證要求。相信隨著我國和中科院數(shù)據(jù)中心體系能力的提升,我國科學(xué)家在自主可控的環(huán)境發(fā)布數(shù)據(jù)、支撐科技論文的發(fā)表是可以做到的。”褚大偉說。
為了確??茖W(xué)數(shù)據(jù)安全,中科院明確提出要建立網(wǎng)絡(luò)安全保障體系,加強數(shù)據(jù)全生命周期安全管理。
在技術(shù)層面,通過研發(fā)的科學(xué)數(shù)據(jù)中心安全監(jiān)控工具和備份平臺等,為科學(xué)數(shù)據(jù)中心安全管理提供常態(tài)化的防護和保障;同時,在基于區(qū)塊鏈的科學(xué)數(shù)據(jù)共享等技術(shù)方面開展探索,發(fā)布了國內(nèi)科學(xué)數(shù)據(jù)領(lǐng)域首個區(qū)塊鏈平臺“開放科學(xué)數(shù)據(jù)聯(lián)盟鏈”,后續(xù)將在可信計算等方面開展工作,確保科學(xué)數(shù)據(jù)在安全的前提下得到充分利用。
與此同時,在全球科研交流日益緊密的背景下,我國的科學(xué)數(shù)據(jù)共享不應(yīng)孤立于全球開放科學(xué)的浪潮之外。褚大偉建議,要進一步加強跨領(lǐng)域合作和國際合作,參與并爭取主導(dǎo)國際計劃與合作項目。
郭華東指出,在全球范圍內(nèi),開放科學(xué)正成為重要的發(fā)展模式和全球共識。開放數(shù)據(jù)是開放科學(xué)的核心組成,將會大力促進開放科學(xué)的發(fā)展,提升科技創(chuàng)新活動的透明性、可重復(fù)性、協(xié)作性,并將科學(xué)對社會發(fā)展的價值最大化。
褚大偉表示,中科院在科學(xué)數(shù)據(jù)共享事業(yè)上有著光榮的傳統(tǒng),未來將進一步加強科學(xué)數(shù)據(jù)共享制度機制的研究,為科學(xué)數(shù)據(jù)中心的建設(shè)提供一個完備的軟環(huán)境。同時,中科院擁有產(chǎn)權(quán)的科學(xué)數(shù)據(jù)也將繼續(xù)以開放共享為主的方式公開共享,為國內(nèi)外科學(xué)研究提供有力支持。