論文來源 :《情報理論與實踐》
研究意義與背景:科學數據是進行科研活動的重要成果,對科技創新、濟和社會發展具有重要意義。隨著雲計算、物聯網、大科學裝置等的蓬勃發展,科學數據正以前所未有的速度增長,人類已經步入大數據時代。已經成為科研活動的核心,以及科技創新發展的核心驅動要素。作為數字化革命的引擎,“大數據” 為眾多科學研究帶來新的機遇。科學範式開始從模型驅動向數據驅動轉變。
歸納科學大數據開放***享的典型模式、相關利益者、關鍵影響要素和關鍵機制,推動科學數據在國際間的開放***享。
科學裝置的單元數據***享模式
模式產生原因:研究目標宏大、問題復雜、成本高
類別:大科學裝置、跨機構合作的大規模研究項目
***享路徑:根據有關研究任務的數據采集計劃產生原始數據,原始數據和處理後數據存儲到服務於該大科學裝置的數據中心或服務系統中,並優先在參與相應研究任務的合作者範圍內***享,壹定時間
後將部分或全部數據 (時間周期及數據範圍視該大科學裝置所確定的數據開放政策或條例而定) 通過數據中心或服務系統集中發布、開放給公眾。
廣域合作驅動的分布式註冊模式
方式:通過構建物理上分布、邏輯上統壹的壹站式數據***享服務平臺在聯盟間或全球範圍內進行科研數據的開放、***享和交換
案例:GEOSS、GBIF
***享路徑:各成員首先按照統壹的標準和規範將松散分布的數據、元數據、產品和服務進行集中註冊,由統壹的數據門戶負責連接各註冊數據資源,為用戶提供壹站式數據檢索和定位服務,最終由分布式的數據服務系統提供數據獲取服務。國際合作組織制定數據開放原則要求各成員在不違背政策法規基礎上,盡可能保障全面、開放、及時、免費 (低成本)、非歧視和不受限制地獲取元數據、數據、產品和服務。同時,要求數據提供者確保數據經過權威認證,並保證數據服務的穩定性和可靠性。國際合作組織通過定期召開全體會議、制定計劃、簽署協定、組織活動等方式推動國際合作大科學研究的持續發展。
基於數據存儲庫的集中存繳模式
在學科開放***享文化、開放***享原則及各類期刊數據歸檔政策的驅動下,科研人員、論文作者、科研機構通過數據存儲庫進行數據的集中存繳,並利用數據存儲庫提供的在線發布功能進行科學數據資源的發布、***享和重用。
科學數據出版
數據出版主要分為廣義的數據發布、期刊附屬物類型的數據出版以及數據集與數據描述***同出版三大類,狹義的數據出版主要指最後壹種。
數據集市
按照數據提供者組織形式可以將數據集市分為兩種典型模式: 在以數據堂 (www.
datatang. com) 為代表的數據集市交易中,分散的數據擁有者借助數據堂的交易平臺實現面向最終用戶的交互分享。在以遙感集市為代表的數據集市交易中,數據源由集成化、規模化的單壹主體提供。
參考:
The PRIDE database and related tools and resources in 2019: improving support for quantification data.文獻全文 - 學術範 (xueshufan.com)
Radiomics: the process and the challenges文獻全文 - 學術範 (xueshufan.com)