隨著信息技術特別是信息通訊技術的發展,互聯網、社交網絡、物聯網、移動互聯網、云計算等相繼進入人們的日常工作和生活中,全球數據信息量呈指數式爆炸增長之勢。根據國際數據公司 IDC發布的研究報告 [1],2011 年全球創建和復制的數據總量為 1.8 ZB(約 1.8 萬億 GB),預計全球數據量大約每 2 年翻一番,到 2020 年全球將達到 35 ZB 的數據信息量。近年來,大數據已經成為科技界和企業界關注的熱點。2012 年 3 月,美國奧巴馬政府宣布投資 2 億美元啟動“大數據研究和發展計劃”[2],這是繼 1993 年美國宣布“信息高速公路”計劃后的又一次重大科技發展部署。美國政府認為大數據是“未來的新石油”,將“大數據研究”上升為國家意志,一個國家擁有數據的規模和運用數據的能力將成為綜合國力的重要組成部分。數據已經從簡單的處理對象開始轉變為一種基礎性資源。
在國內,2012 年中國計算機學會大數據專家委員會發布的《大數據熱點問題和 2013 年發展趨勢分析》提出了數據資源化的概念,指出數據將在企業、社會和國家層面成為重要的戰略資源 [4],信息技術的重心將由“T”(技術)切換到“I”(信息);應該通過建立數據共享聯盟,開放數據,形成數據共享網絡,以打破行業內數據事權限制,讓數據可以重復使用,自由架構,支持利用數據進行創新。谷歌地球就是數據資源化的典型案例,基于空間信息將各類數據進行整合,并以服務的形式將數據提供給社會大眾 [5]。目前數據資源化的成功案例還局限于谷歌等大型互聯網公司內,然而,作為發展的大趨勢,數據資源化將逐步擴展至國民經濟的各個領域。但是,作為關系國計民生的水利行業,數據采用多點采集、分散處理和分布存儲的方式,且使用往往與具體的水利應用相關聯,因而具備類型雜、多事權等特性,形成信息孤島,限制了數據的深層共享和可持續利用,制約了數據資源化的進程。 |