在Victor Mayer-schoenberg和Kenneth Cookeye [2]撰寫的《大數據時代》中,大數據是指所有的數據都用於分析和處理,而沒有隨機分析(抽樣調查)的捷徑。大數據的5V特征(IBM提出):體量(海量)、速度(高速)、多樣性(多樣性)、價值(價值)、真實性(真實性)。
科技數據中心的解決方案是在組織價值鏈分析模型的理論指導下,結合組織戰略規劃和面向對象的方法論,規劃和重建基於數據的組織信息化戰略,建立基於數據的組織信息化標準,為組織提供壹套數據采集、處理、挖掘、分析和服務的基礎解決方案。數據中心的解決方案采用了當前先進的大數據技術。基於Hadoop架構,利用HDFS、Hive、Impala等大數據技術架構組件和公司擁有的ETL工具等中間件產品,在組織內部建立了高性能、高效率的信息資源大數據服務平臺,實現組織內部數億數據的秒級實時查詢、更新、調用和分析。數據中心解決方案將為公安、教育、旅遊、住建等業務數據中心、城市公共基礎數據庫平臺、行業部門信息資源基礎數據庫建設、數據資源規劃管理提供壹體化解決方案。