當前位置:旅游攻略大全網 - 旅游景点 - 什麽是旅遊大數據平臺

什麽是旅遊大數據平臺

想要知道什麽是旅遊大數據平臺,就得先清楚旅遊大數據平臺有哪些構成?

旅遊是壹個行業屬性,決定了我們需要去關註哪些指標;

大數據平臺是壹個技術層面的架構,決定了妳能以什麽樣的速度處理多大的數據,最後以何種方式去呈現。

所以以下我從這兩個方面分別來闡述:

壹、大數據平臺

大數據平臺的整體架構如下圖

從底層逐步往上,如圖所示表示這麽幾個環節:

業務應用:其實指的是數據采集,妳通過什麽樣的方式收集到數據。互聯網收集數據相對簡單,通過網頁、App就可以收集到數據,更深層次的還能收集到用戶的行為數據,可以切分出來很多維度,做很細的分析。但是對於涉及到線下的行業,數據采集就需要借助各類的業務系統去完成。當然妳還可以通過壹些公開的數據源或者爬蟲去獲取壹些外部數據,來彌補妳自身數據不足的現狀。

數據集成:指的其實是ETL,指的是用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。此處的Kettle只是ETL的其中壹種。

數據存儲:指的就是數據倉庫的建設了,此處相對復雜,我不再贅述,大家可以詳細看下圖中『數據倉庫層』這部分。

數據***享層:表示在數據倉庫與業務系統間提供數據***享服務。不論是Web Service,還是Web API ,都代表的是壹種數據間的連接方式。

數據分析層:分析函數這部分大家都能理解,就是數學上的各種公式,比如聚類分析、回歸分析等等。

列存儲使得磁盤的每個Page僅僅存儲來自單列的值,而不是整行的值。因此,壓縮算法會更加高效,因為它們能夠作用於同類型的數據。再說的簡單點,可以減少磁盤的I/O、提升緩存利用率,因此,磁盤存儲會被更加高效的利用。

而分布式計算能夠把壹個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然後把這些部分分配給許多計算機進行處理,最後把這些計算結果綜合起來得到最終的結果。

整體上來說,通過這兩種技術,可以大幅度提高數據分析的效率。

而Yonghong MPP應該是目前做列存儲和分布式最好的產品。

數據展現:分析的結果通過什麽樣的形式去呈現,說白了就是數據可視化的工作。這部分推薦用敏捷BI類的產品,區別於傳統BI,它能通過簡單拖拽的方式就生成報表,比較節省時間,學習成本相對較低。國內的敏捷BI中,個人用戶推薦Tableau,企業級需求推薦Yonghong BI 。

數據訪問:這個就比較簡單了,看妳是通過什麽樣的方式去查看這些數據,圖中示例的是因為B/S架構,最終的可視化結果是通過瀏覽器訪問的。當然也有C/S架構,通過客戶端去查看。相對來說,B/S架構會比較便捷,更適合現在很多人用手機辦公的需求,打開個網頁就能看到數據。

二、旅遊行業應該關註哪些指標?

我以壹個省的旅遊數據為例:

可以分析的指標有:

省旅遊收入分析(包括收入金額、增長率、與全國收入增長率對比)

省內旅遊情況分析(包括星級飯店總數、國內遊客數、入境遊客數、入境過夜遊客、遊客消費水平、旅行社數、旅遊從業人員等)

入境遊客量分析(國外遊客數、港澳同胞數、臺灣同胞數、及其對應的增長率)

旅遊收入分析(商品銷售、長途交通、住宿、景點門票、餐飲、郵電通訊)

酒店分析(按客房數的多少可以分析出現階段適合發展的酒店形式,是連鎖酒店還是民宿更合適)

綜合以上分析,就可以得出該省下壹階段在旅遊方面應該去重點關註的地方,給規劃提供判斷依據。

所以旅遊大數據平臺,大數據平臺是基礎,而具體的指標可以決定應用價值。