由世紀互聯運營的 Windows Azure 發布 HDInsight 服務公

 行業動態     |      2017-07-27

如果能善用這些數據,企業用戶就可以得到以往難以企及的關鍵業務洞察。例如,臺灣著名茶點連鎖餐廳“黑丸”將來自零售網點的銷售數據,與人們在社交網絡上對其表達的情緒反饋,以及所在地的天氣信息等數據相結合,發現了能刺激客戶消費的原因。通過將傳統數據源與全新的“大數據”相融合,他們發現,其實氣溫高低并不會影響人們去選擇冷飲或者熱飲,現在他們可以真正從消費者的需求出發對銷售策略做出調整。

類似的應用場景引發了對 Hadoop 等大數據產品的需求熱潮。作為開源平臺的 Hadoop 能夠在相對廉價的消費級硬件上,實現海量數據的存儲和處理。Hadoop 具有如此強大功能的部分原因在于,其生態系統通過通用的計算模式實現了相同的數據存儲。這種存儲是一種分布式文件系統,其規模能夠從幾個節點擴展至數千個節點,并且全都針對非結構化數據。通過 Hadoop 與傳統數據結構相結合,用戶能從數據中得到以往難以想象的深入洞察。



但是,在多節點上創建 Hadoop 集群并非易事,需要有合適的硬件、周密的容量規劃,以及對 Hadoop 進行設置和部署的專業知識。此外,Hadoop 生態系統的快節奏創新也要求 IT 管理員不斷升級 Hadoop 軟件或為操作系統打補丁,因此后續的不間斷維護也將成為一大挑戰。而公有云上的 Hadoop 服務能幫助用戶克服這些挑戰。

由世紀互聯運營的 Windows Azure 宣布正式提供 HDInsight 服務的公眾預覽,從而成為中國第一個面向公眾的 Hadoop 云服務。作為在 Windows Azure 上運行的Hadoop 服務,HDInsight 為啟動和運行 Hadoop 提供了最快捷的方式。用戶無需任何專用硬件或專業知識,只要點擊幾下鼠標,就可以在幾分鐘內建立一個 Hadoop 集群。用戶還可以根據需要對集群進行擴展,幾分鐘就能將集群從10個節點擴展到1000個節點。此外,用戶還可以在 HDInsight 上充分利用Apache生態系統中的眾多開源項目,包括 HBase NoSQL 數據庫、類 SQL 查詢處理、機器學習等。其中 Hive 類 SQL 查詢處理集合了微軟 SQL Server 技術的 Stinger 項目,使 Hive 的查詢性能提高100倍。通過 Excel 中的 Power Query 插件,用戶還可以從 HDInsight 中得到更加直觀的數據洞察。