隨著云時代的來臨,大數據(big data)也吸引了越來越多的關注。那么,大數據究竟是什么呢?它的定義、結構、特點是什么呢?它又能應用在哪些方面呢?相信通過這篇文章你可以對大數據有一個全新全面的認識。
一、關于定義
大數據(big data),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
二、關于特點
國際商業機器公司(簡稱:IBM)提出了大數據的5V特點,即:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
三、關于結構
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。據IDC的調查報告顯示:企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%。
想要系統的認知大數據,必須要全面而細致的分解它,著手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這里從大數據的特征定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。在這里分別從云計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。在這里分別從互聯網的大數據,政府的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。
四、它的應用
1.洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生。
2.google流感趨勢(Google Flu Trends)利用搜關鍵詞預測禽流感的散布。
3..統計學家內特.西爾弗(Nate Silver)利用大數據預測2012美國選舉結果。
4..麻省理工學院利用手機定位數據和交通數據建立城市規劃。
5.梅西百貨的實時定價機制。根據需求和庫存的情況,該公司基于SAS的系統對多達7300萬種貨品進行實時調價。
6.醫療行業早就遇到了海量數據和非結構化數據的挑戰,而近年來很多國家都在積極推進醫療信息化發展,這使得很多醫療機構有資金來做大數據分析。
通過以上幾個方面說明:現在已經迎來了大數據時代。因此大數據開發成為各企業非常看重的一部分,對這方面的人才需求也逐漸增多。那么,如何在眾多競爭對手中脫穎而出呢?華清遠見大數據課程給了你答案。
華清遠見大數據項目
大數據開發,我只認準華清遠見,心動就來報名吧!