大數(shù)據(jù)的含義是什么? 大數(shù)據(jù)指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。 大數(shù)據(jù)具有“4V”特性: 1.?dāng)?shù)據(jù)量大(Volume):大數(shù)據(jù)的起始計(jì)量單位是PB(1024TB)、EB(1024PB,約100萬TB)或ZB(1024EB,約10億TB),未來甚至?xí)_(dá)到Y(jié)B(1024ZB)或BB(1024YB)。 2.?dāng)?shù)據(jù)多樣性(Variety):大數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、報(bào)表、圖像、音頻信息、視頻信息等;半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性,例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、婚姻、戶籍、出入境等很多信息。 3.價(jià)值密度低(Value):大數(shù)據(jù)價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一兩秒。原始零散、復(fù)雜多樣,甚至可能有數(shù)據(jù)噪聲和污染的數(shù)據(jù)需要經(jīng)歷價(jià)值“提純”才能得出信息、獲取知識(shí)。 4.?dāng)?shù)據(jù)的產(chǎn)生和處理速度快(Velocity):大數(shù)據(jù)的智能化和實(shí)時(shí)性要求越來越高,對處理速度也有極嚴(yán)格的要求,一般要在秒級時(shí)間范圍內(nèi)給出分析結(jié)果,超出這個(gè)時(shí)間數(shù)據(jù)就可能失去價(jià)值,即大數(shù)據(jù)的處理要符合“1秒定律”。 以上是91開業(yè)網(wǎng)小編為您整理的關(guān)于大數(shù)據(jù)的含義是什么的內(nèi)容,希望對您有所幫助。 |