當(dāng)前位置:全球供應(yīng)網(wǎng) > 技術(shù)中心 > 所有分類
目前電信、金融、零售等行業(yè)希望通過大數(shù)據(jù)的分析手段來幫助自己做出理性的決策。特別是電信和金融行業(yè)表現(xiàn)尤為突出,市場數(shù)據(jù)沒有辦法與用戶消費(fèi)數(shù)據(jù)打通。而它們面臨的個(gè)問題就是海量數(shù)據(jù)存儲(chǔ)的問題。多數(shù)企業(yè)正在試圖建設(shè)自己的數(shù)據(jù)中心,來滿足大規(guī)模的數(shù)據(jù)量的產(chǎn)生,或選擇大數(shù)據(jù)相關(guān)工具來應(yīng)對(duì),如大數(shù)據(jù)魔鏡等。但是隨著數(shù)據(jù)的進(jìn)一步增多,很多數(shù)據(jù)的查詢和分析性能急劇下降,有的數(shù)據(jù)中心甚至出現(xiàn)了無法響應(yīng)的狀況,為企業(yè)的業(yè)務(wù)帶來了很大損失。
企業(yè)的CIO們有著這樣的疑慮,怎樣的數(shù)據(jù)管理策略能夠?qū)?shù)據(jù)進(jìn)行有效的保護(hù),而且在需要時(shí),讓數(shù)據(jù)隨時(shí)轉(zhuǎn)變成價(jià)值的問題。只有數(shù)據(jù)與適合的存儲(chǔ)系統(tǒng)相匹配,制定出管理數(shù)據(jù)的戰(zhàn)略,才能高成本,高可靠,高效益的應(yīng)對(duì)大量數(shù)據(jù)。對(duì)于企業(yè)來說,面臨大數(shù)據(jù)首先解決的問題就是成本和時(shí)間效應(yīng)問題。商機(jī)不容錯(cuò)過,而存儲(chǔ)數(shù)據(jù)管理,可以通過自動(dòng)化,磁盤和重復(fù)數(shù)據(jù)刪除,備份和歸檔的軟件,讓企業(yè)的關(guān)鍵數(shù)據(jù)分存在不同的區(qū)域,然后按照特定的業(yè)務(wù)需求,對(duì)數(shù)據(jù)進(jìn)行提取,操作和分析,并形成企業(yè)所需要的目標(biāo)數(shù)據(jù)。大數(shù)據(jù)面臨的存儲(chǔ)難題迎刃而解。
大數(shù)據(jù)的關(guān)注度在不斷升溫,而大數(shù)據(jù)管理的技術(shù)也層出不窮。在眾多技術(shù)中,有6種數(shù)據(jù)管理技術(shù)普遍被關(guān)注,即分布式存儲(chǔ)與計(jì)算、內(nèi)存數(shù)據(jù)庫技術(shù)、列式數(shù)據(jù)庫技術(shù)、云數(shù)據(jù)庫、NoSQL、移動(dòng)數(shù)據(jù)庫技術(shù)。其中分布式存儲(chǔ)與計(jì)算受關(guān)注度。
分布式存儲(chǔ)與計(jì)算架構(gòu)可以讓大量數(shù)據(jù)以一種可靠、高效、可伸縮的方式進(jìn)行處理。因?yàn)橐圆⑿械姆绞焦ぷ?,所以?shù)據(jù)處理速度相對(duì)較快,且成本較低,Hadoop和NoSQL都屬于分布式存儲(chǔ)技術(shù)的范疇。
內(nèi)存數(shù)據(jù)庫技術(shù)可以作為單獨(dú)的數(shù)據(jù)庫使用,還能為應(yīng)用程序提供即時(shí)的響應(yīng)和高吞吐量,SAP的HANA是該技術(shù)的典型代表。
列式數(shù)據(jù)庫的特點(diǎn)是可以更好的應(yīng)對(duì)海量關(guān)系數(shù)據(jù)中列的查詢,占用更少的存儲(chǔ)空間,這也是構(gòu)建數(shù)據(jù)倉庫的理想架構(gòu)之一。
云數(shù)據(jù)庫可以不受任何部署環(huán)境的優(yōu)勢,隨意的進(jìn)行拓展,進(jìn)而為客戶提供適宜其需求的虛擬容量,并實(shí)現(xiàn)自助式資源調(diào)配和自助式使用計(jì)量。目前微軟的SQL Server可以提供類似的服務(wù)。
NoSQL數(shù)據(jù)庫適合于以下場景,即龐大的數(shù)據(jù)量、的查詢量和模式演化。企業(yè)可以NoSQL得到高可擴(kuò)展性、高可用性、低成本、可預(yù)見的彈性和架構(gòu)靈活性的優(yōu)勢,甲骨文在2011年推出Oracle NoSQL數(shù)據(jù)庫。
移動(dòng)數(shù)據(jù)庫技術(shù)是適應(yīng)移動(dòng)計(jì)算產(chǎn)物。隨著智能移動(dòng)終端的普及,人們對(duì)移動(dòng)數(shù)據(jù)實(shí)時(shí)處理和管理要求的不斷提高,移動(dòng)數(shù)據(jù)庫具有平臺(tái)的移動(dòng)性、頻繁斷接性、網(wǎng)絡(luò)條件的多樣性、網(wǎng)絡(luò)通訊的非對(duì)稱性、系統(tǒng)的高伸縮性和低可靠性以及電源能力的有限性等,也正是因?yàn)檫@些特性被業(yè)界所重視。