時(shí)間:2022-06-23 13:06:21
導(dǎo)言:作為寫作愛好者,不可錯(cuò)過為您精心挑選的10篇大數(shù)據(jù)平臺(tái)解決方案,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
大數(shù)據(jù)存儲(chǔ)不是一類單獨(dú)的產(chǎn)品,它有很多實(shí)現(xiàn)方式。EMC Isilon存儲(chǔ)事業(yè)部總經(jīng)理?xiàng)钐m江概括說,大數(shù)據(jù)存儲(chǔ)應(yīng)該具有以下一些特性:海量數(shù)據(jù)存儲(chǔ)能力,可輕松管理PB級(jí)乃至數(shù)十PB的存儲(chǔ)容量;具有全局命名空間,所有應(yīng)用可以看到統(tǒng)一的文件系統(tǒng)視圖;支持標(biāo)準(zhǔn)接口,應(yīng)用無需修改可直接運(yùn)行,并提供API接口進(jìn)行面向?qū)ο蟮墓芾?;讀寫性能優(yōu)異,聚合帶寬高達(dá)數(shù)GB乃至數(shù)十GB;易于管理維護(hù),無需中斷業(yè)務(wù)即可輕松實(shí)現(xiàn)動(dòng)態(tài)擴(kuò)展;基于開放架構(gòu),可以運(yùn)行于任何開放架構(gòu)的硬件之上;具有多級(jí)數(shù)據(jù)冗余,支持硬件與軟件冗余保護(hù),數(shù)據(jù)具有高可靠性;采用多級(jí)存儲(chǔ)備份,可靈活支持SSD、SAS、SATA和磁帶庫的統(tǒng)一管理。
通過與中國(guó)用戶的接觸,楊蘭江認(rèn)為,當(dāng)前中國(guó)用戶最迫切需要了解的是大數(shù)據(jù)存儲(chǔ)有哪些分類,而在大數(shù)據(jù)應(yīng)用方面面臨的最大障礙就是如何在眾多平臺(tái)中找到適合自己的解決方案。
EMC針對(duì)不同的應(yīng)用需求可以提供不同的解決方案:對(duì)于能源、媒體、生命科學(xué)、醫(yī)療影像、GIS、視頻監(jiān)控、HPC應(yīng)用、某些歸檔應(yīng)用等,EMC會(huì)首推以Isilon存儲(chǔ)為核心的大數(shù)據(jù)存儲(chǔ)解決方案;對(duì)于虛擬化以及具有很多小文件的應(yīng)用,EMC將首推以VNX、XtremIO為核心的大數(shù)據(jù)存儲(chǔ)解決方案;對(duì)于大數(shù)據(jù)分析一類的應(yīng)用需求,EMC會(huì)綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數(shù)據(jù)的橫向擴(kuò)展NAS解決方案——EMC Isilon,其設(shè)計(jì)目標(biāo)是簡(jiǎn)化對(duì)大數(shù)據(jù)存儲(chǔ)基礎(chǔ)架構(gòu)的管理,為大數(shù)據(jù)提供靈活的可擴(kuò)展平臺(tái),進(jìn)一步提高大數(shù)據(jù)存儲(chǔ)的效率,降低成本。
EMC Isilon存儲(chǔ)解決方案主要包括三部分:EMC Isilon平臺(tái)節(jié)點(diǎn)和加速器,可從單個(gè)文件系統(tǒng)進(jìn)行大數(shù)據(jù)存儲(chǔ),從而服務(wù)于 I/O 密集型應(yīng)用程序、存儲(chǔ)和近線歸檔;EMC Isilon基礎(chǔ)架構(gòu)軟件是一個(gè)強(qiáng)大的工具,可幫助用戶在大數(shù)據(jù)環(huán)境中保護(hù)數(shù)據(jù)、控制成本并優(yōu)化存儲(chǔ)資源和系統(tǒng)性能;EMC Isilon OneFS操作系統(tǒng)可在集群中跨節(jié)點(diǎn)智能地整合文件系統(tǒng)、卷管理器和數(shù)據(jù)保護(hù)功能。
楊蘭江表示,企業(yè)用戶選擇EMC Isilon的理由可以歸納為以下幾點(diǎn)。第一,簡(jiǎn)化管理,增強(qiáng)易用性。與傳統(tǒng)NAS相比,無論未來存儲(chǔ)容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴(kuò)展都會(huì)保持其簡(jiǎn)單性。第二,強(qiáng)大的可擴(kuò)展性。EMC Isilon可以滿足非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和分析需求,單個(gè)文件系統(tǒng)和卷中每個(gè)集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個(gè)共享存儲(chǔ)池中的利用率超過80%,而EMC Isilon SmartPools軟件可進(jìn)一步優(yōu)化資源,提供自動(dòng)存儲(chǔ)分層,保證存儲(chǔ)的高性能、經(jīng)濟(jì)性。第四,靈活的互操作性。EMC Isilon支持眾多行業(yè)標(biāo)準(zhǔn),簡(jiǎn)化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動(dòng)化、協(xié)調(diào)和資源調(diào)配能力。
EMC Isilon大數(shù)據(jù)存儲(chǔ)解決方案已經(jīng)在醫(yī)療、制造、高校和科研機(jī)構(gòu)中有了許多成功應(yīng)用。
方案點(diǎn)評(píng)
EMC Isilon是一個(gè)強(qiáng)大但簡(jiǎn)單的橫向擴(kuò)展NAS方案,適用于希望投資數(shù)據(jù)管理而不是單純存儲(chǔ)的企業(yè)。當(dāng)初,EMC將收購(gòu)來的分布式數(shù)據(jù)倉庫軟件廠商Greenplum的軟件與Isilon存儲(chǔ)組合成了EMC最早的大數(shù)據(jù)解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲(chǔ),也可以選擇由Greenplum軟件和Isilon存儲(chǔ)組成的一體機(jī)解決方案?,F(xiàn)在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經(jīng)銷商與合作伙伴,Greenplum與Isilon存儲(chǔ)的組合方案并不會(huì)因此受到影響。
HDS UCP:統(tǒng)一平臺(tái) 應(yīng)用優(yōu)化
HDS中國(guó)區(qū)解決方案與專業(yè)服務(wù)事業(yè)部總監(jiān)陳戈認(rèn)為,大數(shù)據(jù)存儲(chǔ)應(yīng)該是一個(gè)解決方案:“大數(shù)據(jù)解決方案是由基礎(chǔ)架構(gòu)的各部件組成的,包含數(shù)據(jù)存儲(chǔ)、計(jì)算和分析,而存儲(chǔ)是此架構(gòu)中的一部分?!?/p>
大數(shù)據(jù)的存儲(chǔ)類型與傳統(tǒng)的存儲(chǔ)類型有一定區(qū)別:在大數(shù)據(jù)存儲(chǔ)中,更多的應(yīng)用是一次寫、多次讀,讀得更多是大數(shù)據(jù)存儲(chǔ)的一個(gè)特點(diǎn),而在傳統(tǒng)的數(shù)據(jù)存儲(chǔ)中,讀寫是隨機(jī)的,由于每個(gè)應(yīng)用不同,其讀寫的比例也是隨機(jī)的;大數(shù)據(jù)存儲(chǔ)需要具有橫向的可擴(kuò)展性,并可支持多種接口、多種數(shù)據(jù)訪問協(xié)議,便于不同數(shù)據(jù)進(jìn)入這個(gè)大數(shù)據(jù)平臺(tái)。
談到中國(guó)用戶在大數(shù)據(jù)存儲(chǔ)應(yīng)用中最迫切的需求是什么,陳戈認(rèn)為,中國(guó)用戶最迫切的需求是如何逐步實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用,即用戶從現(xiàn)有的模式如何過渡到大數(shù)據(jù),如何更好地利用大數(shù)據(jù)進(jìn)行經(jīng)營(yíng)分析。
大數(shù)據(jù)的經(jīng)典定義可以歸納為四個(gè)“V”,但企業(yè)不可能一步到位實(shí)現(xiàn)四個(gè)“V”,這需要一個(gè)循序漸進(jìn)的過程。海量的、多種類型的數(shù)據(jù)是一次性全部載入到大數(shù)據(jù)中,還是通過現(xiàn)有的平臺(tái)進(jìn)行數(shù)據(jù)初選,再導(dǎo)入到大數(shù)據(jù)平臺(tái)中,是兩種不同的實(shí)現(xiàn)途徑。“先通過現(xiàn)有平臺(tái)進(jìn)行數(shù)據(jù)初選,再導(dǎo)入到大數(shù)據(jù)平臺(tái),這種方式更適合于客戶逐漸實(shí)現(xiàn)大數(shù)據(jù),可以縮短用戶實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的時(shí)間?!标惛瓯硎荆按髷?shù)據(jù)主要是非結(jié)構(gòu)化數(shù)據(jù)。用戶可以使用基于對(duì)象數(shù)據(jù)存儲(chǔ)的HCP,利用其獨(dú)特的元數(shù)據(jù)采集和智能工具,對(duì)非結(jié)構(gòu)化文件數(shù)據(jù)進(jìn)行管理,實(shí)現(xiàn)智能的自動(dòng)化,這有助于對(duì)數(shù)據(jù)進(jìn)行深度分析,幫助客戶從單一系統(tǒng)中存儲(chǔ)、共享、同步、保護(hù)、保存、分析和檢索文件數(shù)據(jù),減少垃圾數(shù)據(jù),進(jìn)而為大數(shù)據(jù)分析建立一個(gè)良好的基礎(chǔ)?!?/p>
談到用戶在大數(shù)據(jù)應(yīng)用中遇到的主要障礙,陳戈表示,一方面,應(yīng)用軟件本身的智能程度是否能滿足行業(yè)應(yīng)用需求,應(yīng)用軟件是否已經(jīng)成型,大數(shù)據(jù)人才是否具備等,是讓大數(shù)據(jù)應(yīng)用落地的關(guān)鍵;另一方面,如何抽取數(shù)據(jù),放在大數(shù)據(jù)平臺(tái)中進(jìn)行相應(yīng)的計(jì)算是另一個(gè)關(guān)鍵問題。
HDS可為所有數(shù)據(jù)提供單一、可擴(kuò)展的虛擬化集成平臺(tái)。HDS推出了“三步”云戰(zhàn)略,從基礎(chǔ)架構(gòu)、內(nèi)容和信息三個(gè)層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎(chǔ)架構(gòu)云”,HDS可以幫助客戶進(jìn)行虛擬化和集成管理,實(shí)現(xiàn)數(shù)據(jù)中心的整合;在第二層的“內(nèi)容云”當(dāng)中,HDS可以按需提供內(nèi)容,更可以不受應(yīng)用限制地進(jìn)行數(shù)據(jù)搜索和集成;在第三層的“信息云”中,針對(duì)所有數(shù)據(jù)類型,HDS在其存儲(chǔ)平臺(tái)中融入了分析功能,使客戶可以從數(shù)據(jù)信息中獲取洞察力。
HDS提供的UCP for SAP HANA集成了基于大量數(shù)據(jù)集的創(chuàng)新和內(nèi)存分析技術(shù),并提供實(shí)時(shí)的洞察力,從而使當(dāng)前的信息驅(qū)動(dòng)型企業(yè)可以加快其商業(yè)決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結(jié)合了HDS刀片服務(wù)器技術(shù)、企業(yè)級(jí)存儲(chǔ)系統(tǒng)和業(yè)內(nèi)領(lǐng)先的網(wǎng)絡(luò)組件,在這樣一個(gè)集成的、高性能的硬件平臺(tái)上可以快速交付SAP下一代內(nèi)存計(jì)算技術(shù)。全球已有超過200家客戶在使用HDS和SAP的大數(shù)據(jù)解決方案。
方案點(diǎn)評(píng)
其實(shí),HDS的“三步”云戰(zhàn)略也可以看成是其大數(shù)據(jù)戰(zhàn)略。HDS借助以UCP為核心的大數(shù)據(jù)平臺(tái),可以幫助企業(yè)用戶構(gòu)建從基礎(chǔ)架構(gòu)到內(nèi)容歸檔和搜索,直至信息提取和分析的全面、高效的大數(shù)據(jù)解決方案。HDS的“信息云”直接與大數(shù)據(jù)相關(guān)。UCP是一個(gè)集成了計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)的一體化平臺(tái),它既可以提供像一體機(jī)一樣的整合性、簡(jiǎn)單性,又可以提供靈活的選擇,連接第三方的設(shè)備組件。HDS還通過與包括SAP在內(nèi)的眾多大數(shù)據(jù)分析類的合作伙伴合作,針對(duì)行業(yè)定制優(yōu)質(zhì)的大數(shù)據(jù)解決方案。
HP StoreAll :快速部署 極速搜索
中國(guó)惠普有限公司企業(yè)集團(tuán)存儲(chǔ)產(chǎn)品部存儲(chǔ)架構(gòu)師張楠向記者表示,大數(shù)據(jù)存儲(chǔ)是一套解決方案,應(yīng)該能夠?qū)Υ髷?shù)據(jù)的Volume、Velocity、Variety和Value四個(gè)方面提供全面的支持。
第一,大數(shù)據(jù)存儲(chǔ)要支持海量級(jí)的數(shù)據(jù)存儲(chǔ),比如具有PB級(jí)的存儲(chǔ)能力。第二,大數(shù)據(jù)存儲(chǔ)要支持更高的存儲(chǔ)速度,支持10Gb甚至更高的網(wǎng)絡(luò)連接。第三,大數(shù)據(jù)存儲(chǔ)要支持?jǐn)?shù)據(jù)的多樣性,如圖片、文本、視頻、音頻等。第四,大數(shù)據(jù)最重要的是價(jià)值的體現(xiàn),而為了實(shí)現(xiàn)這一點(diǎn),存儲(chǔ)本身應(yīng)該具備快速、智能的數(shù)據(jù)檢索能力?!霸诖鎯?chǔ)的最底層提供最直接、快捷的數(shù)據(jù)檢索。這一過程簡(jiǎn)單說就是,將上層的數(shù)據(jù)挖掘工作下移,充分利用存儲(chǔ)強(qiáng)大的處理能力和數(shù)據(jù)識(shí)別能力?!睆堥e例說,“比如,在秒級(jí)的單位內(nèi)對(duì)數(shù)據(jù)進(jìn)行極速的搜索, 從幾千萬甚至上億個(gè)文件中找到目標(biāo)數(shù)據(jù)?!?/p>
另外,模糊查詢能力也是大數(shù)據(jù)存儲(chǔ)不可缺少的功能。智能的模糊查詢將為大數(shù)據(jù)平臺(tái)提供更加便捷的存儲(chǔ)服務(wù)能力,使得存儲(chǔ)更像一臺(tái)智能的高速計(jì)算設(shè)備。
目前,很多中國(guó)用戶在存儲(chǔ)廠商的引導(dǎo)下,片面追求存儲(chǔ)的大容量和高性能,而忽略了大數(shù)據(jù)存儲(chǔ)本身應(yīng)該提供的其他額外屬性。中國(guó)用戶在實(shí)施大數(shù)據(jù)的過程中經(jīng)常遇到的障礙有以下兩方面:第一,無法將存儲(chǔ)與大數(shù)據(jù)平臺(tái)進(jìn)行對(duì)接;第二,無法充分利用大數(shù)據(jù)存儲(chǔ)的價(jià)值,也很難將其運(yùn)用到實(shí)際的業(yè)務(wù)中。張楠表示,究其原因,主要在于有些大數(shù)據(jù)存儲(chǔ)產(chǎn)品沒有開放的接口協(xié)議,或沒有針對(duì)用戶的大數(shù)據(jù)場(chǎng)景進(jìn)行特別優(yōu)化,也沒有用戶容易接受的易用的管理方式等。
惠普在大數(shù)據(jù)方面可以提供軟硬結(jié)合的解決方案?;萜赵谑召?gòu)Autonomy公司之后,將其軟件與惠普的硬件平臺(tái)進(jìn)行了整合, 形成了一套完整的大數(shù)據(jù)解決方案。張楠介紹說,在存儲(chǔ)方面,惠普擁有像StoreAll這樣的大數(shù)據(jù)存儲(chǔ)平臺(tái)。借助HP StoreAll硬件平臺(tái),用戶除了可以實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)和高速數(shù)據(jù)訪問以外,還能實(shí)現(xiàn)高級(jí)的數(shù)據(jù)檢索功能,對(duì)特殊文件進(jìn)行快速定位。同時(shí),結(jié)合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業(yè)用戶通過存儲(chǔ)底層為上層業(yè)務(wù)帶來所需的大數(shù)據(jù)業(yè)務(wù)價(jià)值。
如今,閃存不僅在大數(shù)據(jù)領(lǐng)域,而且在Tier 1存儲(chǔ)市場(chǎng)同樣占據(jù)著十分重要的地位。對(duì)于大數(shù)據(jù)平臺(tái)來說,閃存可用來提升存儲(chǔ)的存取速度,降低I/O的響應(yīng)時(shí)間等。針對(duì)那些I/O壓力十分明確的大數(shù)據(jù)平臺(tái), SSD可以發(fā)揮其效果, 提升存儲(chǔ)的整體性能。但是,SSD并不是萬能的。因?yàn)榇蟛糠值臄?shù)據(jù)都是非結(jié)構(gòu)化的,而非結(jié)構(gòu)化數(shù)據(jù)對(duì)I/O的響應(yīng)要求遠(yuǎn)遠(yuǎn)沒有對(duì)帶寬的需求大,所以,讓用戶花數(shù)倍的價(jià)格購(gòu)買SSD存儲(chǔ)在目前來看還是比較困難的。從目前情況看,引入閃存的大數(shù)據(jù)解決方案還不是很普遍。
方案點(diǎn)評(píng)
惠普在大數(shù)據(jù)方面收購(gòu)了兩個(gè)軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺(tái)進(jìn)行整合,針對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)都可以提供針對(duì)性的解決方案。惠普在將大數(shù)據(jù)軟件與存儲(chǔ)硬件結(jié)合上也進(jìn)行了嘗試,其中一個(gè)成功的例子就是HP StoreAll大數(shù)據(jù)存儲(chǔ)平臺(tái)。HP StoreAll具有以下特點(diǎn):橫向擴(kuò)展,最大可以擴(kuò)展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實(shí)現(xiàn)實(shí)時(shí)大數(shù)據(jù)的價(jià)值;內(nèi)置對(duì)OpenStack的支持,可快速部署;支持文件和對(duì)象類型的數(shù)據(jù)存儲(chǔ)。
NetApp:統(tǒng)一架構(gòu) 無限擴(kuò)展
如今,企業(yè)若想獲得成功,就必須想方設(shè)法應(yīng)對(duì)具有前所未有的復(fù)雜性、高性能的海量數(shù)據(jù),并盡可能地管理這些數(shù)據(jù),從中發(fā)掘更大的商業(yè)價(jià)值。
對(duì)于國(guó)內(nèi)用戶來說,無論企業(yè)的規(guī)模和數(shù)據(jù)量大小如何,運(yùn)用大數(shù)據(jù)的關(guān)鍵在于,企業(yè)是否把大數(shù)據(jù)作為一個(gè)真正的工具,去體現(xiàn)企業(yè)的差異化,從而提升競(jìng)爭(zhēng)力。隨著越來越智慧的企業(yè)信息化的發(fā)展,IT不再是束縛企業(yè)發(fā)展的瓶頸,而是真正地融入了企業(yè)自身的業(yè)務(wù)中。越來越多的公司將大數(shù)據(jù)成功地運(yùn)用于企業(yè)的商業(yè)模式。例如,在歐美,很多企業(yè)已經(jīng)著手將大量資源投放在大數(shù)據(jù)領(lǐng)域。反觀國(guó)內(nèi),在金融領(lǐng)域,有為數(shù)不少的企業(yè)通過大數(shù)據(jù)的分析工具來分析金融的走勢(shì),實(shí)現(xiàn)風(fēng)險(xiǎn)管理,進(jìn)行信用卡的追蹤等。此外,像零售、制造、電信等行業(yè)也已在嘗試?yán)么髷?shù)據(jù)分析工具為企業(yè)營(yíng)銷和決策提供支撐。
無論企業(yè)現(xiàn)在是否正在使用大數(shù)據(jù)工具,企業(yè)都應(yīng)全面地考慮自身未來發(fā)展的需求,選擇一個(gè)廠家的平臺(tái)與之共同發(fā)展,這可以有效避免因數(shù)據(jù)和應(yīng)用遷移帶來的麻煩。
在大數(shù)據(jù)方面,NetApp能夠幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)管理,應(yīng)對(duì)業(yè)務(wù)挑戰(zhàn)的極限,將以數(shù)據(jù)為導(dǎo)向的洞察轉(zhuǎn)化為有效行動(dòng)。若想將數(shù)據(jù)轉(zhuǎn)化為商機(jī),僅僅提升管理能力是不夠的,需要徹底轉(zhuǎn)變數(shù)據(jù)和業(yè)務(wù)之間的聯(lián)系模式。NetApp可以幫助企業(yè)用戶持續(xù)管理數(shù)據(jù),迅速把握意料之外的新商機(jī),永久保存所有數(shù)據(jù),并在靈活、開放的存儲(chǔ)平臺(tái)之上打造屬于企業(yè)自己的大數(shù)據(jù)解決方案。
NetApp提供了可高效處理、分析、管理和訪問大規(guī)模數(shù)據(jù)的大數(shù)據(jù)解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內(nèi)容三個(gè)主要用例,這被稱之為大數(shù)據(jù)的“ABC”基本要素。
具體來看,分析(Analysis)是指針對(duì)極大數(shù)據(jù)集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數(shù)字世界,將數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的信息,以及提供關(guān)于業(yè)務(wù)的更深入見解,從而幫助企業(yè)做出更好的決策。
帶寬(Bandwidth)是指適用于數(shù)據(jù)密集型工作負(fù)載的性能。此類解決方案著重于為速度非??斓墓ぷ髫?fù)載提供更高的性能。高帶寬應(yīng)用包括高性能計(jì)算(能以極快的速度執(zhí)行復(fù)雜的分析)、用于監(jiān)控和任務(wù)規(guī)劃的高性能視頻流、媒體和娛樂領(lǐng)域中的視頻剪輯和播放。
內(nèi)容(Content)是指無限的安全數(shù)據(jù)存儲(chǔ)。此類解決方案著重于滿足可擴(kuò)展的安全數(shù)據(jù)存儲(chǔ)需求。內(nèi)容解決方案必須支持存儲(chǔ)的無限擴(kuò)展能力,以便企業(yè)可以根據(jù)需要存儲(chǔ)任意多的數(shù)據(jù),并能在需要時(shí)找到所需的數(shù)據(jù)。
NetApp致力于通過一系列解決方案來提供高性能的運(yùn)算和大數(shù)據(jù)的應(yīng)用。2013年11月,NetApp再次更新了E系列家族產(chǎn)品,推出E2700和E5500。該系列產(chǎn)品采用可輕松擴(kuò)展的設(shè)計(jì),適用于要求99.999%的可靠性且穩(wěn)定、高性能的工作負(fù)載。
用戶在采購(gòu)大數(shù)據(jù)存儲(chǔ)產(chǎn)品時(shí),需要注意以下五個(gè)方面的問題:大數(shù)據(jù)存儲(chǔ)必須具有向上擴(kuò)展與向外擴(kuò)展的能力;架構(gòu)必須是針對(duì)工作負(fù)載進(jìn)行優(yōu)化的,具有實(shí)時(shí)處理能力;具有整合的數(shù)據(jù)保護(hù)功能;保證7×24小時(shí)運(yùn)行不中斷,可在線進(jìn)行容量擴(kuò)展,實(shí)施數(shù)據(jù)遷移等;可以實(shí)現(xiàn)服務(wù)的自動(dòng)化。
方案點(diǎn)評(píng)
NetApp的技術(shù)優(yōu)勢(shì)集中體現(xiàn)在其統(tǒng)一存儲(chǔ)平臺(tái)上,從入門級(jí)產(chǎn)品到企業(yè)級(jí)產(chǎn)品,全部基于同一個(gè)體系架構(gòu)和操作系統(tǒng),不僅部署和使用方便,而且升級(jí)和擴(kuò)展非常簡(jiǎn)單。當(dāng)初,NetApp收購(gòu)LSI Engenio,其中一個(gè)重要的原因就是為了大數(shù)據(jù)。2013年,NetApp不斷更新E系列產(chǎn)品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負(fù)載和數(shù)據(jù)庫、高性能文件系統(tǒng)和帶寬密集型流等應(yīng)用,可確保數(shù)據(jù)的高可用性、完整性和安全性。
曙光XData:高度集成 貼近行業(yè)
關(guān)于大數(shù)據(jù)存儲(chǔ),目前業(yè)界沒有一個(gè)通用的定義。曙光信息產(chǎn)業(yè)股份有限公司總裁助理兼存儲(chǔ)產(chǎn)品線產(chǎn)品總監(jiān)惠潤(rùn)海從曙光大數(shù)據(jù)平臺(tái)和解決方案角度,概括出大數(shù)據(jù)存儲(chǔ)的主要特征。
首先,大數(shù)據(jù)存儲(chǔ)必須支持全類型數(shù)據(jù), 包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)數(shù)據(jù),實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)支持。
其次,存儲(chǔ)性能上,一方面,大數(shù)據(jù)存儲(chǔ)要支持海量數(shù)據(jù),并且要在保證數(shù)據(jù)可靠性的基礎(chǔ)之上,實(shí)現(xiàn)容量與性能的線性擴(kuò)展;另一方面,為了實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,批處理和實(shí)時(shí)處理兩種措施都需要高性能的數(shù)據(jù)訪問獲取能力。
最后,在系統(tǒng)達(dá)到一定規(guī)模之后,系統(tǒng)的易用性和可管理性也是不可或缺的。
從應(yīng)用角度來說,目前中國(guó)用戶在大數(shù)據(jù)存儲(chǔ)應(yīng)用中最迫切的需求,是如何真正實(shí)現(xiàn)用戶數(shù)據(jù)的價(jià)值,如何驅(qū)動(dòng)業(yè)務(wù)發(fā)展,實(shí)現(xiàn)決策和運(yùn)營(yíng)?!皬南到y(tǒng)構(gòu)建層面說,要實(shí)現(xiàn)數(shù)據(jù)高性價(jià)比的存儲(chǔ)和管理,同時(shí)滿足數(shù)據(jù)服務(wù)的相關(guān)需求?!被轁?rùn)海表示。
針對(duì)用戶對(duì)大數(shù)據(jù)存儲(chǔ)的需求, 曙光推出了像大數(shù)據(jù)一體機(jī)這樣的全類型數(shù)據(jù)分析型產(chǎn)品,同時(shí)還基于該產(chǎn)品構(gòu)建了基于行業(yè)的解決方案,以幫助用戶實(shí)現(xiàn)大數(shù)據(jù)落地。
“除此之外, 我們還提供了大數(shù)據(jù)統(tǒng)一數(shù)據(jù)中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對(duì)文件存儲(chǔ)的Parastor等存儲(chǔ)產(chǎn)品。我們基于這些存儲(chǔ)產(chǎn)品構(gòu)建了大數(shù)據(jù)運(yùn)營(yíng)管理平臺(tái)?!被轁?rùn)海介紹說,“曙光的優(yōu)勢(shì)不僅在于可以提供全面的產(chǎn)品支撐,更重要的是能夠提供數(shù)據(jù)生命周期過程服務(wù)支持。目前,我們提供的免費(fèi)維保期限為5年?!?/p>
曙光開發(fā)了針對(duì)不同行業(yè)和應(yīng)用場(chǎng)景的大數(shù)據(jù)存儲(chǔ)解決方案。以金融行業(yè)為例,目前國(guó)內(nèi)四大行的應(yīng)用系統(tǒng)每年產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)量已達(dá)到PB級(jí),結(jié)構(gòu)化數(shù)據(jù)也以百TB計(jì)。面對(duì)如此大量的數(shù)據(jù),如何存儲(chǔ)、管理、利用和盤活它們呢?惠潤(rùn)海認(rèn)為,只有通過商業(yè)智能和高級(jí)分析應(yīng)用解決方案才能將數(shù)據(jù)的價(jià)值最大程度地發(fā)揮出來。
針對(duì)金融行業(yè)用戶的需求,曙光開發(fā)的XData大數(shù)據(jù)解決方案利用優(yōu)化的大數(shù)據(jù)處理技術(shù),對(duì)文件管理、歷史數(shù)據(jù)查詢和數(shù)據(jù)分析類應(yīng)用等進(jìn)行深入研究,為數(shù)據(jù)爆炸式增長(zhǎng)帶來的海量數(shù)據(jù)存儲(chǔ)及分析應(yīng)用提供高可靠的解決方案。
曙光金融行業(yè)XData大數(shù)據(jù)解決方案采用曙光自主研發(fā)的SN-MPP并行數(shù)據(jù)庫,同時(shí)結(jié)合大數(shù)據(jù)處理事實(shí)標(biāo)準(zhǔn)Hadoop,并充分考慮了多方面的數(shù)據(jù)收集,加入ETL工具和連接驅(qū)動(dòng)器,提供了類SQL的接口,還和現(xiàn)有金融業(yè)務(wù)系統(tǒng)進(jìn)行對(duì)接。
10月18日,在微軟公司大數(shù)據(jù)媒體日活動(dòng)現(xiàn)場(chǎng),微軟分享了其在大數(shù)據(jù)領(lǐng)域的最新研究成果和解決方案,來自國(guó)內(nèi)的銀行、汽車、交通運(yùn)輸、醫(yī)療衛(wèi)生和零售業(yè)用戶分享了其應(yīng)用體驗(yàn)。
大掌控、大智匯、大洞察
在大數(shù)據(jù)成為流行詞之前,微軟便已著手于大數(shù)據(jù)的應(yīng)用與研發(fā),例如微軟Bing的高質(zhì)量搜索結(jié)果,便是通過分析超過100PB的數(shù)據(jù)得到的。微軟大數(shù)據(jù)解決方案的目標(biāo),是讓所有用戶都能獲得來自任何數(shù)據(jù)有價(jià)值的洞察力。
微軟大中華區(qū)副總裁兼市場(chǎng)戰(zhàn)略部副總經(jīng)理、大中華區(qū)首席云戰(zhàn)略官謝恩偉介紹,為了實(shí)現(xiàn)這一目標(biāo),微軟為大數(shù)據(jù)解決方案制定了全面的戰(zhàn)略——大掌控、大智匯、大洞察。
大掌控,即“支持所有數(shù)據(jù)類型的現(xiàn)代化的管理層”。微軟大數(shù)據(jù)解決方案的數(shù)據(jù)管理平臺(tái)可以無縫地存儲(chǔ)和處理包括結(jié)構(gòu)化、非結(jié)構(gòu)化和實(shí)時(shí)數(shù)據(jù)在內(nèi)的所有類型的數(shù)據(jù)。微軟推出的HDInsight是一種適合企業(yè)使用的、基于HDP的Hadoop服務(wù),它將Windows的簡(jiǎn)易性和可管理性帶給Hadoop,提供了結(jié)合Hadoop的擴(kuò)展平臺(tái),并為大數(shù)據(jù)提供了靈活且可擴(kuò)展的云。
大智匯,即“搜索并結(jié)合廣泛數(shù)據(jù),進(jìn)行先進(jìn)分析與精煉,從而提高數(shù)據(jù)價(jià)值的富集層”。微軟大數(shù)據(jù)解決方案,通過將數(shù)據(jù)和模型與公開的數(shù)據(jù)服務(wù)相結(jié)合,實(shí)現(xiàn)了突破性的數(shù)據(jù)發(fā)現(xiàn),例如自動(dòng)發(fā)現(xiàn)與共享防火墻外部的和第三方的數(shù)據(jù)源等。
大洞察,即“用戶熟悉的工具可為用戶提供具有直觀洞察力的洞悉層”。微軟大數(shù)據(jù)解決方案可以使客戶通過熟悉的由Hive add-in for Excel生成的Excel界面,從Hadoop功能中獲取有價(jià)值的洞察力,也可經(jīng)由企業(yè)熟悉的BI工具,如SQL Server 分析服務(wù)、PowerPivot和通過Hive Open Database Connectivity 驅(qū)動(dòng)生成的Power View來分析Hadoop中的非結(jié)構(gòu)化數(shù)據(jù)。
數(shù)據(jù)分析結(jié)果要“傻瓜化”
“我們要將挖掘與分析的結(jié)果直觀呈現(xiàn),轉(zhuǎn)換為用戶真正需要的有價(jià)值的洞察力?!?微軟全球高級(jí)副總裁、大中華區(qū)董事長(zhǎng)兼首席執(zhí)行官賀樂賦說。
大數(shù)據(jù)不一定是復(fù)雜的分析
許多人一提到大數(shù)據(jù),首先想到的是復(fù)雜的數(shù)據(jù)分析。這讓有些希望采用大數(shù)據(jù)分析工具的用戶產(chǎn)生了畏難情緒,也讓有些用戶產(chǎn)生了誤解,認(rèn)為大數(shù)據(jù)分析只是那些擁有復(fù)雜業(yè)務(wù)流程和海量數(shù)據(jù)的大企業(yè)的事。市場(chǎng)研究機(jī)構(gòu)麥肯錫的研究人員表示:“要?jiǎng)?chuàng)造新的重大價(jià)值,并不一定要采用復(fù)雜的大數(shù)據(jù)分析方法,有時(shí)只要能保證數(shù)據(jù)的可用性或?qū)?shù)據(jù)應(yīng)用進(jìn)行基本的分析,就能獲得所需的重要價(jià)值。”
不同的企業(yè)或一個(gè)企業(yè)內(nèi)部不同的部門對(duì)數(shù)據(jù)分析和數(shù)據(jù)價(jià)值的理解都不相同。企業(yè)處于不同的信息化發(fā)展階段,也會(huì)設(shè)定不同的數(shù)據(jù)分析目標(biāo),采用不同的數(shù)據(jù)分析工具。正是基于此,戴爾率先提出了大數(shù)據(jù)成熟度模型。戴爾公司全球企業(yè)級(jí)解決方案副總裁Cheryl Cook表示:“這一模型已經(jīng)得到了業(yè)內(nèi)許多分析機(jī)構(gòu)的認(rèn)可。所有行業(yè)以及所有數(shù)據(jù)應(yīng)用都適用于此模型?!?/p>
如下圖所示,大數(shù)據(jù)成熟度模型分成五個(gè)階段。第一個(gè)階段,數(shù)據(jù)處于混亂狀態(tài),數(shù)據(jù)存儲(chǔ)無章可循,數(shù)據(jù)難以訪問,企業(yè)的信息系統(tǒng)處于高風(fēng)險(xiǎn)狀態(tài)。第二個(gè)階段,實(shí)現(xiàn)數(shù)據(jù)的保留。在這個(gè)階段,企業(yè)被動(dòng)地對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。數(shù)據(jù)雖然經(jīng)過一定的處理,但還不具有高質(zhì)量,數(shù)據(jù)的訪問也會(huì)受到一定限制。第三個(gè)階段,實(shí)現(xiàn)存儲(chǔ)的優(yōu)化。在這個(gè)階段,通過對(duì)存儲(chǔ)系統(tǒng)的進(jìn)一步優(yōu)化以及基于策略的控制與管理,用戶可以逐步發(fā)現(xiàn)數(shù)據(jù)的價(jià)值。第四個(gè)階段,實(shí)現(xiàn)簡(jiǎn)單的分析。在存儲(chǔ)優(yōu)化的基礎(chǔ)上,用戶可以進(jìn)行數(shù)據(jù)建模和簡(jiǎn)單的數(shù)據(jù)分析,對(duì)歸檔數(shù)據(jù)進(jìn)行搜索等。第五個(gè)階段,實(shí)現(xiàn)復(fù)雜的分析。在這個(gè)階段,大數(shù)據(jù)分析工具將得到充分應(yīng)用,用戶可以進(jìn)行比較復(fù)雜的建模、分析和決策。經(jīng)過上述五個(gè)階段,曾經(jīng)雜亂無章的數(shù)據(jù)也將經(jīng)歷從數(shù)據(jù)到信息再到知識(shí)的轉(zhuǎn)變過程,最終成為企業(yè)決策的重要依據(jù)。
這個(gè)大數(shù)據(jù)成熟度模型可以解答人們對(duì)于大數(shù)據(jù)應(yīng)用的幾個(gè)疑惑。第一,用戶使用大數(shù)據(jù)分析工具,并不意味著一定要進(jìn)行復(fù)雜的分析。舉例來說,處于存儲(chǔ)優(yōu)化階段的用戶就可以實(shí)現(xiàn)無障礙的數(shù)據(jù)訪問,并能獲得所需的數(shù)據(jù)價(jià)值。第二,大數(shù)據(jù)的應(yīng)用要經(jīng)歷一個(gè)逐步完善的過程,必須循序漸進(jìn),先做好數(shù)據(jù)存儲(chǔ)和優(yōu)化,然后再進(jìn)行數(shù)據(jù)分析。第三,大數(shù)據(jù)解決方案通常包括兩個(gè)部分:一是大數(shù)據(jù)保留解決方案,二是大數(shù)據(jù)分析解決方案。將兩類解決方案有機(jī)地結(jié)合在一起,才能有效降低大數(shù)據(jù)分析應(yīng)用的成本,更好地挖掘數(shù)據(jù)的價(jià)值。Cheryl Cook表示,戴爾可以提供上述兩種解決方案。一方面,戴爾可以提供針對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)保留解決方案,主要包括存儲(chǔ)虛擬化與整合、應(yīng)用程序優(yōu)化、數(shù)據(jù)保護(hù)、災(zāi)難恢復(fù)以及數(shù)據(jù)保留與管理解決方案;另一方面,戴爾還能提供支持Hadoop、Cloudera等開源軟件的大數(shù)據(jù)分析解決方案。
記者曾與包括大慶油田、太平洋保險(xiǎn)公司等在內(nèi)的一些用戶進(jìn)行過交流。它們目前都沒有計(jì)劃部署大數(shù)據(jù)應(yīng)用。“從全球范圍來看,大數(shù)據(jù)應(yīng)用還處于起步階段?!贝鳡杹喬叭毡镜貐^(qū)商用事業(yè)部企業(yè)解決方案副總裁Philip A. Davis表示,“與云計(jì)算興起時(shí)一樣,可能要經(jīng)過兩三年的市場(chǎng)培育,用戶才能逐漸接受大數(shù)據(jù)應(yīng)用。”
中國(guó)東方航空股份有限公司信息部總經(jīng)理嚴(yán)振紅介紹說:“在大數(shù)據(jù)的概念出現(xiàn)以前,我們就在做客戶數(shù)據(jù)、經(jīng)營(yíng)數(shù)據(jù)的分析工作。但是客戶數(shù)據(jù)庫、經(jīng)營(yíng)數(shù)據(jù)庫等都是相互獨(dú)立的,數(shù)據(jù)不能共享?,F(xiàn)在,我們要做的是將這些系統(tǒng)的數(shù)據(jù)整合起來,統(tǒng)一進(jìn)行分析?!?/p>
Hadoop不是萬能的
簡(jiǎn)單來說,Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架。Hadoop最獨(dú)特的優(yōu)勢(shì)在于為用戶提供了一個(gè)分布式的、高容錯(cuò)的文件系統(tǒng)和加速數(shù)據(jù)處理的辦法。隨著Web 2.0、社交網(wǎng)站的大規(guī)模興起,人們需要一個(gè)高效的處理非結(jié)構(gòu)化數(shù)據(jù)的平臺(tái)。Hadoop正好可以滿足人們的需求。有些人甚至在Hadoop和大數(shù)據(jù)之間劃上了等號(hào)。Hadoop能夠解決大數(shù)據(jù)應(yīng)用的所有難題嗎?
“Hadoop是一個(gè)復(fù)雜的工具套件。如果沒有廠商或?qū)I(yè)技術(shù)人員的幫助,用戶自己部署Hadoop是一件十分困難的事。目前,Hadoop的應(yīng)用并不普及?;ヂ?lián)網(wǎng)用戶是最早采用Hadoop平臺(tái)的?!盤hilip A.Davis表示,“如果想讓大數(shù)據(jù)解決方案充分發(fā)揮其作用,就必須搭建一個(gè)高效的信息基礎(chǔ)架構(gòu),實(shí)現(xiàn)信息基礎(chǔ)架構(gòu)的自動(dòng)化、智能化,同時(shí)提高其可管理性?!?/p>
Hadoop的應(yīng)用是有一定技術(shù)門檻的。如今,許多IT廠商都推出了基于Hadoop的解決方案包,其目的是幫助用戶簡(jiǎn)化Hadoop的部署與應(yīng)用。Philip A.Davis表示:“戴爾提供的基于Hadoop的大數(shù)據(jù)分析方案可以將Hadoop的部署周期從原來的兩個(gè)月縮短至兩天?!?/p>
VMware全球高級(jí)副總裁范承工也認(rèn)為,由于缺少精通Hadoop技術(shù)的專業(yè)人才,Hadoop的部署對(duì)于用戶來說是一件費(fèi)時(shí)費(fèi)力的事。如今,VMware可以將Hadoop部署在虛擬化架構(gòu)之上,將部署工作從半自動(dòng)化變?yōu)槿詣?dòng)化,從而減少了人工干預(yù),使得Hadoop的部署變得更加簡(jiǎn)單,也不容易出錯(cuò)。
“很多中國(guó)企業(yè)的CIO認(rèn)為,大數(shù)據(jù)解決方案是有價(jià)值的,但實(shí)施起來確實(shí)有許多困難?!贝鳡柸蚋笨偛?、中國(guó)區(qū)大型企業(yè)及公共事業(yè)部總經(jīng)理容永康舉例說,“國(guó)內(nèi)懂得在Hadoop上進(jìn)行開發(fā)的專業(yè)技術(shù)人員非常少。一些金融行業(yè)的用戶很想現(xiàn)在就部署大數(shù)據(jù)解決方案,但是苦于找不到既懂Hadoop技術(shù),又懂得金融業(yè)務(wù)的專業(yè)人才?!?/p>
Informatica首席技術(shù)官James Markarian表示:“在IT環(huán)境中,Hadoop不可能作為一個(gè)孤島存在。為了讓Hadoop跨越不同平臺(tái),用戶需要將Hadoop作為其IT大環(huán)境中的一部分來管理,并通過Hadoop重復(fù)使用他們的開發(fā)技巧、資產(chǎn)及數(shù)據(jù),同時(shí)還要統(tǒng)籌管理全部數(shù)據(jù)?!?/p>
在美國(guó)市場(chǎng)上,70%的大數(shù)據(jù)應(yīng)用處理的還是結(jié)構(gòu)化的數(shù)據(jù)。從技術(shù)的角度看,雖然Hadoop也能處理結(jié)構(gòu)化的數(shù)據(jù),但是目前基于Hadoop的大數(shù)據(jù)分析解決方案主要還是用于處理非結(jié)構(gòu)化的數(shù)據(jù)。因此,用戶處理結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)通常是用兩套不同的分析工具。這種混合的大數(shù)據(jù)處理模式是一種普遍現(xiàn)象。
從未來的發(fā)展看,非結(jié)構(gòu)化數(shù)據(jù)的快速增長(zhǎng)是大數(shù)據(jù)分析的主要驅(qū)動(dòng)因素。從這個(gè)角度講,Hadoop的應(yīng)用前景還是十分廣闊的。
各行各業(yè)都能用得上大數(shù)據(jù),只是對(duì)大數(shù)據(jù)重要性的意識(shí)程度不同:凱捷咨詢(Capgemini)的調(diào)研結(jié)果顯示,76%能源和自然資源行業(yè)的高管相信公司是數(shù)據(jù)驅(qū)動(dòng)的,在醫(yī)療醫(yī)藥行業(yè)和生物科技行業(yè)這個(gè)數(shù)字為75%,在金融行業(yè)為73%。包括英特爾在內(nèi)的有能力提供大數(shù)據(jù)解決方案的IT廠商正在努力讓各行各業(yè)的企業(yè)切實(shí)感受到大數(shù)據(jù)的魔力。
能否置身事外?
隨著網(wǎng)絡(luò)應(yīng)用和多媒體應(yīng)用的興起,互聯(lián)網(wǎng)成為大數(shù)據(jù)的主要來源。隨之而產(chǎn)生的網(wǎng)絡(luò)營(yíng)銷調(diào)整圍繞大數(shù)據(jù)而展開。淘寶是國(guó)內(nèi)公認(rèn)的對(duì)用戶數(shù)據(jù)利用得較好的公司——淘寶網(wǎng)利用大數(shù)據(jù)統(tǒng)計(jì)分析得到諸如“歐洲杯的球隊(duì)勝負(fù)如何影響各隊(duì)球衣的銷量?花露水的最佳搭配是電蚊拍還是痱子粉?”等問題的有趣結(jié)果,并以此為依據(jù)來更好地調(diào)整營(yíng)銷戰(zhàn)略。
近日,阿里巴巴集團(tuán)宣布,將在集團(tuán)管理層面設(shè)立首席數(shù)據(jù)官崗位(Chief Data Officer),負(fù)責(zé)全面推進(jìn)阿里巴巴集團(tuán)成為“數(shù)據(jù)分享平臺(tái)”的戰(zhàn)略。這直接證明了大數(shù)據(jù)對(duì)于互聯(lián)網(wǎng)企業(yè)的意義。
別的行業(yè)能不能對(duì)大數(shù)據(jù)冷眼旁觀呢?賽迪智庫軟件與信息服務(wù)業(yè)研究所研究員安暉認(rèn)為,雖然目前大數(shù)據(jù)的主要來源是互聯(lián)網(wǎng),但許多以信息流作為核心競(jìng)爭(zhēng)力,如金融、電信、零售等行業(yè)的機(jī)構(gòu)或企業(yè),其數(shù)據(jù)量也不容低估。例如,美國(guó)國(guó)家海洋和大氣管理局(NOAA)數(shù)據(jù)中心存儲(chǔ)的數(shù)據(jù)超過20PB,沃爾瑪數(shù)據(jù)中心的存儲(chǔ)能力超過4PB,eBay分析平臺(tái)每天處理的數(shù)據(jù)量高達(dá)100PB。并且,由于這些機(jī)構(gòu)和企業(yè)所存儲(chǔ)的數(shù)據(jù)更加有針對(duì)性,其數(shù)據(jù)的價(jià)值密度更高,進(jìn)行大數(shù)據(jù)處理的意義更強(qiáng),運(yùn)用大數(shù)據(jù)的需求也更為迫切。
安暉以數(shù)個(gè)典型行業(yè)為例來說明大數(shù)據(jù)能帶來什么好處——電信行業(yè)可以從龐大的數(shù)據(jù)中分析出不同群體的差異化需求,實(shí)現(xiàn)套餐制定等精準(zhǔn)營(yíng)銷;制造行業(yè)可以通過整合來自研發(fā)、工程和制造部門的數(shù)據(jù)以實(shí)行并行工程,顯著縮短產(chǎn)品上市時(shí)間并提高質(zhì)量;交通行業(yè)可以通過整合和處理相關(guān)數(shù)據(jù),實(shí)現(xiàn)智能交通(管理)與高效物流調(diào)度。
賽迪顧問軟件與信息服務(wù)業(yè)研究中心研究總監(jiān)胡小鵬認(rèn)為,金融行業(yè)中證券、信用卡、電子支付等數(shù)據(jù)規(guī)模龐大,具有使用對(duì)象多樣化、信息可靠性、實(shí)時(shí)性、保密性要求高等特點(diǎn);電信行業(yè)中大數(shù)據(jù)主要體現(xiàn)為電信業(yè)務(wù)系統(tǒng)產(chǎn)業(yè)的計(jì)費(fèi)賬務(wù)數(shù)據(jù)和用戶信息(包括客戶資料、客戶服務(wù)數(shù)據(jù)等),不僅數(shù)據(jù)量大,而且保存時(shí)間長(zhǎng);能源行業(yè)大數(shù)據(jù)主要集中在石油勘探以及電力生產(chǎn)、經(jīng)營(yíng)、管理等數(shù)據(jù),具有數(shù)據(jù)量大、分散、類型復(fù)雜等特點(diǎn)。其中,在金融行業(yè),利用大數(shù)據(jù)的挖掘和分析改善用戶體驗(yàn)、監(jiān)督欺詐行為、驗(yàn)證合規(guī)性、服務(wù)創(chuàng)新等,從而助力金融智能決策,提升競(jìng)爭(zhēng)力;而對(duì)于電力行業(yè),大數(shù)據(jù)分析有利于電網(wǎng)安全高效運(yùn)行(安全檢測(cè)與控制、災(zāi)難預(yù)警與處理、供電與電力調(diào)度決策支持和負(fù)荷預(yù)測(cè))、電力營(yíng)銷(用戶用電行為分析)、集團(tuán)集中管控與精細(xì)化管理等。
大數(shù)據(jù)這場(chǎng)盛宴上,哪個(gè)行業(yè)也不愿意沒有一席之地。
誰能站出來?
大數(shù)據(jù)的熱度可以由英特爾、IBM、EMC、惠普等廠商紛紛推出面向大數(shù)據(jù)的一體化產(chǎn)品和解決方案直接反映出來。
然而,一個(gè)不能逃避的現(xiàn)實(shí)是,雖然越來越多的行業(yè)用戶嘗試應(yīng)用大數(shù)據(jù)的解決方案,但是大多數(shù)行業(yè)用戶對(duì)于大數(shù)據(jù)的認(rèn)知仍然比較有限。面對(duì)林林總總的不同廠商提供的大數(shù)據(jù)解決方案,用戶分不清這些解決方案的差異在哪里,也就不會(huì)真正了解哪種解決方案適合自己。
有用戶反映,大數(shù)據(jù)解決方案容易給人的錯(cuò)覺是該解決方案就是把數(shù)據(jù)分布存儲(chǔ),再并行處理。即使采用國(guó)外廠商的工具,這些工具成熟度不是特別高,導(dǎo)致解決實(shí)際問題的時(shí)間過長(zhǎng)。
英特爾相關(guān)專家表示,從總體上看,中國(guó)大數(shù)據(jù)市場(chǎng)發(fā)展迅速,特征明顯,相關(guān)技術(shù)和應(yīng)用可改進(jìn)和提升的空間巨大。而且大數(shù)據(jù)要落地,必須實(shí)現(xiàn)包括芯片商、軟件企業(yè)等在內(nèi)的IT基礎(chǔ)設(shè)施與服務(wù)層平臺(tái)的開放。
英特爾在硬件上的領(lǐng)先無需多言。在軟件層面,考慮到Hadoop的開源特性,很多廠商都有機(jī)會(huì)在Hadoop的基礎(chǔ)上推出產(chǎn)品,但行業(yè)解決方案提供商面臨的一個(gè)苦惱是,他們不得不進(jìn)行底層開發(fā)。實(shí)際上,底層解決方案是有很多共性的。對(duì)行業(yè)解決方案提供商來說,如果有一個(gè)由可靠廠商優(yōu)化過的平臺(tái)再好不過了。利用這個(gè)平臺(tái),行業(yè)解決方案提供商可以拋開重復(fù)的、無意義的勞動(dòng),將注意力和精力更加集中在行業(yè)特點(diǎn)上,進(jìn)而開發(fā)出滿足行業(yè)所需的實(shí)打?qū)嵉男袠I(yè)解決方案。在這種情況下,英特爾適時(shí)地推出了英特爾Hadoop發(fā)行版,打造一個(gè)優(yōu)秀的、高價(jià)值的底層平臺(tái)。
對(duì)于如何從大數(shù)據(jù)中發(fā)掘價(jià)值,英特爾指出,這需要在IT基礎(chǔ)設(shè)施與服務(wù)層、數(shù)據(jù)組織與管理層、數(shù)據(jù)分析與發(fā)現(xiàn)層、決策支持與IT服務(wù)層全面引入新的技術(shù),特別是在堪稱大數(shù)據(jù)應(yīng)用“載體”的IT基礎(chǔ)設(shè)施與服務(wù)層,采用基于開放架構(gòu)的平臺(tái)將是最佳選擇。
O‘Reilly Strata和Open Source Convention大會(huì)委員會(huì)主席Edd Dumbill曾指出,使大數(shù)據(jù)真正變得強(qiáng)大的方式之一就是讓上層程序員可以將精力放在數(shù)據(jù)而非底層Hadoop設(shè)施的抽象特征上。他們編寫更簡(jiǎn)短的程序,能夠更清晰地表達(dá)出對(duì)數(shù)據(jù)所做的處理。這些將有助于為非程序員創(chuàng)建更好的工具。
延伸到企業(yè)層面,“行業(yè)解決方案提供商需要穩(wěn)定性和可用性都足夠好的平臺(tái)。在這樣的平臺(tái)上,行業(yè)解決方案提供商可以從不必要的重復(fù)性勞動(dòng)中解放出來,從而把更多的精力放在提供差異化特色方案和服務(wù)上?!庇⑻貭杹喬邪l(fā)有限公司總經(jīng)理、英特爾軟件與服務(wù)事業(yè)部中國(guó)區(qū)總經(jīng)理何京翔的看法類似。進(jìn)而,他解讀了英特爾Hadoop發(fā)行版的優(yōu)勢(shì):“英特爾Hadoop發(fā)行版的優(yōu)勢(shì)在于:處理接近于實(shí)時(shí);能在英特爾平臺(tái)上實(shí)現(xiàn)最優(yōu)化的性能,比非英特爾發(fā)行版有成倍的增長(zhǎng);通過和電信、智能城市、醫(yī)療等行業(yè)客戶的合作,英特爾Hadoop還做了更進(jìn)一步的優(yōu)化?!?/p>
除了提供平臺(tái),英特爾(中國(guó))行業(yè)合作與解決方案部中國(guó)區(qū)總監(jiān)凌琦強(qiáng)調(diào),英特爾還會(huì)把大數(shù)據(jù)解決方案的研究和服務(wù)作為投資部門的重點(diǎn)。英特爾的風(fēng)險(xiǎn)投資部門也對(duì)大數(shù)據(jù)中所涉及的關(guān)鍵平臺(tái)、關(guān)鍵應(yīng)用、提供商,給予關(guān)注。
行業(yè)側(cè)重點(diǎn)
英特爾硬件平臺(tái)的特點(diǎn)讓其可以用“通吃”來形容,行業(yè)特色則由軟件來體現(xiàn)。
在云計(jì)算、大數(shù)據(jù)時(shí)代,企業(yè)更需要以互聯(lián)網(wǎng)的思維方式構(gòu)建面向未來的分布式應(yīng)用,這就需要一個(gè)全新的技術(shù)架構(gòu)。從這個(gè)角度說,F(xiàn)usionCube融合一體機(jī)解決方案與面向大數(shù)據(jù)應(yīng)用的SAP HANA相得益彰。
“SAP HANA是一個(gè)能夠充分挖掘和體現(xiàn)大數(shù)據(jù)價(jià)值的解決方案。與傳統(tǒng)的數(shù)據(jù)分析、商業(yè)智能解決方案不同,SAP HANA提供了一整套模型和工具,可以通過對(duì)大數(shù)據(jù)的分析預(yù)測(cè)未來的業(yè)務(wù)發(fā)展,給企業(yè)帶來新的商機(jī)?!比沃均i分析說,“針對(duì)SAP HANA,華為提供了一個(gè)創(chuàng)新的技術(shù)平臺(tái)FusionCube,將計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)有機(jī)地結(jié)合在一起,并融合了華為分布式存儲(chǔ)引擎以及云管理軟件,使得大數(shù)據(jù)的實(shí)時(shí)分析與處理可以達(dá)到更高的水平?!痹赥PC-H測(cè)試中,華為FusionCube 刷新了基于Sybase IQ的集群性能世界記錄,充分展示了其融合架構(gòu)帶來的性能優(yōu)勢(shì)。
大規(guī)模定制是云計(jì)算、大數(shù)據(jù)時(shí)代的一個(gè)典型特征。許多企業(yè)客戶都需要廠商提供基于其個(gè)性化需求定制的解決方案。今天,針對(duì)不同企業(yè)的不同需求,華為提供了支持單節(jié)點(diǎn)HANA的RH5885方案和多節(jié)點(diǎn)HANA的FusionCube方案。任志鵬介紹說:“SAP HANA對(duì)基礎(chǔ)設(shè)施有很嚴(yán)格的要求。華為FusionCube for HANA一體機(jī)具備更快的同步寫性能、更低延時(shí)和更高的讀寫帶寬,以及很好的線性擴(kuò)展能力。FusionCube可實(shí)現(xiàn)一站式交付、家電化安裝,并能按需靈活擴(kuò)展應(yīng)用,運(yùn)維非常簡(jiǎn)單?!?/p>
華為FusionCube for HANA一體機(jī)已經(jīng)在許多行業(yè)得到了應(yīng)用。以金融行業(yè)為例,F(xiàn)usionCube for HANA在包括銀行小微貸項(xiàng)目等在內(nèi)的新興業(yè)務(wù)中得到了成功應(yīng)用。華為內(nèi)部還成立了一支技術(shù)團(tuán)隊(duì),專門負(fù)責(zé)支持SAP HANA。
交付“三位一體”
華為進(jìn)軍IT領(lǐng)域后始終堅(jiān)持“被集成”的策略。因此在IT解決方案的推廣過程中,華為與集成商、分銷商一直保持緊密合作。華為FusionCube for HANA一體機(jī)就是通過富通集團(tuán)在中國(guó)市場(chǎng)上進(jìn)行銷售的。“華為、SAP與富通集團(tuán)基于FusionCube for HANA實(shí)現(xiàn)了三位一體的交付?!比沃均i表示。
盡管當(dāng)前很多企業(yè)都在積極采用大數(shù)據(jù)分析技術(shù)和解決方案來變革業(yè)務(wù)模式,提升企業(yè)的核心競(jìng)爭(zhēng)力,但是很多企業(yè)都對(duì)自身的大數(shù)據(jù)項(xiàng)目并不滿意。全球領(lǐng)先的基準(zhǔn)研究和咨詢機(jī)構(gòu)Ventana Research的研究@示,79%的企業(yè)用戶不具備運(yùn)用高級(jí)分析技術(shù)的必備技能。
姜欣介紹,今年Teradata通過《經(jīng)濟(jì)學(xué)人》雜志在全球所做的一個(gè)調(diào)研結(jié)果顯示,在大數(shù)據(jù)利用方面,企業(yè)主要存在以下三方面問題:第一,數(shù)據(jù)整合問題,57%的被訪企業(yè)認(rèn)為難以獲取重要的業(yè)務(wù)數(shù)據(jù);第二,數(shù)據(jù)應(yīng)用問題,42%的受訪企業(yè)認(rèn)為數(shù)據(jù)過于繁雜,應(yīng)用不夠友好;第三,數(shù)據(jù)治理問題,75%的受訪企業(yè)為因異構(gòu)數(shù)據(jù)而浪費(fèi)時(shí)間感到困擾。
“我們目前推出的解決方案和技術(shù),就是為了解決以上三方面問題?!苯澜榻B說,為此Teradata提出了五級(jí)轉(zhuǎn)型戰(zhàn)略:
其一,堅(jiān)定地走一體化數(shù)據(jù)分析平臺(tái)的道路,不斷完善一系列平臺(tái)產(chǎn)品,其中包括最近推出的Teradata IntelliFlex數(shù)據(jù)倉庫架構(gòu)和Teradata Aster大數(shù)據(jù)探索平臺(tái)
其二,全面向云轉(zhuǎn)型,支持私有云、公有云和托管云等多種部署方式,并在這種云生態(tài)下提供咨詢和開發(fā)部署服務(wù)。
其三,打造分析生態(tài)系統(tǒng),將統(tǒng)一數(shù)據(jù)架構(gòu)(UDA),以及Unity、QueryGrid和Listener等工具整合起來,形成一個(gè)大數(shù)據(jù)生態(tài),并在這個(gè)生態(tài)下提供咨詢和實(shí)施服務(wù)。
其四,從完全技術(shù)中立的角度為客戶提供大數(shù)據(jù)咨詢服務(wù),如大數(shù)據(jù)戰(zhàn)略規(guī)劃服務(wù)、敏捷開發(fā)咨詢服務(wù)、數(shù)據(jù)建模服務(wù)。
其五,堅(jiān)持客戶至上而非產(chǎn)品至上,用多元化的產(chǎn)品全面滿足客戶需求,幫助客戶挖據(jù)數(shù)據(jù)價(jià)值。
由此可見,Teradata在大數(shù)據(jù)領(lǐng)域,除了不斷完善產(chǎn)品和技術(shù)以外,還不斷強(qiáng)化咨詢服務(wù)能力。
推出無邊界分析功能
作為Teradata多年的老客戶,瑞典最大的工業(yè)企業(yè)集團(tuán)沃爾沃汽車公司從2006年開始建立數(shù)據(jù)分析平臺(tái)。一直以來,沃爾沃汽車公司面臨的一個(gè)問題,就是數(shù)據(jù)散布在超過30個(gè)系統(tǒng)中。公司的整合數(shù)據(jù)存儲(chǔ)庫和數(shù)據(jù)模型中,除了有客戶、經(jīng)銷商、車輛與車輛配置信息、質(zhì)保和故障診斷等數(shù)據(jù)外,還有很多外部數(shù)據(jù)。這些數(shù)據(jù)有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)。
沃爾沃汽車公司亟須一個(gè)彈性好、敏捷性高的平臺(tái)來處理所有這些數(shù)據(jù)。為此,沃爾沃汽車公司部署了Teradata統(tǒng)一數(shù)據(jù)架構(gòu),將所有需要處理的數(shù)據(jù)全部整合起來進(jìn)行處理,從而解決數(shù)據(jù)孤島和數(shù)據(jù)治理混亂問題。在部署了Teradata統(tǒng)一數(shù)據(jù)架構(gòu)后,沃爾沃汽車公司構(gòu)建了全球統(tǒng)一的敏捷的數(shù)據(jù)驅(qū)動(dòng)環(huán)境,從而可以借助可靠的數(shù)據(jù)分析結(jié)果降低運(yùn)營(yíng)成本,提高盈利能力和客戶滿意度;形成基于事實(shí)的決策機(jī)制和文化,使得公司更加開放和透明;有效支撐“數(shù)據(jù)創(chuàng)客”活動(dòng),員工和合作伙伴可以基于數(shù)據(jù)平臺(tái)開發(fā)數(shù)據(jù)產(chǎn)品。
沃爾沃汽車公司成功應(yīng)用Teradata統(tǒng)一數(shù)據(jù)架構(gòu)的案例,是Teradata新推出的無邊界分析功能的一個(gè)應(yīng)用典范。據(jù)悉,Teradata無邊界分析打破了過去在進(jìn)行數(shù)據(jù)分析時(shí)單一系統(tǒng)、單一技術(shù)分析的界限,突破時(shí)間、地點(diǎn),以及所需數(shù)據(jù)和平臺(tái)的限制,幫助企業(yè)高效完成數(shù)據(jù)分析工作。
Teradata無邊界分析功能通過最新版本的Teradata QueryGrid軟件和可以自動(dòng)協(xié)調(diào)多系統(tǒng)Teradata環(huán)境的Teradata Unity軟件來實(shí)現(xiàn)。其中,Teradata Unity軟件具有高可用性特點(diǎn)和工作負(fù)載分配功能,從而確保用戶在權(quán)限范圍內(nèi)可隨時(shí)訪問相關(guān)數(shù)據(jù)和分析。全新升級(jí)的Teradata Unity具有強(qiáng)大的跨系統(tǒng)功能,可進(jìn)一步消除分析環(huán)境界限。
電子專業(yè)制造服務(wù)公司偉創(chuàng)力公司數(shù)據(jù)與分析團(tuán)隊(duì)主管森迪爾(Sendil Thangavelu)認(rèn)為,采用多個(gè)分析引擎來分析來自多個(gè)數(shù)據(jù)存儲(chǔ)庫的數(shù)據(jù)以獲得更全面、可視化的分析結(jié)果,將成為企業(yè)強(qiáng)化競(jìng)爭(zhēng)優(yōu)勢(shì)的重要因素?!拔覀兊腡eradata數(shù)據(jù)管理環(huán)境已經(jīng)非常卓越,但我們一直還在尋找解決方案來提高我們的能力。Teradata的無邊界分析概念與我們的企業(yè)發(fā)展方向不謀而合?!鄙蠣栄a(bǔ)充說。
推出快速分析咨詢服務(wù)
姜欣告訴記者,2015年年底,Teradata總結(jié)出了在新形勢(shì)下具有較強(qiáng)競(jìng)爭(zhēng)力的新型企業(yè)――技術(shù)感知型企業(yè)。技術(shù)感知型企業(yè)應(yīng)具有敏捷平臺(tái)、行為分析、協(xié)同思維、自助應(yīng)用和自動(dòng)決策五大核心能力。
姜欣表示,技術(shù)感知型企業(yè)對(duì)內(nèi)能夠提供數(shù)據(jù)洞察能力,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)流程,提升運(yùn)營(yíng)的ROI;對(duì)外可以整合數(shù)據(jù)價(jià)值,創(chuàng)新數(shù)據(jù)盈利模式,實(shí)現(xiàn)信息運(yùn)營(yíng)。
但是,成為技術(shù)感知型企業(yè)并不容易。為了幫助客戶更加順利、快速地成為技術(shù)感知型企業(yè),Teradata還推出了Teradata RACE(快速分析咨詢服務(wù))和Teradata業(yè)務(wù)價(jià)值框架。據(jù)介紹,RACE是一套敏捷、技術(shù)中立的方法論,能夠幫助客戶在正式投資前了解分析解決方案的潛在業(yè)務(wù)價(jià)值。不僅如此,借助豐富的行業(yè)經(jīng)驗(yàn)和專業(yè)的數(shù)據(jù)分析技術(shù),Teradata還可以幫助客戶將項(xiàng)目實(shí)施所需時(shí)間從數(shù)月縮短至6~10周。
據(jù)悉,作為Teradata RACE服務(wù)的核心,Teradata業(yè)務(wù)價(jià)值框架是Teradata從數(shù)千次與客戶成功合作中積累的豐富經(jīng)驗(yàn)的結(jié)晶。該框架通過發(fā)現(xiàn)切實(shí)有用的分析解決方案,幫助客戶更快地從分析和數(shù)據(jù)技術(shù)投資中獲取回報(bào)。
值得一提的是,隨著物聯(lián)網(wǎng)傳感器數(shù)據(jù)等新型數(shù)據(jù)源的不斷出現(xiàn),新分析技術(shù)的不斷涌現(xiàn),用戶部署和應(yīng)用分析解決方案的難度越來越大。但依托適用Teradata業(yè)務(wù)價(jià)值框架詳盡的可視化信息,接受RACE服務(wù)的客戶可以在實(shí)施分析解決方案時(shí),掌握清晰的路線圖,了解該項(xiàng)目在何時(shí)、以怎樣的方式帶來投資回報(bào)。
姜欣介紹,RACE方法包含三個(gè)主要階段:
第一階段,溝通(Align)。Teradata的分析業(yè)務(wù)咨詢顧問以業(yè)務(wù)價(jià)值框架作為出發(fā)點(diǎn),幫助客戶發(fā)現(xiàn)最具潛在價(jià)值的業(yè)務(wù)案例,并對(duì)準(zhǔn)該業(yè)務(wù)案例開展工作,確認(rèn)支持該使用案例關(guān)鍵數(shù)據(jù)資產(chǎn)的可用性。
第二階段,創(chuàng)建(Create)。Teradata的數(shù)據(jù)科學(xué)家為選中的業(yè)務(wù)案例載入并準(zhǔn)備數(shù)據(jù),開發(fā)新分析模型或調(diào)整既有模型。本階段數(shù)據(jù)科學(xué)家會(huì)與業(yè)務(wù)發(fā)起人對(duì)方案進(jìn)行多次快速迭代,以確保分析結(jié)果能帶來預(yù)期業(yè)務(wù)效果。
第三階段,評(píng)估(Evaluate)。Teradata的分析業(yè)務(wù)咨詢顧問分析結(jié)果,評(píng)估部署分析使用案例的潛在投資回報(bào)率,并為客戶設(shè)計(jì)、部署方案。
收購(gòu)加速能力提升
在IT界,一直以來都不乏通過對(duì)具有先進(jìn)技術(shù)的公司的收購(gòu),來迅速提升本公司能力的案例,對(duì)于以往以PC等終端設(shè)備見長(zhǎng)的戴爾來說,要想轉(zhuǎn)型進(jìn)軍企業(yè)級(jí)市場(chǎng),收購(gòu)無疑是一條快速實(shí)現(xiàn)目標(biāo)的捷徑。從2008年開始,戴爾就將目光投向了在存儲(chǔ)、網(wǎng)絡(luò)、安全、軟件、服務(wù)等領(lǐng)域有特色的廠商,開始了有計(jì)劃、有步驟的收購(gòu)行動(dòng)。
至今,戴爾已經(jīng)收購(gòu)了20多家廠商,其中不少很成功的收購(gòu)為業(yè)界所津津樂道。例如對(duì)存儲(chǔ)廠商EqualLogic的收購(gòu),兩年時(shí)間就使其業(yè)績(jī)達(dá)到10億美元,而用戶數(shù)增加了8倍;2010年年底收購(gòu)的智能存儲(chǔ)廠商Compellent,使戴爾的存儲(chǔ)解決方案上了一個(gè)臺(tái)階,Compellent的“流動(dòng)數(shù)據(jù)”理念現(xiàn)在已經(jīng)成為戴爾存儲(chǔ)的設(shè)計(jì)理念;對(duì)咨詢服務(wù)廠商佩羅的收購(gòu)更是填補(bǔ)了戴爾企業(yè)級(jí)咨詢服務(wù)的空白,使戴爾的解決方案成為名副其實(shí)的“端到端”,并有效地帶動(dòng)了戴爾其他產(chǎn)品線的銷售。
正是這一次次的收購(gòu),使戴爾迅速轉(zhuǎn)型,業(yè)績(jī)不斷提升,在當(dāng)今云計(jì)算和大數(shù)據(jù)時(shí)代,也有了更多的話語權(quán)。戴爾全球企業(yè)解決方案事業(yè)部副總裁Cheryl Cook認(rèn)為,戴爾在大數(shù)據(jù)方面擁有創(chuàng)新性的解決方案,不僅可以為用戶節(jié)省大筆資金,同時(shí)可提供極高的價(jià)值。她認(rèn)為,大數(shù)據(jù)從開始到成熟分為5個(gè)階段,即從混亂、保留、優(yōu)化到簡(jiǎn)單分析、復(fù)雜分析。在這5個(gè)階段里,戴爾針對(duì)前3個(gè)階段,可提供大數(shù)據(jù)保留解決方案;而對(duì)于后兩個(gè)階段,戴爾則擁有大數(shù)據(jù)分析解決方案。Cheryl Cook認(rèn)為,戴爾創(chuàng)新性的解決方案可處理成熟度模型范圍內(nèi)的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化內(nèi)容,她特別說道,戴爾將利用Hadoop,并與從事Hadoop開發(fā)的Cloudera公司合作,為用戶提供大數(shù)據(jù)分析解決方案;而在大數(shù)據(jù)保留解決方案中,戴爾將充分發(fā)揮在存儲(chǔ)方面的優(yōu)勢(shì),通過存儲(chǔ)虛擬化和整合、應(yīng)用程序優(yōu)化、數(shù)據(jù)保護(hù)、災(zāi)難恢復(fù)以及數(shù)據(jù)保留和管理等技術(shù),為“流動(dòng)的數(shù)據(jù)”提供存儲(chǔ)和保護(hù)。
深諳用戶需求
在戴爾2012年高層客戶峰會(huì)上,戴爾服務(wù)部首席創(chuàng)新官James Stikeleather就“IT的未來”進(jìn)行了演講,他認(rèn)為,企業(yè)IT未來將面臨著來自IT價(jià)值、所有權(quán)和角色等方面的五大根本性變化,這些變化包括:信息超越流程、IT嵌入在業(yè)務(wù)服務(wù)之中、外部化的服務(wù)交付、企業(yè)合作伙伴的責(zé)任更大、減弱的獨(dú)立IT角色。
作為IT解決方案供應(yīng)商,戴爾同樣也是一家企業(yè),James Stikeleather認(rèn)為,在當(dāng)今這個(gè)轉(zhuǎn)型的時(shí)代,戴爾已經(jīng)成功地轉(zhuǎn)型成為高效企業(yè),它將戰(zhàn)略性支出從2008年占IT預(yù)算的20%提高到今天的52%。這期間,戴爾的IT經(jīng)過了標(biāo)準(zhǔn)化、簡(jiǎn)化、自動(dòng)化,并最終實(shí)現(xiàn)云,比如將97%的系統(tǒng)遷移到x86平臺(tái);大力推進(jìn)虛擬化,從而減少了6000臺(tái)服務(wù)器;僅用一個(gè)控制臺(tái)就可管理13萬臺(tái)服務(wù)器和客戶端;運(yùn)用云平臺(tái)聆聽客戶的聲音、信息和進(jìn)行交互。這些舉措使戴爾更加了解用戶,更有針對(duì)性地為用戶提供適合的解決方案,真正解決用戶的問題。
產(chǎn)品與方案:
集聚業(yè)界最強(qiáng)資源
正如很多業(yè)內(nèi)專家所說的那樣,存儲(chǔ)和安全是大數(shù)據(jù)迫切需要考慮的首要問題。
從海量數(shù)據(jù)產(chǎn)生的角度,以前數(shù)據(jù)量都是以GB或者TB記的量級(jí)。但如今,情況發(fā)生了改變,過去可能多年才能累計(jì)產(chǎn)生的數(shù)據(jù)量,現(xiàn)在可能只用很短時(shí)間就會(huì)積累起來,一些單位每年產(chǎn)生的數(shù)據(jù)量就可能達(dá)到幾十TB,甚至不久的將來就會(huì)升級(jí)到PB級(jí)的數(shù)據(jù)量,將會(huì)占用越來越多的存儲(chǔ)空間。
在解決海量數(shù)據(jù)的存儲(chǔ)問題的同時(shí),企業(yè)還必須要解決數(shù)據(jù)的安全性和可靠性等問題。所謂數(shù)據(jù)的安全性是指數(shù)據(jù)在任何情況下的可訪問性,不會(huì)因?yàn)槿藶榛蜃匀坏囊蛩貙?dǎo)致數(shù)據(jù)不可訪問;數(shù)據(jù)的可靠性意味著即便是在極端情況下,數(shù)據(jù)發(fā)生損壞或丟失,仍有數(shù)據(jù)可被恢復(fù)或直接訪問。
顯然,解決這些問題必須要靠質(zhì)量過硬的產(chǎn)品與解決方案。為此,長(zhǎng)虹佳華近年來持續(xù)在云計(jì)算安全和大數(shù)據(jù)方面進(jìn)行探索和投入,并且取得了很大成果:
在產(chǎn)品方面,長(zhǎng)虹佳華以存儲(chǔ)和服務(wù)器類產(chǎn)品為主,涵蓋HDS、博科、昆騰、EMC、IBM等十余家全球知名、領(lǐng)先的數(shù)據(jù)存儲(chǔ)業(yè)務(wù)服務(wù)商;在解決方案方面,長(zhǎng)虹佳華幫助商為多種特定的行業(yè)用戶提供行業(yè)解決方案,并且可以針對(duì)用戶的不同需求提供定制化的解決方案,從而更加凸顯了長(zhǎng)虹佳華的綜合實(shí)力;
在服務(wù)方面,長(zhǎng)虹佳華并不僅僅重視售后服務(wù),而是為用戶提供包括培訓(xùn)、環(huán)境測(cè)試、技術(shù)支持在內(nèi)的售前、售中、售后的一站式服務(wù)。以存儲(chǔ)產(chǎn)品為主導(dǎo)構(gòu)建增值業(yè)務(wù)群,如今已成為長(zhǎng)虹佳華的既定戰(zhàn)略。
近幾年來,長(zhǎng)虹佳華在原有合作伙伴的基礎(chǔ)上,進(jìn)一步與賽門鐵克、Radware、博世、邁普等國(guó)內(nèi)外知名品牌緊密合作,集聚了強(qiáng)大的產(chǎn)品與解決方案資源,整體解決方案能力和產(chǎn)品組合能力大大增強(qiáng),進(jìn)一步提升了長(zhǎng)虹佳華“以數(shù)據(jù)為核心”的增值分銷業(yè)務(wù)的服務(wù)能力。
CDSClub與云計(jì)算體驗(yàn)
暨培訓(xùn)中心:為數(shù)據(jù)安家
CDSClub與云計(jì)算體驗(yàn)暨培訓(xùn)中心,一直是長(zhǎng)虹佳華享譽(yù)存儲(chǔ)分銷行業(yè)的代表之作。CDSClub一方面從技術(shù)整合出發(fā),另一方面從渠道伙伴支持出發(fā),兩者相結(jié)合,就為大數(shù)據(jù)的應(yīng)用與銷售安下了最好的“家”。
CDSClub是從長(zhǎng)虹佳華成功運(yùn)作數(shù)年的SANClub升級(jí)而來,其主要功能是給特定的行業(yè)提供定制化的數(shù)據(jù)方案。升級(jí)后的CDSClub并不是僅僅局限于SAN架構(gòu)一種主流技術(shù),而是實(shí)現(xiàn)了跨平臺(tái)的技術(shù)整合,使最終的數(shù)據(jù)方案更貼近實(shí)際應(yīng)用,服務(wù)更統(tǒng)一,并且更有針對(duì)性。同時(shí),方案的適用性也得到了極大提高。
目前處于國(guó)內(nèi)領(lǐng)先地位的長(zhǎng)虹佳華云計(jì)算體驗(yàn)暨培訓(xùn)中心,為渠道合作伙伴的數(shù)據(jù)方案、系統(tǒng)集成提供了演示、測(cè)試的廣闊平臺(tái),對(duì)于渠道合作伙伴需要的不同產(chǎn)品組合應(yīng)用測(cè)試、各類定制方案演示等都可輕松實(shí)現(xiàn),是對(duì)渠道技術(shù)需求的極大補(bǔ)充支持。同時(shí),該中心還充當(dāng)起長(zhǎng)虹佳華對(duì)合作伙伴及行業(yè)客戶進(jìn)行技術(shù)培訓(xùn)、資質(zhì)認(rèn)證以及設(shè)備服務(wù)的支持平臺(tái)角色。
大數(shù)據(jù)浪潮正洶涌來襲,與互聯(lián)網(wǎng)領(lǐng)域其他變革一樣,這絕不僅僅是一場(chǎng)信息技術(shù)領(lǐng)域的革命,更是在全球范圍內(nèi)加速企業(yè)創(chuàng)新、引領(lǐng)社會(huì)變革的利器?,F(xiàn)代管理學(xué)之父德魯克有言:預(yù)測(cè)未來最好的方法,就是去創(chuàng)造未來。瞄準(zhǔn)大數(shù)據(jù)的存儲(chǔ)業(yè)務(wù),長(zhǎng)虹佳華正在向最強(qiáng)營(yíng)銷服務(wù)提供商邁進(jìn)……
分銷業(yè)務(wù)業(yè)績(jī)驕人
大數(shù)據(jù)主要包括大交易數(shù)據(jù)、大交互數(shù)據(jù)和大數(shù)據(jù)處理。數(shù)據(jù)集成的功能是收集數(shù)據(jù)、探查數(shù)據(jù)和集中管理數(shù)據(jù),從而進(jìn)一步提高數(shù)據(jù)的質(zhì)量。Informatica的數(shù)據(jù)集成軟件可以辨別哪些數(shù)據(jù)是合規(guī)的,并提取出來,實(shí)施統(tǒng)一管理和統(tǒng)一復(fù)制。Informatica公司高級(jí)副總裁兼首席信息官托尼·楊(Tony Young)表示,針對(duì)Hadoop大數(shù)據(jù)處理平臺(tái),Informatica的數(shù)據(jù)集成軟件主要負(fù)責(zé)做好以下幾件事:解析和準(zhǔn)備數(shù)據(jù),探查和發(fā)現(xiàn)數(shù)據(jù),轉(zhuǎn)換和清洗數(shù)據(jù),監(jiān)控Hadoop平臺(tái)中的數(shù)據(jù)。隨著云計(jì)算應(yīng)用的逐漸普及,數(shù)據(jù)碎片日益增加,而移動(dòng)計(jì)算、社交計(jì)算的快速發(fā)展也增加了數(shù)據(jù)訪問和管理的復(fù)雜性。在這種情況下,保證數(shù)據(jù)的合規(guī)性、一致性和準(zhǔn)確性就顯得尤為重要。數(shù)據(jù)集成不僅可以輕松實(shí)現(xiàn)上述目標(biāo),而且可以在數(shù)據(jù)整個(gè)生命周期的管理中起到監(jiān)督和調(diào)整的作用。
在數(shù)據(jù)管理產(chǎn)品趨向融合的今天,數(shù)據(jù)集成軟件會(huì)不會(huì)也被集成到一些綜合性的管理解決方案中呢?
托尼·楊表示:“Informatica之所以能夠保持快速成長(zhǎng),一個(gè)關(guān)鍵的因素就是始終保持中立的地位。我們的數(shù)據(jù)集成軟件可以與其他所有應(yīng)用和管理軟件平臺(tái)相集成,比如微軟、SAP等廠商的產(chǎn)品?!?/p>
大數(shù)據(jù)促進(jìn)業(yè)務(wù)增長(zhǎng)
“數(shù)據(jù)分析是今后企業(yè)在競(jìng)爭(zhēng)中保持優(yōu)勢(shì)的一個(gè)主要手段。如果你現(xiàn)在不認(rèn)真對(duì)待大數(shù)據(jù),那么競(jìng)爭(zhēng)對(duì)手就有可能超過你,并取代你?!蓖心帷畋硎荆按髷?shù)據(jù)與SOA(面向服務(wù)的體系結(jié)構(gòu))不同。SOA不能直接給企業(yè)帶來商業(yè)價(jià)值,而大數(shù)據(jù)與企業(yè)的業(yè)務(wù)績(jī)效直接相關(guān)。企業(yè)的CIO必須重視大數(shù)據(jù)的處理與應(yīng)用。”
一項(xiàng)由惠普主導(dǎo)的調(diào)查表明,亞太地區(qū)60%的受訪企業(yè)表示今年將把至少10%的IT創(chuàng)新預(yù)算用于大數(shù)據(jù),而在中國(guó)這一數(shù)字為56%。三分之一的亞太地區(qū)和中國(guó)受訪企業(yè)還堅(jiān)信,大數(shù)據(jù)是其最大的差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。然而,調(diào)查卻發(fā)現(xiàn),近一半的亞太地區(qū)受訪企業(yè)所實(shí)施的大數(shù)據(jù)計(jì)劃都失敗了,而在中國(guó),這一數(shù)字為55%。很顯然,大數(shù)據(jù)中蘊(yùn)含著巨大的商業(yè)價(jià)值,然而駕馭大數(shù)據(jù)不是一件容易的事,并不是所有企業(yè)都具備像Google一樣“玩轉(zhuǎn)”數(shù)據(jù)的基因與技術(shù)儲(chǔ)備。許多行業(yè)除了需要做好大數(shù)據(jù)思維上的轉(zhuǎn)變之外,還需要有不同工具來進(jìn)行大數(shù)據(jù)的處理與分析。
通過對(duì)收購(gòu)的Vertica、Autonomy、ArcSight等產(chǎn)品進(jìn)行優(yōu)化整合,惠普在融入Hadoop等大數(shù)據(jù)技術(shù)的基礎(chǔ)上打造了大數(shù)據(jù)分析平臺(tái)HAVEn。“HAVEn平臺(tái)提供了大量的應(yīng)用開發(fā)接口(API),惠普希望通過HAVEn與合作伙伴共同打造一套完整的大數(shù)據(jù)分析生態(tài)系統(tǒng),讓更多應(yīng)用解決方案落地到行業(yè)。它可以充分利用惠普的分析軟件、硬件和服務(wù),創(chuàng)建新一代為大數(shù)據(jù)準(zhǔn)備的分析應(yīng)用和解決方案?!?惠普公司軟件集團(tuán)大中華區(qū)總經(jīng)理于志偉表示,“同時(shí),HAVEn平臺(tái)還支持各種主流硬件平臺(tái),為客戶提供最佳的投資回報(bào)(Return On Investment)與信息回報(bào)(Return On Information)。”
不只是軟件平臺(tái)