亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区
Chinaunix
標(biāo)題:
hadoop與storm的一點(diǎn)區(qū)別
[打印本頁(yè)]
作者:
wang290
時(shí)間:
2013-05-20 15:14
標(biāo)題:
hadoop與storm的一點(diǎn)區(qū)別
hadoop是實(shí)現(xiàn)了mapreduce的思想,將數(shù)據(jù)切片計(jì)算來(lái)處理大量的離線數(shù)據(jù)數(shù)據(jù)。hadoop處理的數(shù)據(jù)必須是已經(jīng)存放在hdfs上或者類(lèi)似hbase的數(shù)據(jù)庫(kù)中,所以hadoop實(shí)現(xiàn)的時(shí)候是通過(guò)移動(dòng)計(jì)算到這些存放數(shù)據(jù)的機(jī)器上來(lái)提高效率
而storm不同,storm是一個(gè)流計(jì)算框架,處理的數(shù)據(jù)是實(shí)時(shí)消息隊(duì)列中的,所以需要我們寫(xiě)好一個(gè)topology邏輯放在那,接收進(jìn)來(lái)的數(shù)據(jù)來(lái)處理,所以是通過(guò)移動(dòng)數(shù)據(jù)平均分配到機(jī)器資源來(lái)獲得高效率。
總的來(lái)說(shuō)
hadoop的優(yōu)點(diǎn)是處理數(shù)據(jù)量大(瓶頸是硬盤(pán)和namenode,網(wǎng)絡(luò)等),分析靈活,可以通過(guò)實(shí)現(xiàn)dsl,mdx等拼接hadoop命令或者直接使用hive(超爛。。),pig等來(lái)靈活分析數(shù)據(jù)。適應(yīng)對(duì)大量維度進(jìn)行組合分析
ps:相較與hive,pig建議自己實(shí)現(xiàn)mdx,即靈活又高效
缺點(diǎn)就是慢:每次執(zhí)行前要分發(fā)jar包,hadoop每次map數(shù)據(jù)超出闕值后會(huì)將數(shù)據(jù)寫(xiě)入本地文件系統(tǒng),然后在reduce的時(shí)候再讀進(jìn)來(lái)
storm的優(yōu)點(diǎn)是全內(nèi)存計(jì)算,因?yàn)閮?nèi)存尋址速度是硬盤(pán)的百萬(wàn)倍以上,所以storm的速度相比較hadoop非常快(瓶頸是內(nèi)存,cpu)
缺點(diǎn)就是不夠靈活:必須要先寫(xiě)好topology結(jié)構(gòu)來(lái)等數(shù)據(jù)進(jìn)來(lái)分析,如果我們需要對(duì)幾百個(gè)維度進(jìn)行組合分析,那么。。。
另外推薦storm的DRPC實(shí)在太有用了,以至于這個(gè)本來(lái)要分理出來(lái)的項(xiàng)目,被并入storm^^
本文由larrylgq編寫(xiě),轉(zhuǎn)載請(qǐng)注明出處:
http://blog.csdn.net/larrylgq/article/details/7326058
作者:呂桂強(qiáng)
郵箱:
larry.lv.word@gmail.com
作者:
wenhq
時(shí)間:
2013-05-20 16:05
不錯(cuò),學(xué)習(xí)了。謝謝LZ。!
作者:
wang290
時(shí)間:
2013-05-20 16:38
wenhq 發(fā)表于 2013-05-20 16:05
不錯(cuò),學(xué)習(xí)了。謝謝LZ!!
客氣了,在csdn看到的,剛好游泳就轉(zhuǎn)過(guò)來(lái)了
作者:
wenhq
時(shí)間:
2013-05-20 16:49
本帖最后由 wenhq 于 2013-05-20 16:50 編輯
接收進(jìn)來(lái)的數(shù)據(jù)來(lái)處理,所以是通過(guò)移動(dòng)數(shù)據(jù)平均分配到機(jī)器資源來(lái)獲得高效率。
如何實(shí)現(xiàn)?
其實(shí)我比較疑惑這個(gè)。
歡迎光臨 Chinaunix (http://www.72891.cn/)
Powered by Discuz! X3.2