衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數據計算框架簡介

RG15206629988 ? 來源:行業學習與研究 ? 2023-03-20 11:46 ? 次閱讀

一、Hadoop框架

Hadoop是目前世界上應用最廣泛的大數據工具。Hadoop具有高容錯率,且其硬件價格低,可以使用普通PC服務器(個人理解:普通PC服務器的具體形式包括個人計算機等)構成大數據集群。

Hadoop的Map和Reduce函數(Map和Reduce函數是大數據主要編程模型)的計算模式簡潔,且開發人員可以通過多種編程語言編寫Map和Reduce函數。Hadoop的生態圈(個人理解:此處的生態圈指可以使用Hadoop的開發工具集合)包含大量算法和組件。

Hadoop的數據吞吐量超過其他大數據計算框架,但速度稍慢于其他大數據計算框架。

二、Storm框架

Storm框架采用的是流計算框架(根據網絡資料理解:流計算框架可處理實時且持續進入流計算框架數據的計算),也可被稱為實時大數據處理框架,在數據處理延時(根據網絡資料理解:數據處理延遲的原因是存儲或檢索數據包需要時間)方面具有較大優勢。

但Storm框架只能進行數據處理,不能進行數據存儲,因此,Storm框架需借助Hadoop框架的HDFS(分布式文件系統)存儲數據。

Storm框架由Twitter(推特)開發,為開源框架,并托管于GitHub(根據百度百科:GitHub是一個面向開源及私有軟件項目的托管平臺),Storm框架可被免費使用。Storm框架支持的編程語言包括:Java、Ruby、Python

三、Spark框架

Spark框架包含實時流處理工具,Spark框架沒有存儲數據功能。Spark框架可以與Hadoop框架集成,代替Hadoop框架的Map和Reduce函數;也可以將Spark框架單獨部署集群(根據網絡資料理解:部署集群的含義是在集群內的所有電腦或服務器中安裝同一應用),但需要借助HDFS等分布式存儲系統存儲數據。

Spark框架是基于內存的框架,因此,Spark框架的運算速度快,其速度約為Hadoop框架的100倍。

四、Flink框架

(1)與Spark框架相同,Flink框架也是基于內存的實時計算框架。

(2)Flink框架的數據處理速度快于Spark框架的數據處理速度。Flink框架支持毫秒級的流計算,Spark框架支持秒級的流計算。

(3)相比于Spark框架,Flink框架與Hadoop框架具有更好的兼容性。

(4)Flink框架支持API(根據百度百科理解:API一般指應用程序編程接口,可將此處接口理解為服務的傳遞者。API可使開發人員訪問其他系統對外提供的功能接口或服務,且開發人員無需訪問該功能接口或服務的源代碼或理解該功能接口或服務的內部工作機制細節)接口數量與Spark框架支持API接口數量相近(此句由網絡資料總結),但Flink框架對SQL的支持相較于Spark框架對SQL的支持較差。

f5c86d02-c3f1-11ed-bfe3-dac502259ad0.png

圖片來源:網絡資料

(5)因為Flink框架較新,使用Flink框架的開發人員較少,所以Flink框架的社區活躍度低于Spark框架,即有關Spark框架的問題更容易得到解答。

五、Yarn架構

Yarn架構屬于Hadoop2.0的分支。如圖一所示,Yarn架構處于HDFS和MapReduce之間。

f5e40e04-c3f1-11ed-bfe3-dac502259ad0.png

圖一,圖片來源:學堂在線《大數據導論》

Yarn架構主要由ResourceManager、NodeManager、ApplicationMaster(根據網絡資料:ApplicationMaster負責與ResourceManager協商資源,并與NodeManager協同來執行和監控Container) 、Container(根據網絡資料:Container可被理解為單個節點RAM、CPU、磁盤的集合)組件構成。

Yarn架構的結構是master/slave結構(master的中文含義是主人,slave的中文含義是奴隸,master/slave結構即為主從結構)。如圖二所示,ResourceManager是master,即主節點;NodeManager是slave,即從節點。

f5f66da6-c3f1-11ed-bfe3-dac502259ad0.png

圖二,圖片來源:學堂在線《大數據導論》






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • JAVA
    +關注

    關注

    19

    文章

    2975

    瀏覽量

    105160
  • PC服務器
    +關注

    關注

    0

    文章

    10

    瀏覽量

    7593
  • 編程語言
    +關注

    關注

    10

    文章

    1950

    瀏覽量

    34989
  • Hadoop
    +關注

    關注

    1

    文章

    90

    瀏覽量

    16042
  • HDFS
    +關注

    關注

    1

    文章

    30

    瀏覽量

    9641

原文標題:大數據相關介紹(21)——大數據計算框架簡介

文章出處:【微信號:行業學習與研究,微信公眾號:行業學習與研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    [5.1.1]--5-1大數據計算框架簡介

    大數據
    jf_75936199
    發布于 :2023年03月14日 01:40:28

    大數據計算框架簡介(1)#大數據分析

    大數據分析
    學習硬聲知識
    發布于 :2023年07月13日 18:14:55

    大數據計算框架簡介(2)#大數據分析

    大數據分析
    學習硬聲知識
    發布于 :2023年07月13日 18:15:35

    計算大數據處理技術交流

    計算、大數據處理技術交流圖形圖像是數據處理量最大的版塊之一,也是當今云計算的重要課題之一,圖形圖像處理大會給大家帶來諸多名家方案,探究大數據
    發表于 09-16 14:18

    【GoKit申請】基于大數據和云計算的環境監測系統

    申請理由:最近剛剛申請了一款物聯網的板子,而且項目的基本環境已經搭建完畢了,目前云計算大數據都是潮流,所以現在準備研究下云服務,因為找不到好的支持平臺,也就有點進度很慢了,正好這里看到了這個板子
    發表于 11-02 10:47

    大數據運用的技術

    大數據開發的重要框架,其核心是HDFS和MapReduce,HDFS為海量的數據提供了存儲,MapReduce為海量的數據提供了計算,因此
    發表于 04-08 16:50

    大數據數據類型

    大數據不僅僅是一個數據,它是大數據集的集合,不能使用傳統的計算技術來處理,宏觀上來講,它不僅包括需處理的數據,還包括各種工具、技術和
    發表于 05-11 15:57

    2019國際大數據產業博覽會跟大數據一起賽跑大數據應用云計算電子商務

    增長2.3%。國家副***在全國人大二次會議上作***工作報告時說,要設立新興產業創業創新平臺,在新一代移動通信、大數據、云計算、新能源等方面趕超先進,引領未來產業發展。這是“大數據”首次進入
    發表于 10-10 13:55

    DKHadoop大數據開發框架的構成模塊

    ,必然要回歸到大數據開發所使用的框架! 國內的大數據開發起步較晚于國外,所有關于大數據大開發的各種標準和規則都是采用國外的那一套。國內做大數據
    發表于 10-19 15:12

    DKhadoop大數據平臺基礎框架方案概述

    也不是特別長。僅以我熟悉的DKhadoop為例給大家分享一些小知識,往對初學者有點小幫助就可以了。大數據平臺基礎框架是很多初學者必然要掌握的內容,大數據太過抽象,有時候寫分享的時候難免感覺寫的很多困難
    發表于 10-31 13:58

    大數據應用開發如何入門需要知道這些

    `前幾天和三個學計算機專業的學生聊天時聊到了大數據開發方面的話題,他們三個人中,有兩個已經進入企業開始工作,另外一個還是大二學生,但已經開設了自己的工作室。他們都是從事程序開發方面工作的。大數據開發
    發表于 11-26 14:49

    大數據計算服務MaxCompute的使用教程

    阿里云大數據計算服務MaxCompute使用教程
    發表于 04-30 07:57

    大數據與云計算介紹

    大數據與云計算相關技術資料,值得擁有大數據與云計算
    發表于 03-24 16:54 ?0次下載

    基于大數據的流式計算

    流式計算大數據的一種重要計算模式,大數據流式計算已成為研究熱點。任務管理是大數據流式
    發表于 11-22 17:34 ?1次下載
    基于<b class='flag-5'>大數據</b>的流式<b class='flag-5'>計算</b>

    計算環境中流行的大數據框架介紹

    在本文中,我們將介紹云計算環境中流行的大數據框架,并確定這些大數據框架的某些屬性,并探討與之相關的一些最大障礙和問題。本文將按資源管理
    的頭像 發表于 01-09 11:35 ?4118次閱讀
    云<b class='flag-5'>計算</b>環境中流行的<b class='flag-5'>大數據</b><b class='flag-5'>框架</b>介紹
    大发888娱乐场金沙| 澳门百家乐官网介绍| 博彩业| 大玩家百家乐的玩法技巧和规则| 澳门百家乐现场视频| 百家乐官网娱乐求解答| 百家乐官网也能赢钱么| 河北区| 帝豪百家乐官网利来| 缅甸百家乐官网论坛| 丰禾国际娱乐| 大发888游戏代冲省钱技巧| 百家乐赌场娱乐网规则| 宝博百家乐娱乐城| 百家乐防伪筹码套装| 百家乐现场投注平台| 百家乐高手和勒威| 百家乐最新套路| 百家乐官网出千原理| 綦江县| 百家乐官网注码管理| 滦南县| 百家乐官网怎么会赢| 繁峙县| 真人百家乐官网娱乐场| 百家乐官网云顶| 百家乐官网奥| 金域百家乐官网的玩法技巧和规则 | 真人百家乐破解软件下载| 百家乐官网玩法说| 百家乐比赛技巧| 百家乐高档筹码| 欢乐谷百家乐的玩法技巧和规则| 大佬百家乐娱乐城| 大发888娱乐官方下载| 赌球记| 六合彩香港| 大发| 百家乐官网赌场占多大概率| 可信百家乐官网的玩法技巧和规则 | 奔驰娱乐城开户|