衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

windows下虛擬機配置spark集群最強攻略!

電子工程師 ? 來源:lq ? 2019-01-29 10:58 ? 次閱讀

首先需要在windows上安裝vmware和ubuntu虛擬機,這里就不多說了。

vmware下載地址:直接百度搜索,使用百度提供的鏈接下載,這里附上一個破解碼

5A02H-AU243-TZJ49-GTC7K-3C61N

ubuntu下載地址:http://cdimage.ubuntu.com/daily-live/current/

一路安裝下去,我一共裝了4臺虛擬機,三臺用于構建集群,一臺用于爬蟲,如圖所示:

這里,我們以slave2為例來說明一下虛擬機的網絡配置:

首先,將虛擬機的網絡設置設置為自定義,選擇VMnet8:

隨后,我們點擊VMWARE上的編輯-虛擬網絡編輯-右下角的更改設置,應該有三個連接方式,這里我們把其他兩個移除,只剩下VMnet8:

隨后,點擊NAT設置,我們可以發現網關是192.168.75.2

接下來,我們要設置虛擬機的ip:點擊右上角的edit connectinos,設置Ipv4,如下圖所示:

隨后修改兩個文件:

修改interfaces文件

命令:sudo vim /etc/network/interfaces ( 如果沒有vim命令,使用sudo apt-get install vim進行安裝):

修改resolv.conf文件

命令:sudo vim /etc/resolv.conf:

接下來重啟我們的網絡就可以啦:

命令:sudo /etc/init.d/networking restart(如果啟動失敗,重啟虛擬機即可)

查看我們的ip,使用ifconfig命令,如果沒有安裝(使用sudo apt install net-tools 進行安裝):

下載xshell,百度搜索xshell,使用百度提供的下載地址即可。

要想使用xshell的ssh方式訪問虛擬機,首先要在虛擬機上安裝ssh服務

使用命令:sudo apt-get install openssh-server

隨后啟動ssh服務:sudo /etc/init.d ssh start

再次點擊VMWARE上的編輯-虛擬網絡編輯-右下角的更改設置,設置端口轉發:

隨后打開xshell,新建連接:

設置用戶名和密碼:

隨后點擊連接即可,發現連接成功!

這里以修改主節點主機名稱為例,其他節點類似。

使用命令 : sudo vim /etc/hostname 查看當前主機名,并修改為master:

重啟之后生效:

兩個從節點的主機依次修改為slave1,slave2

接下來,將主節點和兩個從節點的ip和主機名添加到hosts文件中,使用命令

sudo vim /etc/hosts

修改的結果為:

兩個從節點的hosts文件修改為同樣的結果,此時發現各虛擬機之間可以ping通。

接下來,需要讓主節點可以免驗證的登錄到從節點,從而在進行任務調度時可以暢通無阻。

首先要在各個節點上生成公鑰和私鑰文件,這里以slave1節點進行講解,其他節點操作方式完全相同。

我們首先要開啟ssh服務,使用命令:sudo /etc/init.d/ssh start

隨后使用如下命令生成公鑰和私鑰文件:

ssh-keygen -t rsa -P ""

在所有節點上生成秘鑰文件之后,我們需要將從節點的公鑰傳輸給主節點,使用命令:

cd ~/.ssh

scp id_rsa.pub sxw@master:~/.ssh/id_rsa.pub.slave1

隨后,在主節點下,將所有的公鑰信息拷貝到authorized_keys文件下:使用命令:

cd ~/.ssh

cat id_rsa.pub >> authorized_keys

cat id_rsa.pub.slave1 >> authorized_keys

cat id_rsa.pub.slave2 >> authorized_keys

接下來將authorized_keys文件復制到slave1和slave2節點目錄下:

scp authorized_keys sxw@slave1:~/.ssh/authorized_keys

scp authorized_keys sxw@slave2:~/.ssh/authorized_keys

接下來我們驗證是否可以免密碼登錄:使用命令

ssh slave1

登陸成功,我們可以使用exit命令退出登錄

這里我們可以直接使用linux的命令下載jdk,當然也可以在本地下載之后傳輸到虛擬機中,這里我采用的是后者,因為我感覺在主機上下載會比較快一些。到java官網中下載最新的jdk文件即可。

使用由于剛才我們配置了端口轉發,因此我們可以使用winscp進行文件傳輸:

傳輸文件到/home/sxw/Documents路徑下,直接將文件進行拖拽即可:

隨后,在該路徑下,使用如下命令進行解壓:

tar -zxvf 文件名

重命名jdk文件夾為jdk

隨后修改配置文件:

sudo vim /etc/profile

添加如下三行:export JAVA_HOME=/home/sxw/Documents/jdk

exportCLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH

exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

使用source命令使修改生效,同時查看是否安裝成功

可以使用命令下載scala,不過我們仍然選擇在本地下載scala:下載地址:http://www.scala-lang.org/download/2.11.7.html

通過winscp傳入各虛擬機里,并使用如下命令進行解壓:

tar -zxvf 文件名

重命名文件:

修改配置文件,增加以下兩行,并用source命令使修改生效:

檢查是否安裝成功:

可以看到scala已經安裝成功了!

我們首先在主節點上配置好hadoop的文件,隨后使用scp命令傳輸到從節點上即可。

同樣,我們在hadoop官網下載hadoop文件,通過winscp傳入主節點,使用tar命令進行解壓,并修改文件夾名為hadoop,這些這里暫且略過。

修改環境變量(所有節點都需要修改)并使用source命令使其生效:

接下來修改hadoop的配置文件:

(1)$HADOOP_HOME/etc/hadoop/hadoop-env.sh

修改JAVA_HOME 如下:

export JAVA_HOME=/home/sxw/Documents/jdk

(2)$HADOOP_HOME/etc/hadoop/slaves

修改salves里添加兩個從節點的名稱

slave1

slave2

(3)$HADOOP_HOME/etc/hadoop/core-site.xml

(4)$HADOOP_HOME/etc/hadoop/hdfs-site.xml

(5)$HADOOP_HOME/etc/hadoop/mapred-site.xml

首先使用如下命令生成mapred-site.xml文件:cp mapred-site.xml.template mapred-site.xml

隨后進行修改:

(6)$HADOOP_HOME/etc/hadoop/yarn-site.xml

至此,hadoop的配置文件就修改完了,我們用scp命令將修改好的hadoop文件傳入到子節點即可

我們首先在主節點上配置好spark的文件,隨后使用scp命令傳輸到從節點上即可。

同樣在spark官網下載最新的spark文件,并使用winscp傳入虛擬機,使用tar命令進行解壓,并重命名文件夾為spark。

添加spark到環境變量并使其生效:

接下來修改spark的配置文件:

(1)$SPARK_HOME/conf/spark-env.sh

首先使用如下命令生成spark-env.sh文件:

cpspark-env.sh.template spark-env.sh

隨后進行修改:

(2)$SPARK_HOME/conf/slaves

首先使用如下命令生成slaves文件:

cpslaves.template slaves

隨后進行修改:

至此,spark的配置文件就修改完了,我們用scp命令將修改好的spark文件傳入到子節點即可,不要忘記修改子節點的環境變量

首先我們編寫一個啟動腳本:

可以看到,hadoop的啟動需要兩個命令,分別啟動dfs和yarn,傳統的start-all.sh已經被棄用。而spark的啟動只需要一個命令。

啟動的結果如下圖所示:

隨后我們再編寫一個關閉集群的腳本:

我們在/home/sxw/Documents下建立一個wordcount.txt文件

文件內容如下圖:

到hadoop的bin路徑下執行如下三條命令:

hadoopfs-mkdir-p/Hadoop/Inputhadoopfs-putwordcount.txt/Hadoop/Inputhadoopjar/home/sxw/Documents/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jarwordcount/Hadoop/Input/Hadoop/Output

可以看到我們的hadoop再進行運算了:

使用如下命令查看運算結果,發現我們的期望的結果正確輸出:

hadoop fs -cat/Hadoop/Output/*

hadoop配置成功!

我們直接利用spark-shell 進行測試,編寫幾條簡單額scala語句:

到spark的bin路徑下執行./spark-shell命令進入scala的交互模式,并輸入如下幾條scala語句:

valfile=sc.textFile("hdfs://master:9000/Hadoop/Input/wordcount.txt")valrdd=file.flatMap(line=>line.split("")).map(word=>(word,1)).reduceByKey(_+_)rdd.collect()rdd.foreach(println)

可以看到,我們的spark集群成功搭建!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    87

    文章

    11345

    瀏覽量

    210385
  • 虛擬機
    +關注

    關注

    1

    文章

    937

    瀏覽量

    28426

原文標題:windows下虛擬機配置spark集群最強攻略!

文章出處:【微信號:atleadai,微信公眾號:LeadAI OpenLab】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Anaconda之tensorflow:深度學習之Anaconda安裝tensorflow正確運行之史上最強攻略

    Anaconda之tensorflow:深度學習之Anaconda安裝tensorflow正確運行之史上最強攻略
    發表于 12-21 10:40

    MYZR虛擬機功能演示

    ncurses-dev1.3常用功能演示1.3.1在Windows虛擬機系統之間復制文件安裝并配置開發環境安裝并運行虛擬機系統建議使用我們提供的
    發表于 12-27 15:04

    電子書:電源設計最強攻略, 帶你全面掌握設計竅門

    `本期電子發燒友《電源設計最強攻略, 帶你全面掌握設計竅門》為你搜集電源相關設計資料,從電源的緩啟動電路設計及原理,到各類電源電路的設計細節技巧,加深你對電源的理解,讓你的電路設計如虎添翼!目錄1
    發表于 07-10 13:42

    虛擬機Ubuntu18 64位系統虛擬機配置方法

    宿主機(host) :虛擬機Ubuntu18 64位系統虛擬機配置:1.添加兩個磁盤是為了將系統和代碼分開,這樣的好處在于可以將代碼盤掛載到其它虛擬機上使用2.安裝兩個網卡是因為目標
    發表于 11-08 09:03

    虛擬機中安裝Windows XP鏡像

    虛擬機軟件中安裝xp系統在xp系統中安裝lambda文章目錄前言一. 安裝VMware Workstation?二、在虛擬機中安裝Windows XP鏡像1.創建虛擬機啟動
    發表于 12-22 06:53

    求一種基于集群的技術和基于虛擬機重啟的技術

    什么是IBM Power Systems的地理分散彈性?災難恢復和高可用性(HA)解決方案主要基于兩種技術:基于集群的技術和基于虛擬機重啟的技術。 群集高可用性和災難恢復解決方案通常會部署冗余的硬件
    發表于 12-29 06:23

    云環境虛擬機集群系統動態負載均衡機制

    針對傳統的物理集群系統無法靈活應對大型互聯網應用的問題,提出一種云環境虛擬機集群的綜合負載均衡機制。該方法首先定期地采集集群
    發表于 01-24 15:13 ?0次下載

    主機windows+ubuntu虛擬機聯網傳輸實例

    主機windows+ubuntu虛擬機 文件傳輸用 主機與虛擬機傳輸文件告別命令行
    的頭像 發表于 07-27 16:12 ?3879次閱讀
    主機<b class='flag-5'>windows</b>+ubuntu<b class='flag-5'>虛擬機</b>聯網傳輸實例

    虛擬機:Ubuntu配置gitweb的步驟

    虛擬機:Ubuntu配置gitweb的步驟
    的頭像 發表于 06-22 16:30 ?2663次閱讀
    <b class='flag-5'>虛擬機</b>:Ubuntu<b class='flag-5'>配置</b>gitweb的步驟

    虛擬機:Ubuntu的基本配置

    虛擬機:Ubuntu的基本配置的基本配置
    的頭像 發表于 06-22 16:52 ?3137次閱讀

    虛擬機:為icescrum 配置MySQL

    虛擬機:為icescrum 配置MySQL
    的頭像 發表于 06-22 16:57 ?2169次閱讀
    <b class='flag-5'>虛擬機</b>:為icescrum <b class='flag-5'>配置</b>MySQL

    虛擬機:Hadoop集群的搭建

    虛擬機:Hadoop集群的搭建
    的頭像 發表于 07-01 13:03 ?3239次閱讀
    <b class='flag-5'>虛擬機</b>:Hadoop<b class='flag-5'>集群</b>的搭建

    虛擬機:Hadoop集群配置

    虛擬機:Hadoop集群配置
    的頭像 發表于 07-01 14:14 ?2835次閱讀

    如何使用windows10遠程連接虛擬機桌面

    本文介紹了如何使用 windows10 遠程連接虛擬機桌面(已使用遠程連接工具連接了虛擬機,如 xshell),親測可用,不懂的地方歡迎交流!
    的頭像 發表于 07-12 11:18 ?3021次閱讀

    Hyper-V創建虛擬機配置IP等網絡配置原理(Linux、Windows為例)

    ,Linux虛擬機網絡不通,默認沒有設置本地網絡配置。而 Windows11虛擬機卻可以。研究了原因,解決辦法總結如下:
    的頭像 發表于 12-09 10:24 ?1930次閱讀
    Hyper-V創建<b class='flag-5'>虛擬機</b><b class='flag-5'>配置</b>IP等網絡<b class='flag-5'>配置</b>原理(Linux、<b class='flag-5'>Windows</b>為例)
    大发888官方 论坛| 真百家乐官网游戏| 大发888特惠代码| 百家乐路珠价格| 百家乐贴| 缅甸百家乐赌场娱乐网规则| 爱赢百家乐官网的玩法技巧和规则| 百家乐官网打印机破解| 广东百家乐官网扫描分析仪 | 24山吉凶视频| 百家乐官网有没有破解之法| 牌九百家乐官网的玩法技巧和规则| 金牌百家乐官网的玩法技巧和规则 | 百家乐机器二手| 百家乐开户送8彩金| 视频百家乐攻略| 赌场百家乐怎么破解| 澳门百家乐庄闲的玩法| 百家乐稳赢投资法| 大发888娱乐城下载lm0| 博彩e族论坛| 台州市| 百家乐官网有秘技吗| 澳门百家乐官网走势图怎么看| 网上百家乐官网娱乐场开户注册| 24山家坐向| 百家乐园sun811.com| 大发888娱乐城下栽| 88利来| 百家乐官网tt娱乐城娱乐城| 真人百家乐打法| 百家乐五湖四海娱乐| 百家乐出千方法技巧| 大发8887s88| 百家乐官网视频世界| 电脑百家乐官网的玩法技巧和规则| 百家乐投注网站是多少| 威尼斯人娱乐城易博lm0| 三易博| 尊龙百家乐官网娱乐网| 免费玩百家乐官网的玩法技巧和规则|