经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 大数据/云/AI » Hadoop » 查看文章
spark-2.4.0-hadoop2.7-安装部署
来源:cnblogs  作者:踏歌行666  时间:2018/12/3 10:00:03  对本文有异议

 

1. 主机规划

主机名称

IP地址

操作系统

部署软件

运行进程

备注

mini01

172.16.1.11【内网】

10.0.0.11  【外网】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7【主】

QuorumPeerMain、

 

mini02

172.16.1.12【内网】

10.0.0.12  【外网】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0

QuorumPeerMain、

 

mini03

172.16.1.13【内网】

10.0.0.13  【外网】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

mini04

172.16.1.14【内网】

10.0.0.14  【外网】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

mini05

172.16.1.15【内网】

10.0.0.15  【外网】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

 

说明

       该Spark集群安装,但是有一个很大的问题,那就是Master节点存在单点故障,要解决此问题,就要借助zookeeper,并且启动至少两个Master节点来实现高可靠。具体部署下节讲解。

 

 

2. 免密码登录

  实现mini01到mini02、mini03、mini04、mini05通过秘钥免密码登录。

参见文章:Hadoop2.7.6_01_部署

 

 

3. Jdk【java8】

参见文章:Hadoop2.7.6_01_部署

 

 

4. Spark部署步骤

4.1. Spark安装

  1. 1 [yun@mini01 software]$ pwd
  2. 2 /app/software
  3. 3 [yun@mini01 software]$ ll
  4. 4 total 238572
  5. 5 -rw-r--r-- 1 yun yun 227893062 Nov 19 21:24 spark-2.4.0-bin-hadoop2.7.tgz
  6. 6 [yun@mini01 software]$ tar xf spark-2.4.0-bin-hadoop2.7.tgz
  7. 7 [yun@mini01 software]$ mv spark-2.4.0-bin-hadoop2.7 /app/
  8. 8 [yun@mini01 software]$ cd /app/
  9. 9 [yun@mini01 ~]$ ln -s spark-2.4.0-bin-hadoop2.7/ spark
  10. 10 [yun@mini01 ~]$ ll -d spark-*
  11. 11 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
  12. 12 lrwxrwxrwx 1 yun yun 26 Nov 24 14:23 spark -> spark-2.4.0-bin-hadoop2.7/

 

4.2. 环境变量修改

  根据规划,该环境变量的修改包括mini01、mini03、mini04、mini05

  1. 1 # 需要root权限去添加环境变量
  2. 2 [root@mini01 ~]# tail /etc/profile
  3. 3 ………………
  4. 4 # spark环境变量
  5. 5 export SPARK_HOME="/app/spark"
  6. 6 export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH
  7. 7
  8. 8 [root@mini01 ~]# logout
  9. 9 [yun@mini01 conf]$ source /etc/profile # 重新加载该环境变量

 

4.3. 配置修改

  1. 1 [yun@mini01 conf]$ pwd
  2. 2 /app/spark/conf
  3. 3 [yun@mini01 conf]$ cp -a spark-env.sh.template spark-env.sh
  4. 4 [yun@mini01 conf]$ tail spark-env.sh # 修改环境变量配置
  5. 5 # Options for native BLAS, like Intel MKL, OpenBLAS, and so on.
  6. 6 # You might get better performance to enable these options if using native BLAS (see SPARK-21305).
  7. 7 # - MKL_NUM_THREADS=1 Disable multi-threading of Intel MKL
  8. 8 # - OPENBLAS_NUM_THREADS=1 Disable multi-threading of OpenBLAS
  9. 9
  10. 10 # 添加配置如下
  11. 11 # 配置JAVA_HOME
  12. 12 export JAVA_HOME=/app/jdk
  13. 13 # 设置Master的主机名
  14. 14 export SPARK_MASTER_IP=mini01
  15. 15 # 每一个Worker最多可以使用的内存,我的虚拟机就2g
  16. 16 # 真实服务器如果有128G,你可以设置为100G
  17. 17 # 所以这里设置为1024m或1g
  18. 18 export SPARK_WORKER_MEMORY=1024m
  19. 19 # 每一个Worker最多可以使用的cpu core的个数,我虚拟机就一个...
  20. 20 # 真实服务器如果有32个,你可以设置为32个
  21. 21 export SPARK_WORKER_CORES=1
  22. 22 # 提交Application的端口,默认就是这个,万一要改呢,改这里
  23. 23 export SPARK_MASTER_PORT=7077
  24. 24
  25. 25 [yun@mini01 conf]$ pwd
  26. 26 /app/spark/conf
  27. 27 [yun@mini01 conf]$ cp -a slaves.template slaves
  28. 28 [yun@mini01 conf]$ tail slaves # 修改slaves 配置
  29. 29 # distributed under the License is distributed on an "AS IS" BASIS,
  30. 30 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  31. 31 # See the License for the specific language governing permissions and
  32. 32 # limitations under the License.
  33. 33 #
  34. 34
  35. 35 # A Spark Worker will be started on each of the machines listed below.
  36. 36 mini03
  37. 37 mini04
  38. 38 mini05

 

4.4. 分发到其他机器

  分发到mini03、mini04和mini05

  1. 1 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini03:/app # 拷贝到mini03
  2. 2 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini04:/app # 拷贝到mini04
  3. 3 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini05:/app # 拷贝到mini05

 

在mini03、mini04和mini05上操作

  1. 1 [yun@mini04 ~]$ pwd
  2. 2 /app
  3. 3 [yun@mini04 ~]$ ll -d spark-2.4.0-bin-hadoop2.7
  4. 4 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
  5. 5 [yun@mini04 ~]$ ln -s spark-2.4.0-bin-hadoop2.7/ spark
  6. 6 [yun@mini04 ~]$ ll -d spark-*
  7. 7 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
  8. 8 lrwxrwxrwx 1 yun yun 26 Nov 24 23:39 spark -> spark-2.4.0-bin-hadoop2.7/

 

4.5. 启动spark

在mini01上操作

  1. 1 [yun@mini01 sbin]$ pwd
  2. 2 /app/spark/sbin
  3. 3 [yun@mini01 sbin]$ ./start-all.sh # 关闭使用 stop-all.sh 脚本
  4. 4 starting org.apache.spark.deploy.master.Master, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.master.Master-1-mini01.out
  5. 5 mini03: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini03.out
  6. 6 mini05: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini05.out
  7. 7 mini04: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini04.out
  8. 8 [yun@mini01 ~]$
  9. 9 [yun@mini01 ~]$ jps # 查看进程状态
  10. 10 3103 Master
  11. 11 3183 Jps

 

mini03进程查看

  1. 1 [yun@mini03 ~]$ jps
  2. 2 2387 Worker
  3. 3 2437 Jps

 

mini04进程查看

  1. 1 [yun@mini04 ~]$ jps
  2. 2 2183 Jps
  3. 3 2125 Worker

 

mini05进程查看

  1. 1 [yun@mini05 ~]$ jps
  2. 2 2212 Worker
  3. 3 2261 Jps

 

4.6. 浏览器访问

  1. 1 http://mini01:8080/

 

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号