经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 大数据/云/AI » Hadoop » 查看文章
腾讯云+阿里云 搭建hadoop + hbase
来源:cnblogs  作者:丶心  时间:2019/9/10 10:27:46  对本文有异议

历时两天,踩了无数坑最后搭建成功。。。

准备

  • 两台服务器都安装jdk1.8(最好装在相同路径)。
  • hadoop 下载
  • hbase 下载
  • 这里使用hadoop-2.7.3和hbase1.2.4

服务器配置

以下1-3步骤中两台服务器都要配置
1、修改hostname
主节点修改成master
从节点修改成slave1
使用命令:vim /etc/hostname

  1. master
  2. # or slave1

重启服务器:reboot
2、修改服务器hosts
假如主节点是阿里云。则在阿里配置
命令: vi /etc/hosts

  1. ip master
  2. ip1 slave1

其中 ip=阿里的内网ip;ip1=腾讯的外网ip
在腾讯配置

  1. ip master
  2. ip1 slave1

其中 ip=阿里的外网ip;ip1=腾讯的内网ip。

3、安装jdk1.8,并配置环境变量

4、ssh配置(master主机)

输入命令生成密匙对

  1. ssh-keygen -t rsa

一路回车

上述命令将在/root/.ssh目录下生成公钥文件id_rsa.pub。将此文件拷贝到.ssh目录下的authorized_keys:

  1. cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys

使用ssh登录本机

将公钥复制到从节点

  1. ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave1

可能需要输入从节点密码。

完成后确保从master免密码登录到slave1

对服务的配置就完成了,接下了配置hadoop。

hadoop

在master构建好hadoop,然后利用ssh分发到slave。所以下面配置在master进行

在home创建hadoop目录和配置文件路径

  1. cd /home/
  2. mkdir hadoop
  3. cd hadoop
  4. mkdir hadoop_data
  5. cd hadoop_data
  6. mkdir tmp
  7. mkdir hdfs
  8. cd hdfs
  9. mkdir data
  10. mkdir name

1、下载并解压:

可以使用wget下载或者上传都可以。

  1. tar zxvf hadoop-2.7.3.tar.gz -C /home/hadoop/

2、 配置hadoop

hadoop配置文件路径 /home/hadoop/hadoop-2.7.3/etc/hadoop

hadoop-env.sh
修改JAVA_HOME。jdk路径

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/hadoop-env.xml
  1. export JAVA_HOME=/usr/local/jdk1.8.0_171

core-site.xml

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/core-site.xml
  1. <configuration>
  2. <property>
  3. <name>fs.defaultFS</name>
  4. <value>hdfs://master:9000</value>
  5. </property>
  6. <property>
  7. <name>io.file.buffer.size</name>
  8. <value>131072</value>
  9. </property>
  10. <property>
  11. <name>hadoop.tmp.dir</name>
  12. <value>file:/home/hadoop/hadoop_data/tmp</value>
  13. <description>Abasefor other temporary directories.</description>
  14. </property>
  15. </configuration>

hdfs-site.xml

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/hdfs-site.xml
  1. <property>
  2. <name>dfs.namenode.secondary.http-address</name>
  3. <value>master:9001</value>
  4. <description>备份namenode的http地址</description>
  5. </property>
  6. <property>
  7. <name>dfs.namenode.name.dir</name>
  8. <value>file:/home/hjh/hadoop_data/hdfs/name</value>
  9. <description>namenode的目录位置</description>
  10. </property>
  11. <property>
  12. <name>dfs.datanode.data.dir</name>
  13. <value>file:/home/hjh/hadoop_data/hdfs/data</value>
  14. <description>datanode's address</description>
  15. </property>
  16. <property>
  17. <name>dfs.replication</name>
  18. <value>1</value>
  19. <description>hdfs系统的副本数量</description>
  20. </property>
  21. <property>
  22. <name>dfs.permissions</name>
  23. <value>false</value>
  24. </property>
  25. <property>
  26. <name>dfs.webhdfs.enabled</name>
  27. <value>true</value>
  28. </property>

yarn-site.xml

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/yarn-site.xml
  1. <configuration>
  2. <property>
  3. <name>yarn.nodemanager.aux-services</name>
  4. <value>mapreduce_shuffle</value>
  5. </property>
  6. <property>
  7. <name>yarn.resourcemanager.hostname</name>
  8. <value>master</value>
  9. </property>
  10. <property>
  11. <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
  12. <value>org.apache.hadoop.mapred.ShuffleHandler</value>
  13. </property>
  14. <property>
  15. <name>yarn.resourcemanager.address</name>
  16. <value>master:8032</value>
  17. </property>
  18. <property>
  19. <name>yarn.resourcemanager.scheduler.address</name>
  20. <value>master:8030</value>
  21. </property>
  22. <property>
  23. <name>yarn.resourcemanager.resource-tracker.address</name>
  24. <value>master:8031</value>
  25. </property>
  26. <property>
  27. <name>yarn.resourcemanager.admin.address</name>
  28. <value>master:8033</value>
  29. </property>
  30. <property>
  31. <name>yarn.resourcemanager.webapp.address</name>
  32. <value>master:8088</value>
  33. </property>
  34. </configuration>

mapred-site.xml

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/mapred-site.xml
  1. <property>
  2. <name>mapreduce.framework.name</name>
  3. <value>yarn</value>
  4. <description>指明mapreduce的调度框架为yarn</description>
  5. </property>
  6. <property>
  7. <name>mapreduce.jobhistory.address</name>
  8. <value>master:10020</value>
  9. <description>指明mapreduce的作业历史地址</description>
  10. </property>
  11. <property>
  12. <name>mapreduce.jobhistory.webapp.address</name>
  13. <value>master:19888</value>
  14. <description>指明mapreduce的作业历史web地址</description>
  15. </property>

salve

  1. vi /home/hadoop/hadoop-2.7.3/etc/hadoop/salve
  1. master
  2. slave1

该文件指定datanode从节点所在的服务器ip,这里只有两台服务器,所以将主节点master也加上去)

配置环境变量(方便后续操作)

  1. vim /etc/profile
  2. export HADOOP_HOME=/home/hadoop/hadoop-2.7.3
  3. export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin . source /etc/profile

最后copy这个hadoop给slave1

  1. scp -r /home/hadoop/hadoop-2.7.3 root@slave1:/home/hadoop/

启动hadoop

以下在master进行

1、先格式化namenode

  1. hadoop namenode -format

2、启动hadoop

  1. ./start-all.sh

执行:jps,查看相关进程

在slave1执行jps,

如果相关进程没有启动则去查看logs对应的模块的日志。准备埋坑。

在hdfs创建目录试试:
在master

  1. hdfs dfs -ls /

hdfs是空的没有返回任何东西。
创建目录test

  1. hdfs dfs -mkdir /test
  2. hdfs dfs -ls /

在slave1中同样可以看到test

至此hadoop搭建完成。

hbase

在master构建,然后分发到slave

1、下载并解压:

可以使用wget下载或者上传都可以。

  1. tar zxvf hbase-1.2.4.tar.gz -C /home/hadoop/

2、 配置hbase

hbase配置文件路径 /home/hadoop/hbase-1.2.4/conf

复制hadoop的hdfs-site.xml和core-site.xml到conf

  1. cp -u /home/hadoop/hadoop-2.7.3/etc/hadoop/hdfs-site.xml /home/hadoop/hbase-1.2.4/conf
  2. cp -u /home/hadoop/hadoop-2.7.3/etc/hadoop/core-site.xml /home/hadoop/hbase-1.2.4/conf

hbase-env.sh

  1. vi /home/hadoop/hbase-1.2.4/conf/hbase-env.sh

由于使用jdk1.8 将如下注释

  1. #配置jdk环境
  2. export JAVA_HOME=/usr/local/jdk1.8.0_171
  3. #配置zookeeper,true则说明使用hbase内置的zookeeper,false则说明使用单独的zookeeper集群
  4. export HBASE_MANAGES_ZK=true

hbase-site.xml

  1. vi /home/hadoop/hbase-1.2.4/conf/hbase-site.xml
  1. <!--这是regionServer的共享目录,用来持久化hbase的,端口默认9000-->
  2. <property>
  3. <name>hbase.rootdir</name>
  4. <value>hdfs://master:9000/hbase</value>
  5. </property>
  6. <!--hbase的运行模式,false是单机模式,true是分布式模式;
  7. 若设置为false,hbase和zookeeper会运行在同一个JVM里面-->
  8. <property>
  9. <name>hbase.cluster.distributed</name>
  10. <value>true</value>
  11. </property>
  12. <!--hbase主节点的端口,默认60000-->
  13. <property>
  14. <name>hbase.master</name>
  15. <value>master:60000</value>
  16. </property>
  17. <!--zookeeper集群的地址列表,用逗号分割,默认localhost,这里的机器太少所以只用了一个zookeeper。否则会出错-->
  18. <property>
  19. <name>hbase.zookeeper.quorum</name>
  20. <value>master</value>
  21. </property>

regionservers

  1. vi /home/hadoop/hbase-1.2.4/conf/regionservers
  1. master
  2. slave1

最后分发个slave1

  1. scp -r /home/hadoop/hbase-1.2.4 root@slave1:/home/hadoop/

在master 启动hbase
在hbase/bin 下启动hbase

  1. ./start-hbase.sh

master运行jps查看相关进程

slave1

出错看logs查看那个模块出问题。

运行hbase shell

整个hadoop + hbase 就搭建好了

JAVA测试

  1. /**
  2. * @Description:
  3. * @Author: HJH
  4. * @Date: 2019-09-04 17:06
  5. */
  6. public class HBaseConn {
  7. private static final HBaseConn INSTANCE = new HBaseConn();
  8. private static Configuration configuration;
  9. private static Connection connection;
  10. private HBaseConn() {
  11. try {
  12. if (configuration == null) {
  13. configuration = HBaseConfiguration.create();
  14. configuration.set("hbase.zookeeper.quorum", "ip"); //master ip
  15. System.setProperty("hadoop.home.dir", "E:\\hadoop-2.7.3");
  16. configuration.set("hbase.zookeeper.property.clientPort","2181"); //端口号
  17. }
  18. } catch (Exception e) {
  19. e.printStackTrace();
  20. }
  21. }
  22. private Connection getConnection() {
  23. if (connection == null || connection.isClosed()) {
  24. try {
  25. connection = ConnectionFactory.createConnection(configuration);
  26. } catch (Exception e) {
  27. e.printStackTrace();
  28. }
  29. }
  30. return connection;
  31. }
  32. public static Connection getHBaseConn() {
  33. return INSTANCE.getConnection();
  34. }
  35. public static Table getTable(String tableName) throws IOException {
  36. return INSTANCE.getConnection().getTable(TableName.valueOf(tableName));
  37. }
  38. public static void closeConn() {
  39. if (connection != null) {
  40. try {
  41. connection.close();
  42. } catch (IOException ioe) {
  43. ioe.printStackTrace();
  44. }
  45. }
  46. }
  47. }
  1. public class HBaseUtil {
  2. public static void main(String[] args) {??
  3. createTable("FileTable", new String[]{"fileInfo", "saveInfo"});
  4. }
  5. /**
  6. * 创建TABLE
  7. * @param tableName 表名
  8. * @param cfs 列族
  9. * @return 是否创建成功
  10. */
  11. public static boolean createTable(String tableName, String[] cfs) {
  12. try (HBaseAdmin admin = (HBaseAdmin) HBaseConn.getHBaseConn().getAdmin()) {
  13. if (admin.tableExists(tableName)) {
  14. return false;
  15. }
  16. HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));
  17. Arrays.stream(cfs).forEach(cf -> {
  18. HColumnDescriptor columnDescriptor = new HColumnDescriptor(cf);
  19. columnDescriptor.setMaxVersions(1);
  20. tableDescriptor.addFamily(columnDescriptor);
  21. });
  22. admin.createTable(tableDescriptor);
  23. } catch (Exception e) {
  24. e.printStackTrace();
  25. }
  26. return true;
  27. }

创建成功

原文链接:http://www.cnblogs.com/hjh614/p/11475816.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号