一、Hive安装配置
1.登陆hive官网下载安装包,本人使用的是1.2.2版本
官网:http://hive.apache.org/
2.将安装包上传到Linux集群解压并重命名为hive-1.2.2
3.进入hive下的conf目录,重命名hive-env.sh.template为hive-env.sh,然后vi进入文件,修改HADOOP_HOME为你的hadoop目录的绝对路径,然后再修改HIVE_CONF_DIR为你hive下conf目录的绝对路径,保存并退出;
4.启动HDFS、yarn集群,在HDFS集群上创建两个目录:
hdfs dfs -mkdir /tmp、hdfs dfs -mkdir -p /user/hive/warehouse
然后修改它们的权限:
hdfs dfs -chmod 777 /tmp、hdfs dfs -chmod 777 /user/hive/warehouse
5.启动hive,在hive目录下输入命令:
bin/hive
二、配置Hive元数据库为MySQL
Hive的元数据库为derby,derby它不支持多台客户端同时使用,所有我们最好将其修改为MySQL。我后面会总结一篇Linux上安装mysql的随笔,下面是配置流程:
1.拷贝mysql的驱动到hive的lib目录下: 
2.在hive的conf目录下创建hive-site.xml文件,并将一下内存拷贝到文件中,这四个配置信息分别为mysql元数据的位置、jdbc的路径、mysql用户名、mysql密码。
注意:元数据路径记得修改为你的机器的hostname!!!
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>javax.jdo.option.ConnectionURL</name>
- <value>jdbc:mysql://hd1-1:3306/metastore?createDatabaseIfNotExist=true</value>
- <description>JDBC connect string for a JDBC metastore</description>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionDriverName</name>
- <value>com.mysql.jdbc.Driver</value>
- <description>Driver class name for a JDBC metastore</description>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionUserName</name>
- <value>root</value>
- <description>username to use against metastore database</description>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionPassword</name>
- <value>root</value>
- <description>password to use against metastore database</description>
- </property>
- </configuration>
3.这是再依次启动HDFS、yarn、Hive即可,可以测试多台机器启动Hive,同时登陆mysql查看数据库时可以看到metastore该数据库。