项目实训第十四天

本文最后更新于:2021年7月25日 上午


HBase

其他操作

HBase和Hive的集成

  1. HBase作为一个非关系型数据库,提供了基本的增删改查的能管理,并且HBase能够非常快速且高效的去读写大量的数据,但是HBase对数据的分析功能相对较弱

  2. 在实际过程中,如果需要对HBase中的数据进行分析,那么此时需要考虑关联Hive,利用Hive中的大量函数来对HBase中的数据进行分析

  3. 步骤

    1. 先进入Hive查看是否由操作HBase的jar包

      1
      2
      3
      cd /opt/hive-3.1.2/lib
      ls hive-hbase*
      # 查看是否出现了hive-hbase-handler-3.1.2.jar
    2. 将HBase的依赖jar包拷贝到Hive的lib目录

      1
      2
      3
      4
      5
      6
      7
      cp /opt/hbase-2.4.2/lib/hbase-common-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-server-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-client-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-protocol-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-it-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-hadoop2-compat-2.4.2.jar ./
      cp /opt/hbase-2.4.2/lib/hbase-hadoop-compat-2.4.2.jar ./
    3. 进入Hive的配置文件目录下

      1
      cd ../conf
    4. 编辑文件

      1
      vim hive-site.xml

      添加配置信息

      1
      2
      3
      4
      5
      6
      7
      8
      <property>
      <name>hive.zookeeper.quorum</name>
      <value>hadoop:2181,hadoop02:2181,hadoop03:2181</value>
      </property>
      <property>
      <name>hive.zookeeper.client.port</name>
      <value>2181</value>
      </property>
    5. 启动Hive

      1
      2
      hive --service hiveserve2 &
      hive --service metastore &