1. 下载 hive

附上官网地址
http://hive.apache.org/

2. 解压 hive

注意本文为了方便使用,使用的 hive 版本为 1.2.1,2.x 版本 hive 默认使用 spark 进行 mapreduce
tar zxvf hive.tar.gz

移动到 /usr/local 路目录下

3. 修改配置文件

hive 默认加载 conf 下的 hive-default.xml

新建 hive-site.xml 添加如下配置,使用 mysql 的存储库(mysql 的安装请观看其他教程,这里不做缀述)

<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://192.168.11.1:3306/hive?createDatabaseIfNotExist=true</value>
  </property>
   <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
  </property>
   <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>root</value>
  </property>
</configuration>

4. 上传 mysql 的驱动 jar 包

放在 hive 目录下的 lib 中

5. 启动 hive

进入根目录

bin/hive

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:PipeSoloSymWide 等,欢迎大家加入,贡献开源。

    2818 引用 • 4207 回帖 • 644 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    47 引用 • 117 回帖 • 809 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    55 引用 • 111 回帖
  • HIVE
    7 引用 • 2 回帖
感谢    关注    收藏    赞同    反对    举报    分享