CDH Hadoop 安装 step by step

export HADOOP_BASE_HOME=/home/hadoop/share/hadoop
export HADOOP_HOME=${HADOOP_BASE_HOME}/hadoop-2.6.0-cdh5.12.0
export HBASE_HOME=${HADOOP_BASE_HOME}/hbase-1.2.0-cdh5.12.0
export HIVE_HOME=${HADOOP_BASE_HOME}/hive-1.1.0-cdh5.12.0
export PATH=PATH:{HADOOP_HOME}/bin:{HADOOP_HOME}/sbin{HBASE_HOME}/bin:${HIVE_HOME}/bin

2) 编辑 ${HADOOP_HOME}/etc/hadoop/hadoop-env.sh

修改对应的行：

export JAVA_HOME=/usr/local/java/

3) 编辑 ${HADOOP_HOME}/etc/hadoop/core-site.xml

<configuration>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/abeffect/data/hadoop</value>
        </property>
        <property>
                 <name>fs.default.name</name>
                 <value>hdfs://localhost:9000</value>
        </property>
</configuration>

4) 编辑 ${HADOOP_HOME}/etc/hadoop/hdfs-site.xml

<configuration>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/home/abeffect/data/nameNode</value>
                <final>true</final>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/home/abeffect/data/dataNode</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>1</value>
        </property>
        <property>
               <name>dfs.permissions</name>
               <value>false</value>
        </property>
        <property>
                <name>dfs.permissions</name>
                <value>false</value>
        </property>
</configuration>

5) cp ${HADOOP_HOME}/etc/hadoop/mapred-site.xml.template ${HADOOP_HOME}/etc/hadoop/mapred-site.xml

编辑 ${HADOOP_HOME}/etc/hadoop/mapred-site.xml

<configuration>
       <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.job.tracker</name>
                <value>localhost:90010</value>
        </property>
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>loclhost</value>
                <description>hostanem of RM</description>
        </property>
        <property>
                 <name>yarn.nodemanager.aux-services</name>
                 <value>mapreduce.shuffle</value>
                 <description>shuffle service that needs to be set for Map Reduce to run </description>
         </property>
         <property>
                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
         </property>
</configuration>

6) 格式化namenode

hdfs namenode -format

正常会有提示：common.Storage: Storage directory /home/abeffect/data/nameNode has been successfully formatted.

7) 启动集群 start-all.sh

8) 访问：http://localhost:50070 来查看web页面

5. 安装单机版本的hbase

1) 下载 tar

2) 编辑 vim ${HBASE_HOME}/conf/hbase-env.sh

修改对应的行

export JAVA_HOME=/usr/local/java/

export HBASE_MANAGES_ZK=true

3) 编辑 vim ${HBASE_HOME}/conf/hbase-site.xml

修改对应的行

<configuration>
	<property>
		<name>hbase.rootdir</name>
		<value>hdfs://localhost:9000/hbase</value>
	</property>
</configuration>

4) 启动

start-hbase.sh

5) 检测状态：

hbase hbck

结果有：

Status: OK

6) 启动web页面

hbase rest start

6. 安装单机版本的hive

1) 下载tarball文件

2) 编辑 ${HIVE_HOME}/bin/hive-config.sh 文件

export JAVA_HOME=/usr/local/java
export HADOOP_BASE_HOME=/home/abeffect/share/hadoop
export HADOOP_HOME=${HADOOP_BASE_HOME}/hadoop-2.6.0-cdh5.12.0
export HBASE_HOME=${HADOOP_BASE_HOME}/hbase-1.2.0-cdh5.12.0
export HIVE_HOME=${HADOOP_BASE_HOME}/hive-1.1.0-cdh5.12.0
export PATH=PATH:{HADOOP_HOME}/bin:{HADOOP_HOME}/sbin:{HBASE_HOME}/bin:${HIVE_HOME}/bin

export CLASSPATH=.:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar:HIVE_HOME/lib:{HBASE_HOME}/lib

3) hive 使用什么样的元数据库，一处是如果要想启动 hive 的 web 管理页面，需要配置 hive 的 web 端 war 包。

hive的元数据库可以用自身的derby，也可以用mysql

4) 重命名

mv ${HIVE_HOME}/conf/hive-env.sh.template ${HIVE_HOME}/conf/hive-env.sh

编辑 ${HIVE_HOME}/conf/hive-env.sh

末尾增加

export HADOOP_BASE_HOME=/home/abeffect/share/hadoop
export HADOOP_HOME=${HADOOP_BASE_HOME}/hadoop-2.6.0-cdh5.12.0
export HIVE_HOME=${HADOOP_BASE_HOME}/hive-1.1.0-cdh5.12.0
export HIVE_CONF_DIR=${HIVE_HOME}/conf
export HIVE_AUX_JARS_PATH=${HIVE_HOME}/lib

编译选项的统一管理

当一个 solution 中的项目越来越多以后，管理编译选项，将成为一件很麻烦的事，单独对每个项目进行设置不仅繁琐，而且容易出错。但实际上，Visual Studio 已经为我们提过了统一的管理界面----Property Manager。在 visual studio 中，每个 c++ 项目的 general 属性 ..

hibrenate 运行一段时间后，出现 org.hibernate.TransactionException: commit failed 错误

网上的解决方法如下：方法一：上网查了一下，有人说是数据库事务的原因，要把 hibernate 的 autocommit 设为 false，我找了一下这个好像要在代码里面设置，而不能通过简单的设置 Hibernate 的配置文件来设置，就没有继续走这条路。后来想到可能是数据库连接池的原因。方法二：在 hibernat ..

Hadoop学习笔记

编译，由于官网上下载的是32位版本的，如果我们的服务器是64位的，需要自己手动编译安装必要的包 $ yum install autoconf automake libtool cmake ncurses-devel openssl-devel gcc* --nogpgcheck 安装maven [链接] 添加环境变量 ..

FSDirectory 详解

简介 Namenode 最重要的两个功能之一就是维护整个文件系统的目录树（即命名空间 namesystem）。 HDFS 文件系统的命名空间（namespace），也就是以“/”为根的整个目录树，是通过 FSDirectory 类来管理的。 FSNamesystem 也提供了管理目录树结构的方法。 FSName ..

Yarn 作业启动源码解读

作业启动作业提交的客户端比较核心的类是 Job.java，看作业启动的源码需要从这个类开始看。 Job.java 作业启动的入口函数为 waitForCompletion 函数。当前函数的核心函数为 submit()，主要如下： public void submit() throws IOException, Int ..

【持续更新】hdfs 常见命令

hdfs fsck 命令详细参见： [链接] [链接] hdfs distcp 命令 DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用 Map/Reduce 实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为 map 任务的输入，每个任务会完成源列表中部分文件的拷贝。 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

CDH Hadoop 安装 step by step

相关帖子

编译选项的统一管理

hibrenate 运行一段时间后，出现 org.hibernate.TransactionException: commit failed 错误

No such property: mainClassName for class

Hadoop学习笔记

FSDirectory 详解

Yarn 作业启动源码解读

【持续更新】hdfs 常见命令

欢迎来到这里！

近期热议

推荐标签标签

最新标签

CDH Hadoop 安装 step by step

相关帖子

编译选项的统一管理

hibrenate 运行一段时间后，出现 org.hibernate.TransactionException: commit failed 错误

No such property: mainClassName for class

Hadoop学习笔记

FSDirectory 详解

Yarn 作业启动源码解读

【持续更新】hdfs 常见命令

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签