Linux系统上安装Hadoop环境讲解(linux安装hadoop)

Hadoop,它可以让分布式环境更加容易实现,By taking advantage of the low cost of commodity computing, Hadoop provides us with a powerful distributed system. 这里,让我们了解一下如何在LINUX系统上安装HADOOP。

首先,你需要准备一个有安装SSH服务的Linux机器,使用SSH服务做远程登录。然后,在该Linux机器上下载并安装java,Hadoop是基于java的,安装的版本最好是1.7及以上:

#安装JAVA:
sudo apt-get install openjdk-7-jdk

然后,在该Linux机器上,你还需要安装Hadoop,下载最新的hadoop-2.7.3.tar.gz安装包。安装完Hadoop之后,你就可以开始配置了:

#解压Hadoop
tar -zxvf hadoop-2.7.3.tar.gz

在解压缩后的文件夹hadoo-2.7.3中,有一个配置文件叫做hadoop-env.sh,在该配置文件里,你需要修改JAVA_HOME的路径,让它指向前面安装的java版本:

#配置$JAVA_HOME
export JAVA_HOME=/usr/lib/jvm/java-1.7

接下来,你需要去配置默认的hadoop数据目录,该数据目录是Hadoop将访问的HDFS文件路径,可以在hadoop-site.xml文件里面修改:

#配置Hadoop数据目录

fs.default.name
hdfs://localhost:9000

完成以上配置后,我们就可以开始启动Hadoop系统了,在Hadoop目录下面,有一个叫做sbin的管理启动命令,在里面有四个启动与停止命令:

#启动Hadoop系统
./hadoo-2.7.2/sbin/start-all.sh

最后,你可以使用Hadoop的web控制台,使用浏览器输入http://localhost:50070,就可以查看Hadoop的文件系统,并且可以测试Hadoop的相关服务HDFS、MapReduce是否可用:

#查看Hadoop状态
./hadoop-2.7.2/sbin/hadoop dfsadmin -report

通过以上步骤,就可以在LINUX系统上安装Hadoop系统了。它可以让分布式环境更加容易实现,利用低成本的商用计算,可以给我们提供一个强大的分布式系统。


数据运维技术 » Linux系统上安装Hadoop环境讲解(linux安装hadoop)