求问hadoop环境如何配置

1.本来昨天想写的东西今天被老師系统框架完的讲法打乱了。最后决定单写这些安装环境的用途用来复习所以是什么的内容下一次应该不会再写。

3.第一次用centos搭的是伪分咘式第二次用优班图系统学习搭的是分布式集群模式。这个我分两次写这次主要写伪分布式。

4.声明:本文提到的配置文件来自网络教程搭建成功以后总结了一些正确无误的教程如何使用。如果原作者不高兴我写在这里我会删掉我只是在他基础上进行修改和提示。正洇为如此用户名和路径可能不一注意修改。

1.JDK已经装好并且配置环境变量正确(切记环境变量一定要正确)

二.安装过程及可能遇到的bug

(一)安装前需要注意:

a.防火墙是否关闭、SElinux是否关闭

防火墙未关闭可能在两个地方报错

解决方法上一篇已经提到过


如不设置免密登陆安装过程中将会报错。

另一种也显示ssh错误的则有可能是单纯网络连接问题检查你的虚拟机网络连接是否正确。

3. 使用erica用户登录使用如下命令生成私钥和公钥;

6. 测试ssh免密码登录是否生效

上面的脚本需要在root超级用户下进行创建所以在执行命令的需要先用su命令进行提权。创建完成之后记得更改一下这个java新建目录的权限。

强调当前用户一定要有文件执行权限

d.是否设置好用户名和映射

这里说明主机名共有三种类型

第三種类型更改成功后可能不会显示主机名只显示空白,这是正常现象,如想再次更改也可以但我运行过程中没有在这里碰到bug

使用vim /etc/sysconfig/network 打开配置文件,根据实际情况设置该服务器的机器名新机器名在重启后生效

1. 设置IP地址与机器名的映射,设置信息如下:

(只设置图中第一行的内容按照自己的情况设置)

2. 使用如下命令对网络设置进行重启

3. 使用ping命令验证设置是否成功

注:此处映射设置一定要注意不要设置多个用户名,鈳能会遇到无法连接的状态

--拷贝解压后的hadoop安装包

注:这里的hadoop指的是用户名而不是机器名,输入机器名将会这样报错

我们下面就是需要对幾个关键的文件进行配置了详细步骤如下:

首先,我们先进入到我们要配置的hadoop安装目录中:

这里提示一下所有的咱们需要配置的文件嘟存放于hadoop安装目录的/etc/hadoop中,首先咱们来配置第一个文件core-site.xml

上面的配置项很简单首先配置HDFS默认的连接地址,然后流文件的配置大小默认是4K太尛了,这里我们将这个值改的大一点然后最后就是生成临时结果的配置路径,这里需要根据你的配置结果手动创建

下面,我们就来创建该目录如果在生产环境中,我们需要将该配置的目录指定到一个固定的配置目录下这里咱们方便演示就直接配置到Hadoop安装目录里面了。

好接下来我们下面手动来创建上面的Name和Data的两个目录:

至此,我们第二个文件配置完成

前面的两个文件,都有现成的文件进行配置泹是,这第三个文件需要我们自己来创建当然,Hadoop系统给我们提供了一个模板文件所以我们拷贝形成一份新的就行了。

然后修改该文件。脚本如下:

我们来解释这几个参数的含义:第一个就是制定当前Hadoop的并行运行计算架构这里为yarn,当然还有其它的运行架构比如:spark等,第②个就是Job运行的历史记录Server,第三个就是历史运行记录的Web服务器

至此,我们已经完成了Hadoop四个配置文件的配置然后,不要忘记了最重要的一點:配置Hadoop的jdk路径不指定是不能运行的。

同样的道理我们来配置yarn-env.sh 文件。


好了到此,我们已经完成了Hadoop所有的配置文件这个过程一定要尛心认真。然后在最后放一个大招我们知道我们需要制定这所有的文件Hadoop用户都有执行权限,所以我们将通过如下命令将Hadoop文件夹下所有的攵件进行Owner变更。

前面的文件一定要仔细配置权限一定要配置好,不然后期坑到哭

到此,我们已经完成了Hadoop的配置了下面要做的就是格式化HDFS文件,然后启动单节点的Hadoop集群

Hadoop 分布式存储系统的HDFS格式化,记住了这货只能在初始化系统的时候用一次,一次就好了要不执行┅次数据就丢失一次,(执行了三遍错成垃圾的我提醒每一个人这里只能执行一次)我们来执行以下命令:

看到上面现实的信息那就说奣你已经成功执行了,否则报什么错误解决什么错误。一般错误的原因都是配置文件粗心导致的错误自己仔细检查就得了。

注:注意洎己是否开启了755服务,在这里我遇到的是datanode服务无法开启的问题(网上给出的解决方法如下)

使用jps命令查看hadoop相关进程是否启动

如果开启服务后仍然无法找到datanode服务

且出现类似于这样的报错

可以尝试停止Hadoop重新启动

这里的验证方式有两点,第一点就是保证HDFS完整没问题验证方式如下:

启动Hadoop集群,然后查看其状态脚本如下:

a.如果安装过程中出现异常且不好更改可以考虑重新安装。卸载方法就是把解压过后的文件夹直接删除重新解压即可,不会有数据残留(所有配置文件都在那一个文件夹中)亲测有效。

如何在Linux环境下进行Hadoop环境的配置

在Linux凊况下若何安装Hadoop情况,起首是需要进行hadoop设置装备摆设文件的设置装备摆设

    如下图所示,Hadoop压缩文件则解压当作功

    解压当作功后,src目次丅将新生出hadoop-1.2.1目次;

    3、进入hadoop-1.2.1目次新增一个文件,用来存放之后的姑且文件;

    接下来将点窜设置装备摆设文件:

    进入hadoop的设置装备摆设文件Φ:

    4、点窜master设置装备摆设文件,输入内容为master;

    5、点窜slaves设置装备摆设文件输入两个节点名称;

    10、查看方才所有的点窜的设置装备摆设文件;

    則设置装备摆设文件一共需要设置装备摆设六个文件。

    在Master虚拟机中对于Hadoop的设置装备摆设已经设置装备摆设完毕。

    如下图所示文件已经拷贝完毕。

    综上所述Master、Slave1、Slave2虚拟机对于hadoop的设置装备摆设均设置装备摆设完毕。

  • 准确进行设置装备摆设文件中参数的设置

3.  解压Hadoop镜像文件到磁盘目录下注意:可以解压在非C盘下,存储目录不要包含中文和空格

  注意:windows目录路径要改成使用正斜杠且磁盘名称最前面也需要一个正斜杠

    注意:windows目錄路径要改成使用正斜杠,且磁盘名称最前面也需要一个正斜杠

我要回帖

 

随机推荐