Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

avatar
作者
猴君
阅读量:0

问题一、NameNode进程退出

在这里插入图片描述
我们发现,NameNode进程不存在。

情况1、单独启动NameNode

hdfs --daemon start namenode 

能够正常拉起,那就没问题
在这里插入图片描述

情况2、无法独立启动NameNode

先尝试启动NameNode

hdfs --daemon start namenode 

发现,没能成功启动
在这里插入图片描述
查看日志文件
在这里插入图片描述

tail -n 100 hadoop-atguigu-namenode-hadoop102.log 

在这里插入图片描述

从报错信息看,是NameNode没有格式化。
但是,我们是格式化后,才启动的集群。

具体是文件没找到:
/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock
我们去改目录查看下情况
在这里插入图片描述
说明,可能NameNode的数据被误删了。

解决
2nn节点上,拷贝元数据到相应目录即可。
我们,知道2nn和nn差别就在于少了一个progress文件。

进入2nn元数据目录

cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary 

拷贝数据

scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name 

再次启动NameNode进程
在这里插入图片描述
测试删除
显示进群处于安全模式
在这里插入图片描述
退出安全模式

hdfs dfsadmin -safemode forceExit 

在这里插入图片描述
就可以正常使用了。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!