1. 首页 > 快讯

06016.1.0 机器解除授权后重新加入集群异常分析

测试环境1.CDH5.16.1

2.Redhat7.4

3. 集群启用了Kerberos

1. 通过CM页面进入“主机”-“所有主机”。

2. 勾选右侧菜单栏中的“集群”。默认情况下不选中它。

点击“确认”

从上图可以确认cdsw.fayson.com机器已经从Cluster1中删除了。

4、这里假设我们突然想将cdsw.fayson.com这台机器添加到Cluster1中,因为这台机器的Agent还没有卸载,仍然由CM管理。根据常理,我们一般都会应用角色模板。在这里检查cdsw。fayson.com,然后点击“Apply Host Template”,发现错误。

2.问题解决

1. 通过CM页面进入“主机”-“所有主机”,然后点击“添加主机”,点击“经典向导”。

06016.1.0 机器解除授权后重新加入集群异常分析

输入cdsw.fayson.com,点击搜索

表明该节点已经被管理,没有办法“继续”。

2、选择“HDFS”服务,点击“实例”

单击“添加角色实例”

尝试在网关中选择cdsw.fayson.com

未找到cdsw.fayson.com 计算机,无法将角色添加到cdsw.fayson.com 计算机。

3.登录Cloudera Manager的元数据数据库。

[root@ip-172-31-6-83 ~]# mysql -u root -p输入密码: MariaDB [(none)] use cm;MariaDB [cm] 显示表格;MariaDB [cm] select HOST_ID,NAME,IP_ADDRESS,STATUS ,来自HOSTS 的CLUSTER_ID;

发现cdsw.fayson.com机器的字段“CLUSTER_ID”为NULL,不属于任何集群。

4. 将cdsw.fayson.com 机器的字段“CLUSTER_ID”更新为与其他机器相同。

06016.1.0 机器解除授权后重新加入集群异常分析

MariaDB [cm] update HOSTS set CLUSTER_ID='1' where HOST_ID=9;查询正常,1 行受影响(0.00 秒)匹配的行: 1 已更改: 1 警告: 0MariaDB [cm] select HOST_ID,NAME,IP_ADDRESS,STATUS,CLUSTER_ID from HOSTS; +--------+---------------------------------------- ------ ----------+----------------+--------+-------- --------+ |主机ID |姓名| IP 地址|状态| CLUSTER_ID |+---------+---------------------------- --------- --------------+--------------+--------+-- --------- -+| 1 | ip-172-31-6-83.ap-southeast-1.compute.internal | ip-172-31-6-83.ap-southeast-1.compute.internal | 172.31.6.83 |不适用| 1 || 2 | ip-172-31 -9-113.ap-southeast-1.compute.internal | ip-172-31 -9-113.ap-southeast-1.compute.internal | 172.31.9.113 |不适用| 1 || 4 | ip-172-31-4-105.ap-southeast-1.compute.internal | ip-172-31-4-105.ap-southeast-1.compute.internal | 172.31.4.105 |不适用| 1 || 8 | ip-172-31-12-142.ap-southeast-1.compute.internal | ip-172-31-12-142.ap-southeast-1.compute.internal | 172.31.12.142 |不适用| 1 || 9 | cdsw.fayson.com | 172.31.13.133 |不适用| 1 |+--------------------+------------------------------------ --- -------------+----------------+--------+-------- -- -+5 行集合(0.00 秒)MariaDB [cm]

6、点击“主机”-“所有主机”,通过CM界面还可以发现cdsw.fayson.com机器已经属于“Cluster1”。

7、再次选择cdsw.fayson.com机器,然后点击“Apply Host Template”,发现已经可以选择了。

发现已经应用成功了。

3.总结

1.当从CM取消授权一台机器时,如果后悔并想将其直接添加回集群,如果直接应用主机模板,将会失败。

2、另外,如果你想通过“添加主机”或扩展按钮将这台机器添加到集群中,则会失败,因为显示这台机器已经被CM管理,无法点击“继续”按钮。

3、通过选择HDFS等某个服务,在“实例”页面尝试将本机添加到HDFS网关等某个角色中,发现弹出的对话框中并没有这样的未授权机器。

4、目前可行的方法是修改数据库的HOSTS表,更新主机的CLUSTER_ID字段,使其属于旧集群。然后在“所有主机页面”再次勾选即可直接应用主机模板。

用户评论

强辩

06016.1.0 版本的机器解除授权后,重新加入集群的时候出现了异常,不知道是什么原因导致的?

    有18位网友表示赞同!

失心疯i

机器解除授权后,再重新加入集群,这操作有点复杂啊!

    有11位网友表示赞同!

ヅ她的身影若隐若现

这个异常分析得挺详细的,感觉挺有用的!

    有14位网友表示赞同!

眷恋

06016.1.0 这个版本,感觉有点不稳定啊!

    有9位网友表示赞同!

何年何念

机器解除授权后,重新加入集群,出现异常,需要仔细排查!

    有16位网友表示赞同!

泡泡龙

这个异常分析的步骤,可以参考一下!

    有6位网友表示赞同!

有阳光还感觉冷

机器解除授权后,重新加入集群,出现了什么异常?

    有19位网友表示赞同!

走过海棠暮

感觉这个版本有点bug啊!

    有9位网友表示赞同!

短发

06016.1.0 版本的机器解除授权后,重新加入集群,异常分析,值得一看!

    有18位网友表示赞同!

麝香味

机器解除授权后,重新加入集群,应该是一个很常见的操作啊!

    有20位网友表示赞同!

搞搞嗎妹妹

机器解除授权后,重新加入集群,出现异常,可能是网络问题!

    有17位网友表示赞同!

南宫沐风

分析得挺详细的,希望能解决问题!

    有5位网友表示赞同!

素衣青丝

06016.1.0 这个版本,需要多加注意啊!

    有19位网友表示赞同!

百合的盛世恋

机器解除授权后,重新加入集群,出现异常,可能是配置问题!

    有18位网友表示赞同!

绳情

感觉这个版本,需要更新一下!

    有18位网友表示赞同!

残留の笑颜

机器解除授权后,重新加入集群,出现异常,可能是权限问题!

    有5位网友表示赞同!

相知相惜

06016.1.0 版本,希望尽快修复bug!

    有6位网友表示赞同!

红尘滚滚

机器解除授权后,重新加入集群,出现异常,可能是证书问题!

    有19位网友表示赞同!

君临臣

这个异常分析,可以参考一下!

    有18位网友表示赞同!

?亡梦爱人

机器解除授权后,重新加入集群,出现异常,可能是数据库问题!

    有18位网友表示赞同!

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/3883.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666