• Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)
  • 前言

             最近,是在做集群搬移工作,大家肯定会遇到如下的场景。

             (1) 比如,你新购买的电脑,初步者学习使用Ambari集群。从旧电脑复制到新电脑这边来

             (2) 比如,你公司Ambari集群的ip,因业务或其他情况需要,暂时需要更改ip

             (3) 比如,你更改了主机名

        (4)也许其他的原因

       扩展

    linux虚拟机系统的复制或克隆后续问题解决!

    问题详情

     

     

      黄色问号表示: Heartbeat Lost

      即所有的服务都心跳丢失了。。重启ambari-server和ambari-agent都不能解决。

    解决途径

      1、  查看个节点之间是否可以相互通信,若ssh连接不上,有可能是该节点关机了,没有打开,手动开启该节点,再次验证是否可互通。

      2、  在主节点启动ambari-server restart和ambari-agent restart,为了保证其它节点也成功启动,在其它从节点也要进行:ambari-agent restart操作。

      3、  遇到问题

          3.1  mysql server start失败

        在启动过程中,经常出现mysql服务启动失败。查看失败信息,找到是在哪个节点的mysql服务不能正常启动,一般报错是mysql.sock这个问题,解决方法:在对应节点上进行处理:mv /var/lib/mysql/mysql.sock  /var/lib/mysql/mysql.sock_bk. 然后再次启动ambari服务。一般即可。

         3.2 datanode start 失败

                1)关闭集群全部的服务 #ambari-service stop

              2)修改目录所有者 #cd /data1/hadoop/

                             #chown –R hdfs:hadoop  hdfs/

              3)重启集群服务 #ambari-service start 并且在ambari的界面start All所有组件。

          

         4、

      下次可以试着通过手动启动来看看,出现的问题
      如果过你通过手动启动的话,你就应该能看到报错的信息。
     
     
     
     
     

      如果你的ip改变了,怎么来解决?

       如果你的主机名改变了,怎么来解决?

     

     

        

     最后,重新启动所有节点上的ambari-server 和 ambari-agent

    [bigdata@ambigdata1 ~]$ sudo service ambari-server stop
    Using python  /usr/bin/python2
    Stopping ambari-server
    Ambari Server stopped
    [bigdata@ambigdata1 ~]$ sudo service ambari-agent stop
    Verifying Python version compatibility...
    Using python  /usr/bin/python2
    Found ambari-agent PID: 7495
    Stopping ambari-agent
    Removing PID file at /var/run/ambari-agent/ambari-agent.pid
    ambari-agent successfully stopped
    [bigdata@ambigdata1 ~]$ sudo service ambari-server start
    Using python  /usr/bin/python2
    Starting ambari-server
    Ambari Server running with administrator privileges.
    Organizing resource files at /var/lib/ambari-server/resources...
    Server PID at: /var/run/ambari-server/ambari-server.pid
    Server out at: /var/log/ambari-server/ambari-server.out
    Server log at: /var/log/ambari-server/ambari-server.log
    Waiting for server start....................
    Ambari Server 'start' completed successfully.
    [bigdata@ambigdata1 ~]$ sudo service ambari-agent start
    Verifying Python version compatibility...
    Using python  /usr/bin/python2
    Checking for previously running Ambari Agent...
    Starting ambari-agent
    Verifying ambari-agent process status...
    Ambari Agent successfully started
    Agent PID at: /var/run/ambari-agent/ambari-agent.pid
    Agent out at: /var/log/ambari-agent/ambari-agent.out
    Agent log at: /var/log/ambari-agent/ambari-agent.log
    [bigdata@ambigdata1 ~]$ 

      其他节点,不多赘述。

       

      解决

    欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑
     
     
     

    同时,大家可以关注我的个人博客

       http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

       详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

      人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
      目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

          对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

     

  • 相关阅读:
    Spring中的@Transactional(rollbackFor = Exception.class)属性详解
    终于解决 k8s 集群中部署 nodelocaldns 的问题
    将 master 节点服务器从 k8s 集群中移除并重新加入
    搭建 Kubernetes 高可用集群
    排查 k8s 集群 master 节点无法正常工作的问题
    CentOS 7创建自定义KVM模板(现有KVM迁移到另外一台机)
    C#.NET 大型企业信息化系统集成快速开发平台 4.1 版本 如何才能成为全国知名软件组件
    使用通用权限管理系统组件的随想 提高开发能力、规范开发、快速见效
    全网最详细的最新稳定OSSEC搭建部署(ossecserver(CentOS7.X)和ossecagent(CentOS7.X))(图文详解
    CentOS 7的安装详解
  • 【推广】 阿里云小站-上云优惠聚集地(新老客户同享)更有每天限时秒杀!
    【推广】 云服务器低至0.95折 1核2G ECS云服务器8.1元/月
    【推广】 阿里云老用户升级四重礼遇享6.5折限时折扣!
  • 原文地址:https://www.cnblogs.com/zlslch/p/7922897.html
走看看 - 开发者的网上家园