第一次搭建蓝鲸平台,参考了蓝鲸社区的官方搭建文档。
友情链接:蓝鲸智云社区版V4.1.16用户手册
在本地用VMware模拟了三台主机,
- 准备至少3台 CentOS 7 以上操作系统的机器
- 最低配置:2核4G
- 建议配置: 4核12G 以上
- 192.168.1.12(主控机)
- 192.168.1.18
- 192.168.1.19
获取安装包
蓝鲸社区版包含软件包和部署脚本包,分别为:
- bkce_product-4.1.16.tgz (下载页面:V4.1.16程序包)
- bkce_common-1.0.0.tgz (下载页面:V1.0.0公共组件包)
- install_ce-master-1.4.13.tgz(下载页面:V1.4.13 部署脚本)
下载地址: http://bk.tencent.com/download/
主机和系统环境
- 部署前关闭待安装主机之间防火墙,保证蓝鲸主机之间通信无碍
查看状态:firewall-cmd --state 执行:service firewall stop/start/restart
- 部署前关闭SELinux
查看状态:getenforce Enforcing 临时关闭:setenforce 0,getenforce Permissive 永久关闭:vim /etc/sysconfig/selinux,SELINUX=enforcing 改为 SELINUX=disabled,重启服务reboot
- 系统的
ulimit -n
需要大于1024,建议102400以上。系统的ulimit -n 有如下三种修改方式:(建议使用第三种) 1.在/etc/rc.local 中增加一行 ulimit -SHn 65535 2.在/etc/profile 中增加一行 ulimit -SHn 65535 3.在/etc/security/limits.conf最后增加如下两行记录 * soft nofile 65535 * hard nofile 65535
- NTP保持时间同步一致
NTP保持时间同步一致 1、vim /etc/resolv.conf # 配置 nameserver 114.114.114.114 nameserver 8.8.8.8 2、执行ntpdate命令。 ntpdate cn.pool.ntp.org 找不到ntpdate,执行: yum install -y ntpdate 若执行ntp命令报错,重启ntp服务即可。 service ntpd stop service ntpd start
- 检查系统的umask,建议设为0022
- 主机有
rsync
命令 - 检查系统是否有配置全局的HTTP代理,如果有,部署前先取消。
- 如非特别说明,安装过程中均使用root账号操作
- 网络配置
systemctl stop firewalld service NetworkManager stop
在这些主机中,选择任意一台机器作为中控机。 将下载的蓝鲸社区版安装包上传到中控机,并解压到 同级目录下。以解压到/data
目录为例:
# 以下两个命令执行后,得到完整的src/ tar xf bkce_product-4.1.16.tgz -C /data tar xf bkce_common-1.0.0.tgz -C /data # 以下命令执行后,得到install/ tar xf install_ce-master-1.4.13.tgz -C /data
解压之后, 得到两个目录: src, install
- src: 存放蓝鲸产品软件, 以及依赖的开源组件
- install: 存放安装部署脚本、安装时的参数配置、日常运维脚本等
更改镜像源
yum源 备份:mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup 获取:wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo 更新:yum clean all yum makecache epel源 备份:mv /etc/yum.repos.d/epel.repo /etc/yum.repos.d/epel.repo.backup 获取:wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo 更新:yum clean all yum makecache
配置文件
install.config
192.168.1.12 nginx,appt,rabbitmq,kafka,zk,es,bkdata,consul,fta 192.168.1.18 mongodb,appo,kafka,zk,es,mysql,beanstalk,consul 192.168.1.19 paas,cmdb,job,gse,license,kafka,zk,es,redis,consul,influxdb
修改本地hosts文件:
在三台服务器上都需要配置: # vi /etc/hosts 172.30.80.248 paas.bk.ops.ulucu.com 172.30.80.248 job.bk.ops.ulucu.com 172.30.80.248 cmdb.bk.ops.ulucu.com
pip.conf
在线安装时,依赖pip,需要配置可用的 pip 源。
vi src/.pip/pip.conf
[global] index-url = http://mirrors.aliyun.com/pypi/simple trusted-host = mirrors.aliyun.com
添加nginx源地址:
在192.168.1.12和192.168.1.19
下配置: # rpm -Uvh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm
- 设置为能连上的 pip 源,默认的pip源配置通常无法使用,验证方式如下:
- 在每台机器上对
pip.conf
中配置的url进行操作:curl http://xxxxxxx
,若能正常返回列表信息则为成功。
获取证书
- 通过
ifconfig
或者ip addr
命令获取install.config文件中,license和gse模块所在服务器的第一个内网网卡的MAC地址。如果分别属于两台服务器,那么两个的MAC地址以英文;分隔。 - 在官网证书生成页面根据输入框提示填入MAC地址,生成并下载证书。
-
上传证书到中控机,并解压到
src/cert
目录下tar xf ssl_certificates.tar.gz -C /data/src/cert/
配置 SSH 免密登陆
登录到中控机,执行以下操作
cd /data/install
bash configure_ssh_without_pass # 根据提示输入各主机的 root 密码完成免密登陆配置
安装前校验环境是否满足
按文档要求做完环境和部署的配置后,准备开始安装前,请运行以下脚本,来校验是否满足:
若安装的是4.0的版本,对应的install/目录下里没有找到precheck.sh时,可以到社区QQ群文件里下载。
cd /data/install bash precheck.sh
正常输出如下图所示:
start <<check_ssh_nopass>> ... [OK] start <<check_password>> ... [OK] start <<check_cert_mac>> ... [OK] start <<check_selinux>> ... [OK] start <<check_umask>> ... [OK] start <<check_get_lan_ip>> ... [OK] start <<check_http_proxy>> ... [OK] start <<check_open_files_limit>> ... [OK] start <<check_domain>> ... [OK] start <<check_networkmanager>> ... [OK]
如果发现有[FAIL]的报错,按照提示和本文档修复。修复后,可继续跑precheck.sh脚本,直到不再出现[FAIL]。如果需要从头开始检查,请使用 precheck.sh -r
参数。
cd /data/install # 该步骤后,可以打开 paas 平台 ./bk_install paas # 安装paas 平台及其依赖服务 # 该步骤完成后, 可以打开 cmdb, 看到蓝鲸业务及示例业务 ./bk_install cmdb # 安装 cmdb 及其依赖服务 # 该步骤完成后, 可以打开作业平台, 并执行作业 # 同时在配置平台中可以看到蓝鲸的模块下加入了主机 ./bk_install job # 安装作业平台及其依赖组件,并在安装蓝鲸的服务器上装好 gse_agent 供验证 # 该步骤完成后可以在开发者中心的 服务器信息 和 第三方服务信息 中看到已经成功激活的服务器 # 同时也可以进行 saas 应用(除蓝鲸监控和日志检索)的上传部署 ./bk_install app_mgr # 部署正式环境及测试环境 # 安装该模块后,可以开始安 saas 应用: 蓝鲸监控及日志检索 ./bk_install bkdata # 安装蓝鲸数据平台基础模块及其依赖服务 # 安装 fta 后台 ./bk_install fta # 安装故障自愈的后台服务 # 重装一下 gse_agent 并注册正确的集群模块到配置平台 ./bkcec install gse_agent # 部署官方SaaS到正式环境(通过命令行从/data/src/official_saas/目录自动部署SaaS) ./bkcec install saas-o
运行完后结果图
部署蓝鲸
参考文档
https://www.cnblogs.com/Bourbon-tian/p/7607817.html