基于kubeadm+离线方式部署kubernetes v1.9.0

基于kubeadm+离线方式部署kubernetes v1.9.0
参考文献如下：
http://blog.51cto.com/bestlope/2151855?source=dra
https://www.jianshu.com/p/a4847af544de
https://segmentfault.com/a/1190000011764684

一、部署背景

由于近期要研究分析Service Catalog，需要搭建一个对应的k8s集群，选择的版本号是v1.9.0

二、环境介绍

系统类型	IP	role	cpu	memory	hostname
CentOS 7.4.1708	172.16.91.155	master	4	2G	master
CentOS 7.4.1708	172.16.91.156	worker	2	1G	slave1
CentOS 7.4.1708	172.16.91.157	worker	2	1G	slave2

三、组件部署方式说明

组件部署说明

组件名称	版本	部署方式	维护方式
kubeadm	v1.9.0	rpm
kubelet	v1.9.9	rpm	systemd
kubectl	v1.9.0	rpm
kube-apiserver	v1.9.0	kubeadm	pod
kube-scheduler-master	v1.9.0	kubeadm	pod
kube-controller-manager-master	v1.9.0	kubeadm	pod

整体部署过程介绍(做到心里有底)
安装主要过程：
- 部署docker
- 导入/下载k8s镜像
- 部署kubeadm, kubelet, kubectl
- 初始化集群(master节点)
- 部署k8s网络(采用Calico方案)
- 增加节点(扩容)

四、安装环境准备工作(所有节点)

4.1 添加基础相关依赖包(所有节点)

yum install -y epel-release
yum install -y yum-utils device-mapper-persistent-data lvm2 net-tools conntrack-tools wget vim  ntpdate libseccomp libtool-ltdl

4.2 主机映射(所有节点)

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

172.16.91.215   master
172.16.91.216   slave1
172.16.91.217   slave2

4.3 ssh免密码登陆(在master节点上 )

ssh-keygen
ssh-copy-id root@slave1
ssh-copy-id root@slave2

4.4 关闭防火墙(所有节点)

systemctl stop firewalld
systemctl disable firewalld

4.5 关闭Swap(所有节点)

swapoff -a
sed -i 's/.swap./#&/' /etc/fstab

swap

防止kubeadm初始化时，报如下错误信息：

kubeadm init error Swap

4.6 设置内核(所有节点)

4.6.1 设置netfilter模块

modprobe br_netfilter
cat <<EOF >  /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sysctl -p /etc/sysctl.d/k8s.conf
ls /proc/sys/net/bridge

设置目的：防止kubeadm报路由警告信息

4.6.2 打开ipv4的转发功能 (所有节点)

# 执行下面的命令
echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf  
# 保存执行
sysctl -p

net.ipv1.ip_forward

如果不打开的话，在将从节点加入到集群时，会报以下的问题？
[图片上传失败...(image-ee39fe-1540898547431)]

4.6.3 更新内核参数

echo "* soft nofile 65536" >> /etc/security/limits.conf
echo "* hard nofile 65536" >> /etc/security/limits.conf
echo "* soft nproc 65536"  >> /etc/security/limits.conf
echo "* hard nproc 65536"  >> /etc/security/limits.conf
echo "* soft  memlock  unlimited"  >> /etc/security/limits.conf
echo "* hard memlock  unlimited"  >> /etc/security/limits.conf  
或者  
echo "* soft nofile 65536" >> /etc/security/limits.conf && 
echo "* hard nofile 65536" >> /etc/security/limits.conf && 
echo "* soft nproc 65536"  >> /etc/security/limits.conf &&  
echo "* hard nproc 65536"  >> /etc/security/limits.conf && 
echo "* soft  memlock  unlimited"  >> /etc/security/limits.conf && 
echo "* hard memlock  unlimited"  >> /etc/security/limits.conf

4.6.4 关闭Selinux(所有节点)

setenforce  0 
sed -i "s/^SELINUX=enforcing/SELINUX=disabled/g" /etc/sysconfig/selinux 
sed -i "s/^SELINUX=enforcing/SELINUX=disabled/g" /etc/selinux/config 
sed -i "s/^SELINUX=permissive/SELINUX=disabled/g" /etc/sysconfig/selinux 
sed -i "s/^SELINUX=permissive/SELINUX=disabled/g" /etc/selinux/config

selinux设置

4.7 配置ntp(所有节点)

systemctl enable ntpdate.service
echo '*/30 * * * * /usr/sbin/ntpdate time7.aliyun.com >/dev/null 2>&1' > /tmp/crontab2.tmp
crontab /tmp/crontab2.tmp
systemctl start ntpdate.service

4.7.1 发现系统时间跟实际时间不对，如何解决

cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime  
ntpdate us.pool.ntp.org  
date

五、下载部署包

下载部署包(物理机操作)
链接：https://pan.baidu.com/s/1fwBxEzOdtD5WpFlo_kMmCw 密码：zfup
本人是下载到/root目录下

k8s部署包

将部署包传输到其他从节点上去(master节点)

scp k8s.tar.gz slave1:/root/
scp k8s.tar.gz slave2:/root/

解压(所有节点)
```
tar -zxvf k8s.tar.gz 
```
传输部署包

六、部署

6.1 部署docker

具体可以参考其他文章，
目前使用的版本是:

[root@slave2 ~]# docker version
Client:
 Version:      17.03.2-ce
 API version:  1.27
 Go version:   go1.7.5
 Git commit:   f5ec1e2
 Built:        Tue Jun 27 02:21:36 2017
 OS/Arch:      linux/amd64

Server:
 Version:      17.03.2-ce
 API version:  1.27 (minimum version 1.12)
 Go version:   go1.7.5
 Git commit:   f5ec1e2
 Built:        Tue Jun 27 02:21:36 2017
 OS/Arch:      linux/amd64
 Experimental: false

6.1.1 添加镜像加速器(所有节点)

如果没有的话，可以在阿里云上注册，获取自己的镜像加速器；

sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": ["https://xxxxx.mirror.aliyuncs.com"]
}
EOF

6.1.2 启动docker服务(所有节点)

sudo systemctl daemon-reload
sudo systemctl restart docker

6.2 导入镜像(所有节点)

cd /root/k8s/image
find . -name "*.tar" -exec docker image load -i {} \; 
find . -name "*.tar.gz" -exec docker image load -i {} \;

导入镜像

slave1导入镜像

slave2导入镜像

load calico image

6.3 部署kubeadm,kubectl, kubelet通过安装RPM包(所有节点)

cd /root/k8s/rpm
rpm -ivh socat-1.7.3.2-2.el7.x86_64.rpm
rpm -ivh kubernetes-cni-0.6.0-0.x86_64.rpm  kubelet-1.9.9-9.x86_64.rpm  kubectl-1.9.0-0.x86_64.rpm
rpm -ivh kubeadm-1.9.0-0.x86_64.rpm

master节点上rpm kubeadm、kubelet、 kubectl

slave1节点上rpm kubeadm、kubelet、 kubectl

slave2节点上rpm kubeadm、kubelet、 kubectl

6.3.1 更新kubelet配置文件(所有节点)

查看一下docker的Cgroup Driver的值？

docker info | grep "Cgroup Driver"

Cgroup Driver

更新配置文件(所有节点)

sed -i 's#systemd#cgroupfs#g' /etc/systemd/system/kubelet.service.d/10-kubeadm.conf

重新启动kubelet服务(所有节点)
```
systemctl daemon-reload  
systemctl enable kubelet  
```
更新kubelet配置文件

命令部署效果：(master节点上部署即可)(选做)

yum install -y bash-completion
source /usr/share/bash-completion/bash_completion
source <(kubectl completion bash)
echo "source <(kubectl completion bash)" >> ~/.bashrc

6.4 初始化集群(master节点)

kubeadm init --kubernetes-version=v1.9.0 --pod-network-cidr=10.224.0.0/16 --token-ttl=0 --ignore-preflight-errors=all

初始化正确结果，打印信息如下：

kubedam init成功

6.4.1 初始化时，报[kubelet-check] It seems like the kubelet isn't running or healthy.

如果初始化时，始终报这个错；

方法一：可以参考下面的文章
https://segmentfault.com/a/1190000011707194
方法二：查看master节点上kubelet进程是否正常启动(master节点操作)
- journalctl -u kubelet -n100
- rm -rf /etc/kubernetes/pki
- systemctl restart kubelet
- kubeadm reset
- kubeadm init --kubernetes-version=v1.9.0 --pod-network-cidr=10.224.0.0/16 --token-ttl=0 --ignore-preflight-errors=all
  
  kubelet-check
  
  image
  
  image

6.4.2 若初始化失败时的解决措施(2种方式) (master节点)

方式一(推荐这种方式简单明了)：

kubeadm reset
方式二：

rm -rf /etc/kubernetes/.conf
rm -rf /etc/kubernetes/manifests/.yaml
docker ps -a |awk '{print $1}' |xargs docker rm -f
systemctl stop kubelet

6.4.2 配置kubectl的认证信息(master节点)

配置kubectl的配置文件

若是非root用户

mkdir -p $HOME/.kube sudo cp -i /etc/kubernetes/admin.conf$ HOME/.kube/config
sudo chown $(id -u):$ (id -g) $HOME/.kube/config
若是root用户

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
source ~/.bash_profile

创建kubectl配置文件

做了这一步操作后，就不会报类似这样的错误了：

The connection to the server localhost:8080 was refused - did you specify the right host or port?

6.4.3 简单测试下

查看master节点状态
kubectl get node
查看pod资源情况
kubectl get pod -n kube-system -o wide
查看组件运行状态
kubectl get componentstatus
查看kubelet运行状况
systemctl status kubelet

集群状态

6.5 k8s网络部署，安装calico插件，从而实现pod间的网络通信

修改calico.yaml中的CALICO_IPV4POOL_CIDR值

更新CALICO_IPV4POOL_CIDR
由于提供的etcd镜像跟calico.yaml中定义的不同，需要重新打一个tag(master节点)
```
docker tag 1406502a6459  quay.io/coreos/etcd:v3.1.10
```
部署calico服务
```
kubectl create -f calico.yaml   
```
查看pod状态
```
kubectl get pod -n kube-system  
```
查看节点状态
```
kubectl get node   
```
集群状态

6.6 扩容集群节点(将其他从节点slave1,slave2添加到集群里)

分别登陆到slave1， slave2上，运行下面的命令即可了(注意，要改成自己的)

kubeadm join 172.16.91.135:6443 --token yj2qxf.s4fjen6wgcmo506w --discovery-token-ca-cert-hash sha256:6d7d90a6ce931a63c96dfe9327691e0e6caa3f69082a9dc374c3643d0d685eb9

假如：忘记上面的token，可以使用下面的命令，找回（master节点上执行）

kubeadm token create --print-join-command

join slave1

再次查看pod的状态

kubectl get pods --all-namespaces -owide

查看节点状态
```
kubectl get node
```
node status

七、dns服务测试

准备测试用的yaml， pod-for-dns.yaml

apiVersion: v1
kind: Pod
metadata:
name: dns-test
namespace: default
spec:
containers:
- image: busybox:1.28.4
    command:
    - sleep
    - "3600"   
    imagePullPolicy: IfNotPresent
    name: dns-test
restartPolicy: Always

注意：busybox的版本号，有些版本号测试失败

创建pod
```
kubectl create -f pod-for-dns.yaml
```

测试dns服务

[root@master ~]# kubectl exec dns-test -- nslookup kubernetes
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

Name:      kubernetes
Address 1: 10.96.0.1 webapp.default.svc.cluster.local

test dns

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,009评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,808评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,891评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,283评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,285评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,409评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,809评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,487评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,680评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,499评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,548评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,268评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,815评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,872评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,102评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,683评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,253评论 2赞 341