問題排除 - daniel-qa/Azure-Kubernetes-Service GitHub Wiki
* CrashLoopBackOff错误解析
CrashloopBackOff 表示pod经历了
starting , crashing 然后再次 starting 并再次 crashing 。
这个失败的容器会被kubelet不断重启
PodSpec 有一个 restartPolicy 字段,值可以是 Always , OnFailure 和 Never ,默认是 Always
导致 CrashLoopBackOff 的原因通常有:
1 .容器中应用程序持续crash
2 .pod/container的参数配置错误
当部署Kubernetes pod是出现错误
- 观察方法如下:
kubectl get pods -n <NameSpace>
kubectl get pods -n default
- 排查方法
kubectl describe pod <podname>
如果要非常详细的信息,则可以加上一个 -v=9 参数
kubectl describe pod nginx-5bd457999d-6vp4f -v=9
通过 kubectl get pods -n 就会看到容器重启计数增加:
kubectl get pods -n default
- 接下来检查pod的日志:
kubectl logs <podname> -n <NameSpace>
kubectl logs <podname> -n kube-system
關於刪除deployment 相關的pod,
可以查看deployment下的副本數, 通過指令
kubectl get deployment -n namespace
kubectl get deployment -n default
根據您實際的需求scale down deployment以降低pod的數量,
通過指令
kubectl scale deployment aad-pod-identity-mic --replicas 1
關於docker cp 指令運行失敗,煩請您提供相關詳細的指令,并提供相關的output用以進一步定位問題。