問題排除 - daniel-qa/Azure-Kubernetes-Service GitHub Wiki

問題排除

CrashLoopBackOff 錯誤排查

* CrashLoopBackOff错误解析

CrashloopBackOff 表示pod经历了 

starting , crashing 然后再次 starting 并再次 crashing 。

这个失败的容器会被kubelet不断重启

PodSpec 有一个 restartPolicy 字段,值可以是 Always , OnFailure 和 Never ,默认是 Always

导致 CrashLoopBackOff 的原因通常有:

1 .容器中应用程序持续crash

2 .pod/container的参数配置错误

当部署Kubernetes pod是出现错误

  • 观察方法如下:
kubectl get pods -n <NameSpace>
kubectl get pods -n default
  • 排查方法
kubectl describe pod <podname>

如果要非常详细的信息,则可以加上一个 -v=9 参数

kubectl describe  pod nginx-5bd457999d-6vp4f -v=9

通过 kubectl get pods -n 就会看到容器重启计数增加:

kubectl get pods -n default
  • 接下来检查pod的日志:
kubectl logs <podname> -n <NameSpace>

kubectl logs <podname> -n kube-system

Pod 無法 刪除

關於刪除deployment 相關的pod,

可以查看deployment下的副本數, 通過指令

kubectl get deployment -n namespace

kubectl get deployment -n default 

根據您實際的需求scale down deployment以降低pod的數量,

通過指令

kubectl scale deployment aad-pod-identity-mic --replicas 1

關於docker cp 指令運行失敗,煩請您提供相關詳細的指令,并提供相關的output用以進一步定位問題。

⚠️ **GitHub.com Fallback** ⚠️