hugepage配置导致k8s的kubelet重启失败问题
目录
记录hugepage配置导致k8s的kubelet重启失败问题的排查过程
问题
kubelet 重启时,发现节点无法注册,错误信息如下:
may not have pre-allocated hugepages for multiple page sizes
不支持预分配多种类型的大页。
分析
问题所在业务流程点
结合kubelet代码分析: kubelet启动时会进行自检,如果已使用的hugepagesize类型数 > 1, 根据nr_hugepages,判断大页是否已使用,如nr_hugepages !=1, 则无法通过
查看系统meminfo
|
|
查看系统hugepage
查看大页信息,命令如下
|
|
发现系统已使用了2种类型的大页,如下
|
|
解决方式
- 需要对一种类型大页,清0处理,比如对1G类型大页处理,该类型的hugepage未使用
|
|
- 重启kubelet
|
|