infra-hosts: Descheduler 설치 기록 (kr2 OOM freeze 대응)

This commit is contained in:
kaffa
2026-04-19 14:36:03 +09:00
parent fa9534c265
commit 620abeae79

View File

@@ -27,6 +27,15 @@ tags: [infra, network, kr-zone, openwrt]
서울존 4대(kr1, kr2, hp1, hp2)를 K3s v1.34.5+k3s1 클러스터로 구성. **kr1/kr2는 control-plane, hp1/hp2는 worker(k3s-agent)**.
### Descheduler (2026-04-19 설치)
CronJob `kube-system/descheduler`, 30분 주기, helm `descheduler/descheduler` v0.35.1.
- **LowNodeUtilization**: 메모리/CPU 30% 미만 노드 → 70% 초과 노드에서 pod evict하여 분산
- **RemoveDuplicates**: 같은 Deployment pod이 한 노드에 몰리면 분산
- **RemovePodsHavingTooManyRestarts**: 재시작 10회 초과 pod 정리
- evict 제외: kube-system, longhorn-system
- 배경: 2026-04-19 kr2(30GB) OOM freeze — K3s pod 33개 + Incus 9개 = 42 워크로드 과적, 커널 freeze 후 물리 재부팅
| 노드 | LAN IP | OS |
|------|--------|----|
| incus-hp1 | 192.168.9.227 | Debian 13 (trixie) |