From fa9534c26519c0dae44d565bf0d7c1493b653e9a Mon Sep 17 00:00:00 2001 From: kaffa Date: Sun, 19 Apr 2026 13:44:57 +0900 Subject: [PATCH] =?UTF-8?q?tasks:=20add=20Longhorn=201.8.2=20=E2=86=92=201?= =?UTF-8?q?.11.1=20upgrade=20plan?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 3 sequential minor hops required before Phase 3 storage-network migration. Includes pre-flight checks, per-hop commands, validation checklist, rollback plan. --- tasks.md | 42 +++++++++++++++++++++++++++++++++++++++++- 1 file changed, 41 insertions(+), 1 deletion(-) diff --git a/tasks.md b/tasks.md index c74e5c1..33df5cd 100644 --- a/tasks.md +++ b/tasks.md @@ -1,9 +1,49 @@ --- title: Tasks -updated: 2026-04-04 +updated: 2026-04-19 tags: [tasks, infra] --- +## Longhorn 업그레이드 (1.8.2 → 1.11.1) + +현재 1.8.2, 최신 1.11.1 (3 minor 뒤처짐). 순차 업그레이드 필수. 예상 1.5~2시간. [[multus]] 설정 후 Phase 3(storage-network 전환) 전에 먼저 완료하는 게 안전. + +### 선행 조건 + +- [ ] `critical-*` snapshot not-ready 경고 원인 해결 (10+개 stuck) +- [ ] 24 볼륨 모두 `Healthy` + replica 전부 정상 확인 +- [ ] [[backup]] 파이프라인 최근 성공 확인 +- [ ] 각 노드 디스크 사용률 <80% 확인 +- [ ] 릴리즈 노트 숙지: v1.9.2, v1.10.2, v1.11.1 +- [ ] `concurrent-auto-engine-upgrade-per-node` ≥ 3 설정 (기본 0) + +### 업그레이드 Hop + +각 hop 약 20~25분, 순차 진행: + +- [ ] **Hop 1: 1.8.2 → 1.9.2** `helm upgrade longhorn longhorn/longhorn -n longhorn-system --version 1.9.2 --reuse-values` +- [ ] **Hop 2: 1.9.2 → 1.10.2** +- [ ] **Hop 3: 1.10.2 → 1.11.1** + +### 각 hop 검증 + +- [ ] longhorn-system pods 전부 Running +- [ ] nodes.longhorn.io 4개 Ready +- [ ] volumes.longhorn.io 24개 `attached` + `Healthy` +- [ ] engines.longhorn.io 새 버전으로 롤오버 완료 +- [ ] PVC 사용 워크로드 샘플 read/write 테스트 + +### 롤백 준비 + +- `helm history longhorn -n longhorn-system` → 각 hop 전 revision 번호 기록 +- 문제 시: `helm rollback longhorn ` (CRD 변경 있으면 제한적) + +### 권장 작업창 + +- 평일 새벽 (02:00~05:00) or 주말 오전 +- 집중 2~3시간 확보 +- 이후 Phase 3 (Longhorn storage-network → `storage-205` NAD) 진행. [[multus]] 참고. + ## Infra - [ ] Incus Built-in DNS + Network Zones 구성