tasks: add Longhorn 1.8.2 → 1.11.1 upgrade plan

3 sequential minor hops required before Phase 3 storage-network migration.
Includes pre-flight checks, per-hop commands, validation checklist, rollback plan.
This commit is contained in:
kaffa
2026-04-19 13:44:57 +09:00
parent afd2935ea4
commit fa9534c265

View File

@@ -1,9 +1,49 @@
---
title: Tasks
updated: 2026-04-04
updated: 2026-04-19
tags: [tasks, infra]
---
## Longhorn 업그레이드 (1.8.2 → 1.11.1)
현재 1.8.2, 최신 1.11.1 (3 minor 뒤처짐). 순차 업그레이드 필수. 예상 1.5~2시간. [[multus]] 설정 후 Phase 3(storage-network 전환) 전에 먼저 완료하는 게 안전.
### 선행 조건
- [ ] `critical-*` snapshot not-ready 경고 원인 해결 (10+개 stuck)
- [ ] 24 볼륨 모두 `Healthy` + replica 전부 정상 확인
- [ ] [[backup]] 파이프라인 최근 성공 확인
- [ ] 각 노드 디스크 사용률 <80% 확인
- [ ] 릴리즈 노트 숙지: v1.9.2, v1.10.2, v1.11.1
- [ ] `concurrent-auto-engine-upgrade-per-node` ≥ 3 설정 (기본 0)
### 업그레이드 Hop
각 hop 약 20~25분, 순차 진행:
- [ ] **Hop 1: 1.8.2 → 1.9.2** `helm upgrade longhorn longhorn/longhorn -n longhorn-system --version 1.9.2 --reuse-values`
- [ ] **Hop 2: 1.9.2 → 1.10.2**
- [ ] **Hop 3: 1.10.2 → 1.11.1**
### 각 hop 검증
- [ ] longhorn-system pods 전부 Running
- [ ] nodes.longhorn.io 4개 Ready
- [ ] volumes.longhorn.io 24개 `attached` + `Healthy`
- [ ] engines.longhorn.io 새 버전으로 롤오버 완료
- [ ] PVC 사용 워크로드 샘플 read/write 테스트
### 롤백 준비
- `helm history longhorn -n longhorn-system` → 각 hop 전 revision 번호 기록
- 문제 시: `helm rollback longhorn <rev>` (CRD 변경 있으면 제한적)
### 권장 작업창
- 평일 새벽 (02:00~05:00) or 주말 오전
- 집중 2~3시간 확보
- 이후 Phase 3 (Longhorn storage-network → `storage-205` NAD) 진행. [[multus]] 참고.
## Infra
- [ ] Incus Built-in DNS + Network Zones 구성