Files
obsidian/tasks.md
kaffa fa9534c265 tasks: add Longhorn 1.8.2 → 1.11.1 upgrade plan
3 sequential minor hops required before Phase 3 storage-network migration.
Includes pre-flight checks, per-hop commands, validation checklist, rollback plan.
2026-04-19 13:44:57 +09:00

82 lines
2.9 KiB
Markdown

---
title: Tasks
updated: 2026-04-19
tags: [tasks, infra]
---
## Longhorn 업그레이드 (1.8.2 → 1.11.1)
현재 1.8.2, 최신 1.11.1 (3 minor 뒤처짐). 순차 업그레이드 필수. 예상 1.5~2시간. [[multus]] 설정 후 Phase 3(storage-network 전환) 전에 먼저 완료하는 게 안전.
### 선행 조건
- [ ] `critical-*` snapshot not-ready 경고 원인 해결 (10+개 stuck)
- [ ] 24 볼륨 모두 `Healthy` + replica 전부 정상 확인
- [ ] [[backup]] 파이프라인 최근 성공 확인
- [ ] 각 노드 디스크 사용률 <80% 확인
- [ ] 릴리즈 노트 숙지: v1.9.2, v1.10.2, v1.11.1
- [ ] `concurrent-auto-engine-upgrade-per-node` ≥ 3 설정 (기본 0)
### 업그레이드 Hop
각 hop 약 20~25분, 순차 진행:
- [ ] **Hop 1: 1.8.2 → 1.9.2** `helm upgrade longhorn longhorn/longhorn -n longhorn-system --version 1.9.2 --reuse-values`
- [ ] **Hop 2: 1.9.2 → 1.10.2**
- [ ] **Hop 3: 1.10.2 → 1.11.1**
### 각 hop 검증
- [ ] longhorn-system pods 전부 Running
- [ ] nodes.longhorn.io 4개 Ready
- [ ] volumes.longhorn.io 24개 `attached` + `Healthy`
- [ ] engines.longhorn.io 새 버전으로 롤오버 완료
- [ ] PVC 사용 워크로드 샘플 read/write 테스트
### 롤백 준비
- `helm history longhorn -n longhorn-system` → 각 hop 전 revision 번호 기록
- 문제 시: `helm rollback longhorn <rev>` (CRD 변경 있으면 제한적)
### 권장 작업창
- 평일 새벽 (02:00~05:00) or 주말 오전
- 집중 2~3시간 확보
- 이후 Phase 3 (Longhorn storage-network → `storage-205` NAD) 진행. [[multus]] 참고.
## Infra
- [ ] Incus Built-in DNS + Network Zones 구성
- `core.dns_address` 활성화 (incus-jp1, kr1, kr2)
- Network Zone 생성 (`incus.inouter.com`)
- 각 네트워크(브리지/OVN)에 zone 연결
- OpenWrt dnsmasq에 포워딩 설정
- OVN 전환 완료 후 진행
- [ ] OpenWrt dnsmasq + K3s CoreDNS DNS 이중화
- DHCP에서 DNS 서버 2개 배포 (primary: OpenWrt, secondary: CoreDNS)
- [ ] Synology NAS NFS 활성화
- DSM > 제어판 > 파일 서비스 > NFS 활성화
- 공유 폴더 NFS 권한 설정 (192.168.9.0/24)
- K3s NFS PV로 Gitea 백업 연동
## Incus 마이그레이션
- [ ] inbest 프로젝트 이전 (incus-kr1 → incus-kr2/hp2)
- 9개 컨테이너: nginx, php5, php8, php52, php72, mysql55, phpmyadmin, ssh, igv-kr
- 스킬: `incus-migration` 사용
- 네트워크 매핑 계획 (10.19.x → 대상 네트워크)
- APISIX/DNS 전환
- [ ] inbest nginx에서 cloudflared 분리
- 현재 nginx 컨테이너 내부에서 cloudflared 실행 중
- Docker 이미지 기반 별도 컨테이너로 분리
- 라이브 서비스 — 무중단 전환 필요, 계획 먼저 세울 것
- [ ] incus-kr1 서비스 전부 이전 후 K3s 클러스터에 편입
## Gitea
- [ ] Act Runner 연결 확인 (incus-jp1 → 새 K3s Gitea)
- [ ] 이미지 레지스트리 push/pull 테스트
- [ ] Synology Gitea 데이터 정리 (이전 완료 2주 후)