Files
obsidian/tasks.md
kaffa fa9534c265 tasks: add Longhorn 1.8.2 → 1.11.1 upgrade plan
3 sequential minor hops required before Phase 3 storage-network migration.
Includes pre-flight checks, per-hop commands, validation checklist, rollback plan.
2026-04-19 13:44:57 +09:00

2.9 KiB

title, updated, tags
title updated tags
Tasks 2026-04-19
tasks
infra

Longhorn 업그레이드 (1.8.2 → 1.11.1)

현재 1.8.2, 최신 1.11.1 (3 minor 뒤처짐). 순차 업그레이드 필수. 예상 1.5~2시간. multus 설정 후 Phase 3(storage-network 전환) 전에 먼저 완료하는 게 안전.

선행 조건

  • critical-* snapshot not-ready 경고 원인 해결 (10+개 stuck)
  • 24 볼륨 모두 Healthy + replica 전부 정상 확인
  • backup 파이프라인 최근 성공 확인
  • 각 노드 디스크 사용률 <80% 확인
  • 릴리즈 노트 숙지: v1.9.2, v1.10.2, v1.11.1
  • concurrent-auto-engine-upgrade-per-node ≥ 3 설정 (기본 0)

업그레이드 Hop

각 hop 약 20~25분, 순차 진행:

  • Hop 1: 1.8.2 → 1.9.2 helm upgrade longhorn longhorn/longhorn -n longhorn-system --version 1.9.2 --reuse-values
  • Hop 2: 1.9.2 → 1.10.2
  • Hop 3: 1.10.2 → 1.11.1

각 hop 검증

  • longhorn-system pods 전부 Running
  • nodes.longhorn.io 4개 Ready
  • volumes.longhorn.io 24개 attached + Healthy
  • engines.longhorn.io 새 버전으로 롤오버 완료
  • PVC 사용 워크로드 샘플 read/write 테스트

롤백 준비

  • helm history longhorn -n longhorn-system → 각 hop 전 revision 번호 기록
  • 문제 시: helm rollback longhorn <rev> (CRD 변경 있으면 제한적)

권장 작업창

  • 평일 새벽 (02:00~05:00) or 주말 오전
  • 집중 2~3시간 확보
  • 이후 Phase 3 (Longhorn storage-network → storage-205 NAD) 진행. multus 참고.

Infra

  • Incus Built-in DNS + Network Zones 구성

    • core.dns_address 활성화 (incus-jp1, kr1, kr2)
    • Network Zone 생성 (incus.inouter.com)
    • 각 네트워크(브리지/OVN)에 zone 연결
    • OpenWrt dnsmasq에 포워딩 설정
    • OVN 전환 완료 후 진행
  • OpenWrt dnsmasq + K3s CoreDNS DNS 이중화

    • DHCP에서 DNS 서버 2개 배포 (primary: OpenWrt, secondary: CoreDNS)
  • Synology NAS NFS 활성화

    • DSM > 제어판 > 파일 서비스 > NFS 활성화
    • 공유 폴더 NFS 권한 설정 (192.168.9.0/24)
    • K3s NFS PV로 Gitea 백업 연동

Incus 마이그레이션

  • inbest 프로젝트 이전 (incus-kr1 → incus-kr2/hp2)
    • 9개 컨테이너: nginx, php5, php8, php52, php72, mysql55, phpmyadmin, ssh, igv-kr
    • 스킬: incus-migration 사용
    • 네트워크 매핑 계획 (10.19.x → 대상 네트워크)
    • APISIX/DNS 전환
  • inbest nginx에서 cloudflared 분리
    • 현재 nginx 컨테이너 내부에서 cloudflared 실행 중
    • Docker 이미지 기반 별도 컨테이너로 분리
    • 라이브 서비스 — 무중단 전환 필요, 계획 먼저 세울 것
  • incus-kr1 서비스 전부 이전 후 K3s 클러스터에 편입

Gitea

  • Act Runner 연결 확인 (incus-jp1 → 새 K3s Gitea)
  • 이미지 레지스트리 push/pull 테스트
  • Synology Gitea 데이터 정리 (이전 완료 2주 후)