Longhorn recurring-job 라벨 키 오타 정정 + 인시던트 기록

- infra/k3s-backup.md: recurringjob-group → recurring-job-group (대시 포함). silent failure 주의 callout 추가
- history/2026-04-15-longhorn-label-typo.md: 18볼륨 백업 미동작 인시던트 기록
This commit is contained in:
kappa
2026-04-15 08:32:13 +09:00
parent cfe4cbafae
commit 703d5609ec
2 changed files with 51 additions and 3 deletions

View File

@@ -1,6 +1,6 @@
---
title: K3s 백업 파이프라인
updated: 2026-04-14 Longhorn 볼륨 백업 레이어 추가 (R2 직접)
updated: 2026-04-15 Longhorn 라벨 키 오타 수정 (recurring-job-group, 대시 포함). 자세히는 history/2026-04-15-longhorn-label-typo.md 참조
tags: [infra, backup, k3s, r2, longhorn, synology]
---
@@ -110,7 +110,10 @@ sudo /usr/local/bin/docker run --rm \
> [!info] 보존 정책 통일 (2026-04-14)
> 백업 보존을 일관적으로 **7일 기준**으로 통일. snapshot은 CoW 체인이라 개수보다 보존 기간이 중요 — critical은 1일치 시간 단위, standard는 7일치 일단위로 유지.
## 볼륨 분류 (2026-04-14 기준, 라벨 `recurringjob-group.longhorn.io/<group>=enabled`)
## 볼륨 분류 (2026-04-14 기준, 라벨 `recurring-job-group.longhorn.io/<group>=enabled`)
> [!warning] 라벨 키 주의 (2026-04-15 정정)
> 정확한 키는 `recurring-job-group.longhorn.io/<group>` (**대시 포함**). 2026-04-14 초기 구축 시 `recurringjob-group.longhorn.io/<group>` (대시 없음) 오타로 18볼륨 백업이 전부 noop 동작했음. RecurringJob 컨트롤러는 셀렉터 매칭 실패 시 에러 없이 "Found 0 volumes"로 조용히 종료하므로 라벨 키는 반드시 대시 포함 형식으로 부착할 것.
### critical (13 볼륨)
@@ -129,7 +132,7 @@ SafeLine 런타임 로그/상태 6종 (휘발성 OK), nfs-provisioner 마운트
```bash
vol=$(kubectl -n <ns> get pvc <pvc-name> -o jsonpath='{.spec.volumeName}')
kubectl -n longhorn-system label volume $vol \
recurringjob-group.longhorn.io/critical=enabled --overwrite
recurring-job-group.longhorn.io/critical=enabled --overwrite
# 또는 standard
```