From 0223c832abcda24e6b9ab49116dfe2db4ad3d3a2 Mon Sep 17 00:00:00 2001 From: kaffa Date: Mon, 18 May 2026 19:35:38 +0900 Subject: [PATCH] history: complete safeline chaos/detector-logs preemptive PVC replacement (2026-05-18) --- history/2026-05-17-safeline-pvc-fsck-incompat.md | 13 +++++++++++++ 1 file changed, 13 insertions(+) diff --git a/history/2026-05-17-safeline-pvc-fsck-incompat.md b/history/2026-05-17-safeline-pvc-fsck-incompat.md index 5f3d717..ae79268 100644 --- a/history/2026-05-17-safeline-pvc-fsck-incompat.md +++ b/history/2026-05-17-safeline-pvc-fsck-incompat.md @@ -149,6 +149,19 @@ kubectl -n longhorn-system exec lh-curl -- sh -c " - v1.11.2 share-manager strict fsck는 옛 ext4 metadata와 호환 안 됨 — 같은 시점 mkfs된 RWX 볼륨은 **share-manager 재기동을 절대 트리거하지 말거나** 사전에 강제 교체해야 함. - 같은 노드 RWX share-manager 6개 집중 위험은 별건 — incus-hp2 share-manager 이슈 시 SafeLine 전체 영향. +### 사전 교체 — chaos / detector-logs (2026-05-18 18:55 KST) + +남은 시간폭탄 2개를 표준 절차로 사전 교체. SafeLine 6 파드 모두 Running, share-manager 6/6 Running 회복. + +| PVC | 옛 PV (Released, Retain 보존) | 새 PV | 영향 워크로드 | +|---|---|---|---| +| `safeline/safeline-chaos` | `pvc-0440758f-f056-46d0-9733-dbb77f2e9101` | `pvc-623baf8f-78a6-4fa1-a946-57f191d0fbb9` | `deploy/safeline-chaos` (1~2분 중단) | +| `safeline/safeline-detector-logs` | `pvc-384dd143-05b6-4cd6-a0dd-3edf5dca3acc` | `pvc-e5f7459d-99ce-4404-a435-270aec44599b` | `deploy/safeline-detector` (1~2분 중단) | + +`safeline-detector-logs` PVC는 detector 본체 deployment가 마운트하므로 detector pod도 같이 토글된 점 주의. 신규 detector pod `safeline-detector-566c8fb8fd-n8zbl`에서 rskynet 정상 init, `signal: killed`는 init wait 한 줄(무해 패턴). + +incus-hp2 RWX share-manager 6개 전수가 신규 fs로 교체 완료되어 **이번 라운드의 fsck 시간폭탄은 해소**. 다음 위험은 다른 시점 mkfs된 볼륨이 등장할 때까지 잠재. + ## 관련 - [[../infra/platform/longhorn]] — Longhorn 플랫폼 정본