history: complete safeline chaos/detector-logs preemptive PVC replacement (2026-05-18)
This commit is contained in:
@@ -149,6 +149,19 @@ kubectl -n longhorn-system exec lh-curl -- sh -c "
|
||||
- v1.11.2 share-manager strict fsck는 옛 ext4 metadata와 호환 안 됨 — 같은 시점 mkfs된 RWX 볼륨은 **share-manager 재기동을 절대 트리거하지 말거나** 사전에 강제 교체해야 함.
|
||||
- 같은 노드 RWX share-manager 6개 집중 위험은 별건 — incus-hp2 share-manager 이슈 시 SafeLine 전체 영향.
|
||||
|
||||
### 사전 교체 — chaos / detector-logs (2026-05-18 18:55 KST)
|
||||
|
||||
남은 시간폭탄 2개를 표준 절차로 사전 교체. SafeLine 6 파드 모두 Running, share-manager 6/6 Running 회복.
|
||||
|
||||
| PVC | 옛 PV (Released, Retain 보존) | 새 PV | 영향 워크로드 |
|
||||
|---|---|---|---|
|
||||
| `safeline/safeline-chaos` | `pvc-0440758f-f056-46d0-9733-dbb77f2e9101` | `pvc-623baf8f-78a6-4fa1-a946-57f191d0fbb9` | `deploy/safeline-chaos` (1~2분 중단) |
|
||||
| `safeline/safeline-detector-logs` | `pvc-384dd143-05b6-4cd6-a0dd-3edf5dca3acc` | `pvc-e5f7459d-99ce-4404-a435-270aec44599b` | `deploy/safeline-detector` (1~2분 중단) |
|
||||
|
||||
`safeline-detector-logs` PVC는 detector 본체 deployment가 마운트하므로 detector pod도 같이 토글된 점 주의. 신규 detector pod `safeline-detector-566c8fb8fd-n8zbl`에서 rskynet 정상 init, `signal: killed`는 init wait 한 줄(무해 패턴).
|
||||
|
||||
incus-hp2 RWX share-manager 6개 전수가 신규 fs로 교체 완료되어 **이번 라운드의 fsck 시간폭탄은 해소**. 다음 위험은 다른 시점 mkfs된 볼륨이 등장할 때까지 잠재.
|
||||
|
||||
## 관련
|
||||
|
||||
- [[../infra/platform/longhorn]] — Longhorn 플랫폼 정본
|
||||
|
||||
Reference in New Issue
Block a user