kaffa
620abeae79
infra-hosts: Descheduler 설치 기록 (kr2 OOM freeze 대응)
2026-04-19 14:36:03 +09:00
kaffa
fa9534c265
tasks: add Longhorn 1.8.2 → 1.11.1 upgrade plan
...
3 sequential minor hops required before Phase 3 storage-network migration.
Includes pre-flight checks, per-hop commands, validation checklist, rollback plan.
2026-04-19 13:44:57 +09:00
kaffa
afd2935ea4
infra/network: add multus.md (Multus CNI + storage-205 NAD)
...
Document Multus CNI + Whereabouts IPAM deployment on k3s, including:
- k3s path peculiarities (symlink-based multicall binary vs thick daemonset chroot)
- /opt/cni/bin real-directory workaround with all plugin binaries
- multus-shim/passthru symlinks to k3s CNI dir
- storage-205 NAD for Longhorn 2.5G storage network (ens2, MTU 9000, whereabouts .240-.254)
2026-04-19 13:39:34 +09:00
kaffa
354b2bb9d6
graphifyignore: exclude dev/ from knowledge graph
2026-04-19 12:17:30 +09:00
kappa
75090c8d19
bunnycdn-security: iron-jp 호스트네임 전부 제거 (anvil.it.com 계열 미사용)
2026-04-17 22:00:29 +09:00
kappa
dfc48ae606
bunnycdn-security: MidRate 규칙 전 풀존 삭제 (NAT 오탐 + 비브라우저 호환 문제)
2026-04-17 17:51:48 +09:00
kappa
8ccdc75f55
bunnycdn-security: iron-git rate limit 제거 (git 클라이언트 호환 불가)
2026-04-17 17:50:42 +09:00
kappa
cbe53f0c22
bunnycdn-security: MidRate 80/block → 120/challenge 변경 (NAT 환경 오탐 방지)
2026-04-17 17:41:13 +09:00
kappa
1ef3bedcb5
bunnycdn-security: Rate Limiting 규칙 2개 설정 (IPBurst + MidRate)
2026-04-17 10:21:14 +09:00
kappa
74b0bdaee6
bunnycdn-security: MonthlyBandwidthLimit 50→100GB 상향
2026-04-17 10:12:17 +09:00
kappa
38a1d8d9ad
bunnycdn-security: MonthlyBandwidthLimit 초과 시 풀존 비활성화 동작 기록 (Ticket #386429 )
2026-04-17 10:11:19 +09:00
kappa
78dca9185e
bunnycdn-security: DDoS 과금 정책 공식 확인 결과 기록 (Ticket #386429 )
2026-04-17 09:38:01 +09:00
kappa
57c028e0dc
bunnycdn-security: Turnstile multi-domain 해결 + MonthlyBandwidthLimit 설정
2026-04-17 08:55:56 +09:00
kappa
1a79c6464a
bunnycdn: WAF wafExecutionMode 0→1(Block) 전환 반영 + PATCH API 엔드포인트 수정
2026-04-17 08:49:36 +09:00
kappa
c1a9e84127
crowdsec: Vector _msg 표준 nginx combined 통일, 커스텀 파서 제거
...
- Vector transform에서 Traefik JSON → 표준 nginx combined _msg 변환
- APISIX 서울도 _msg 재구성 (비표준 → 표준 nginx combined)
- custom/apisix-logs 파서 제거, nginx-logs 하나로 통일
- CrowdSec VictoriaLogs Traefik acquisition type: nginx로 변경
2026-04-17 07:30:22 +09:00
kappa
e9ca6c7917
crowdsec: Discord 알림 설정 추가 (2026-04-17)
2026-04-17 07:12:17 +09:00
kappa
ba8b4b160e
crowdsec: 화이트리스트/파서 설정 변경사항 반영 (2026-04-17)
...
- crowdsecurity/whitelists 파서 설치 (192.168.9.1 false positive 해결)
- custom/tailscale-whitelist 추가 (100.64.0.0/10)
- custom/apisix-logs 파서 추가 (서울 APISIX 비표준 nginx 포맷)
- crowdsecurity/traefik collection 설치
- 버전 v1.7.7 확인
2026-04-17 00:51:45 +09:00
heimdall
7395446478
docs: add _index.md MOC to all directories
2026-04-16 13:46:06 +09:00
heimdall
f0e51daafd
refactor: organize infra/ into compute/network/security/data/platform
2026-04-16 13:43:36 +09:00
heimdall
66d2f51743
refactor: normalize infra wikilinks to bare names
2026-04-16 13:43:18 +09:00
heimdall
3f9727f3ac
refactor: move nixos-manual to reference/ + graphifyignore
2026-04-16 13:43:03 +09:00
heimdall
b303243511
n8n Gitea OIDC SSO 설정 문서화 (n8n-oidc hooks)
pre-restructure-20260416
2026-04-16 12:51:53 +09:00
heimdall
226b377387
kine pgx multi-host 직결: HAProxy 의존 제거, API 다운타임 <1s
2026-04-16 12:34:53 +09:00
heimdall
33ce94a75a
pgpool 전면 전환 + pgcat 퇴역: postgresql-ha.md 전면 갱신
2026-04-16 12:24:39 +09:00
kaffa
5f9a153d96
add incus-hp1 to infra docs (K3s worker, 192.168.9.227)
...
Incus 6.0.4 + K3s v1.34.5+k3s1 agent joined 2026-04-16.
btrfs on nvme0n1 954G, incusbr0 10.100.4.1/24, 1GbE only.
2026-04-16 10:51:54 +09:00
heimdall
0d59adb95f
pgpool-II PoC (n8n 전용 전환) + postgresql-ha.md 섹션 추가
2026-04-16 08:25:02 +09:00
heimdall
125413d083
pgcat+Patroni TCP keepalive 적용: 좀비 소켓 방지 (Step 1 옵션 B)
2026-04-16 07:26:37 +09:00
heimdall
a7ecd4b982
pgcat HA 승격 (Step 0): replicas=2 + podAntiAffinity + PDB
2026-04-15 17:21:13 +09:00
syn
ad230522be
infra/crowdsec-safeline: remove APISIX → CrowdSec (:8085) legacy section
...
Verified removed across all 3 sites:
- K3s APISIX: no http-logger plugin in global_rules/routes/services/plugin_configs
- CrowdSec: no apisix-logs HTTP acquisition file, :8085 not listening
- Osaka APISIX: http-logger exists but targets VictoriaLogs (vector.inouter.com), not legacy
Runtime verification via cs_parser_hits metrics: only source is
https://vl.inouter.com/ (victorialogs type).
Split detailed findings to history/2026-04-15-apisix-http-logger-removal.md.
2026-04-15 16:31:18 +09:00
kappa
bb39d5dd54
.graphifyignore: graphify-out 및 시스템 경로 제외 (자기 출력 재추출 방지)
2026-04-15 13:36:35 +09:00
kappa
b24d10d156
vault-mcp-server 실 아키텍처 정정 (중복 아님, jp1 단일 인스턴스)
...
- infra/vault.md MCP 서버 섹션 전체 재작성: K3s Deployment 아니라 Pod 없는 리버스 프록시 파사드, 세 접근 경로 모두 jp1 Incus vault 컨테이너(10.253.101.58)로 수렴
- 과거 오류 정정 callout 추가: vault-active.vault.svc.cluster.local 경로 실존 안 함, hcv/mcp URL은 Vault UI로 307 (올바른 MCP 경로는 vault-mcp.inouter.com/mcp)
- history/2026-04-15-vault-mcp-duplicate-investigation.md 인시던트 기록
근거: Heimdall 조사 (Outline 5b6ddffa) + kappa 로컬 확인 (jp1 systemd active + 활성 트래픽)
2026-04-15 13:29:18 +09:00
kappa
b4ddf27f95
gitignore: graphify-out/ + .graphify-cache/ 추가 (Graphify 도입)
2026-04-15 13:00:56 +09:00
heimdall
a9d37aa37a
Longhorn standard RecurringJob cron KST 새벽으로 보정
...
standard-snapshot 0 3 * * * → 0 18 * * * (UTC, = KST 03:00)
standard-backup 0 4 * * * → 0 19 * * * (UTC, = KST 04:00)
critical 6h 간격에 KST 03시 포함되어 변경 없음.
2026-04-15 12:25:57 +09:00
kappa
b206348dd7
k3s-backup.md: history 파일명 참조 수정
2026-04-15 11:27:04 +09:00
kappa
220157e948
history 중복 제거: longhorn-label-typo (헤임달의 longhorn-backup-label-typo로 통합)
2026-04-15 11:26:55 +09:00
heimdall
f55e1cffb4
Longhorn recurring job 라벨 오타 수정 + history 기록
...
critical/standard 18 볼륨이 recurringjob-group (대시 누락) 으로 라벨
붙어 3주간 백업 전무. recurring-job-group 으로 재라벨 + backup.md 에
라벨 키 규약 명시.
2026-04-15 10:52:06 +09:00
heimdall
5bf9f5f563
auto: vault secret tree sync (2026-04-15, 104 paths)
2026-04-15 10:43:07 +09:00
heimdall
0b8d9435d9
auto: vault secret tree sync (2026-04-14, 103 paths)
2026-04-15 10:43:07 +09:00
kappa
703d5609ec
Longhorn recurring-job 라벨 키 오타 정정 + 인시던트 기록
...
- infra/k3s-backup.md: recurringjob-group → recurring-job-group (대시 포함). silent failure 주의 callout 추가
- history/2026-04-15-longhorn-label-typo.md: 18볼륨 백업 미동작 인시던트 기록
2026-04-15 08:32:13 +09:00
kappa
cfe4cbafae
infra/infra-hosts: hp1-ilo .213 → .140 renew 반영
2026-04-14 17:00:54 +09:00
kappa
6364d71ec9
infra/infra-hosts: hp1/hp2 iLO 정적 DHCP 리스 등록
...
- hp1-ilo: 192.168.9.140 (MAC 6c:3b:e5:b7:0e:4e, 시리얼 JPT3169F2E)
- hp2-ilo: 192.168.9.141 (MAC 6c:3b:e5:b4:57:3e, 시리얼 JPT3169F6C)
- OpenWrt uci dhcp.@host 등록, 자동 renew로 6~12h 내 이전
- 로컬 DNS hp1-ilo.lan / hp2-ilo.lan 자동 생성
2026-04-14 16:20:49 +09:00
kappa
b45a3e05b1
infra/infra-hosts: OpenWrt DHCP 범위 .150-.249로 이전, .100-.149 해방
...
- DHCP 시작점 100 → 150
- 장래 MetalLB 풀 확장 대비
- 기존 리스 6개(.110/.128/.149/.159/.176/.213) 최대 12h 내 renew 시 자연 이전
2026-04-14 16:15:24 +09:00
kappa
544f2026e8
infra/infra-hosts: MetalLB pool 섹션 추가 및 .50-.99로 확장 반영
...
- 기존: 192.168.9.50-59 (10개, 6/10 할당)
- 확장: 192.168.9.50-99 (50개, .56-.99 여유)
- DHCP 범위(.100-249) 충돌 없음, .50-.99 ARP 스캔 clean
- 확장 절차 및 현재 할당 테이블 문서화
2026-04-14 16:01:00 +09:00
kappa
175a7236df
infra/infra-hosts: hp2 DMI(HP ProLiant DL360p Gen8) + 커널 버전 명시
...
- 베어메탈 HW 식별자 추가 (이전 RCA의 'Incus 컨테이너 오해' 재발 방지)
- 2026-04-14 커널 업데이트 반영 (6.12.73 → 6.12.74)
2026-04-14 14:06:19 +09:00
kappa
4e57bb1015
infra/k3s-backup: R2 lifecycle rule 7일 만료 등록 완료
2026-04-14 13:42:54 +09:00
kappa
a16873e871
infra/k3s-backup: Longhorn 보존 정책 7일 기준 통일
...
- critical-backup retain 30 → 28 (7일치)
- standard-backup retain 14 → 7 (7일치)
- snapshot은 현 유지 (critical 24/1일, standard 7/7일)
- R2 lifecycle rule도 7일로 정렬 (TODO)
2026-04-14 13:36:10 +09:00
kappa
3dc684ef78
infra/k3s-backup: Longhorn 볼륨 백업 레이어 추가
...
- Cloudflare R2 BackupTarget 등록 (longhorn-backup 버킷)
- RecurringJob 4개 (critical/standard × snapshot/backup)
- 볼륨 분류: critical 13개, standard 5개
- 복원 절차 명시 (PVC annotation 방식 실패 → Volume CR 경유)
- 2026-04-14 end-to-end 검증 (MD5 일치)
- TODO: R2 lifecycle rule, 분기별 복원 드릴
2026-04-14 13:31:21 +09:00
kappa
cd044f6c0c
infra/nas-storage: hp2 MTU 9000 확인, end-to-end JF 검증 표 추가
...
- hp2 ens2 MTU 9000 실측 반영
- 2026-04-14 ping -M do -s 8972 전 6경로 통과 기록
2026-04-14 12:38:07 +09:00
kappa
b6c68186fe
infra/nas-storage: 2026-04-14 정확성 보정
...
- hp2 NAS 연결 상태 갱신 (미연결 → 192.168.205.134로 정상 참여)
- nfs-provisioner nodeAffinity 실제값 반영 (제약 없음)
- iSCSI ScsiTarget on-demand 동작 설명 추가
- 2026-04-14 iSCSI smoke test 결과 기록
- eth2 USB NIC watchdog 섹션 신설 (LPM exit latency 이슈 대응)
2026-04-14 12:35:20 +09:00
kappa
da4a674719
feat(obsidian): Bases 쿼리용 frontmatter 스키마 + 호스트 파일럿 3개
...
- dev/obsidian-schema.md: type별 frontmatter 규약 문서화
- infra/hosts/{incus-hp2,incus-kr1,zlambda}.md: 구조화된 필드로 파일럿 3개
- infra/hosts.base: Bases 쿼리 (전체/서울/K3s/유료/Critical 뷰)
기존 infra-hosts.md 본문은 그대로 유지. 파일럿 검증 후 나머지 호스트 확장 예정.
2026-04-14 09:07:22 +09:00