---
title: OpenClaw + Ollama 통합
updated: 2026-03-18
---

Ollama를 로컬 LLM 런타임으로 사용하여 OpenClaw을 무료로 운영. 네이티브 Ollama API(`/api/chat`) 사용, 스트리밍 및 도구 호출 지원.

## 빠른 시작

```bash
# Ollama에서 자동 설치+설정+실행
ollama launch openclaw

# 설정만 변경
ollama launch openclaw --config

# 특정 모델 지정
ollama launch openclaw --model kimi-k2.5:cloud
```

## 수동 설정

```bash
# 1. 모델 다운로드
ollama pull glm-4.7-flash

# 2. 환경변수
export OLLAMA_API_KEY="ollama-local"

# 3. 모델 선택
openclaw models set ollama/glm-4.7-flash
```

## 권장 모델

**클라우드 모델** (ollama pull 불필요):
- `kimi-k2.5:cloud` — 멀티모달 추론
- `minimax-m2.5:cloud` — 빠른 코딩/생산성
- `glm-5:cloud` — 추론 및 코드 생성

**로컬 모델**:
- `glm-4.7-flash` — 로컬 추론/코드 (~25GB 메모리)

## 설정 (openclaw.json)

### 자동 발견

`OLLAMA_API_KEY="ollama-local"` 설정 시 로컬 모델 자동 인식

### 명시적 설정 (원격 Ollama 등)

```json5
{
  models: {
    providers: {
      ollama: {
        baseUrl: "http://ollama-host:11434",
        apiKey: "ollama-local",
        api: "ollama",
        models: [{ id: "gpt-oss:20b", contextWindow: 8192 }]
      }
    }
  }
}
```

## 제한사항

- 원격 Ollama 사용 시 `/v1` OpenAI 호환 URL 사용 금지 — 도구 호출 작동 안 함
- OpenAI 호환 모드(`api: "openai-completions"`)에서 도구 호출 불안정
- 로컬 모델은 최소 64k 토큰 컨텍스트 윈도우 권장
- 추론 모델: 이름에 `r1`, `reasoning`, `think` 포함 시 자동 인식
- 비용: 로컬 실행 모든 모델 $0

## v2026.3.12 업데이트

Ollama, SGLang, vLLM을 플러그인 기반으로 통합. `/fast` 모드 추가로 모델 인터랙션 속도 개선.