# Agent Safehouse – macOS용 로컬 에이전트 샌드박싱 도구

> Clean Markdown view of GeekNews topic #27329. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=27329](https://news.hada.io/topic?id=27329)
- GeekNews Markdown: [https://news.hada.io/topic/27329.md](https://news.hada.io/topic/27329.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-03-09T11:33:10+09:00
- Updated: 2026-03-09T11:33:10+09:00
- Original source: [agent-safehouse.dev](https://agent-safehouse.dev/)
- Points: 16
- Comments: 1

## Summary

로컬 AI 에이전트의 시스템 접근을 **macOS 네이티브 샌드박스**로 격리하는 도구입니다. 모든 에이전트가 독립된 환경에서 실행되어 홈 디렉터리나 다른 프로젝트에 접근할 수 없으며, **Deny-first 접근 모델**을 통해 명시적으로 허용된 경로만 읽기·쓰기가 가능합니다. 단일 Bash 스크립트로 설치가 끝나고, LLM이 자동으로 최소 권한 프로필을 생성해 개발자는 별도 설정 없이 안전한 로컬 실행 환경을 확보할 수 있습니다.

## Topic Body

- **macOS 네이티브 샌드박스**를 통해 로컬 AI 에이전트가 시스템 외부를 변경하지 못하도록 격리하는 도구  
- 모든 에이전트가 **독립된 샌드박스 환경**에서 실행되어, 사용자 홈 디렉터리나 다른 프로젝트에 접근 불가  
- **Deny-first 접근 모델**을 적용해, 명시적으로 허용된 디렉터리만 읽기·쓰기 가능  
- 설치는 단일 **Bash 스크립트**로 완료되며, 별도 빌드나 의존성 없이 바로 실행 가능  
- LLM 기반 프로필 생성 기능을 통해 **최소 권한 sandbox-exec 설정**을 자동화할 수 있음  
  
---  
### 개요  
- Agent Safehouse는 **macOS 전용 샌드박싱 시스템**으로, 로컬에서 실행되는 AI 에이전트가 시스템 파일을 손상시키지 않도록 보호  
  - “**Go full `--yolo`. We've got you.**” “**Move fast, break nothing**”  
  - LLM의 확률적 특성으로 인한 예기치 못한 명령 실행 위험을 차단  
- **모든 주요 에이전트**가 샌드박스 내에서 완벽히 동작하며, 외부 시스템에는 영향을 미치지 않음  
- **Deny-first 접근 모델**을 채택해, 기본적으로 모든 접근을 차단하고 명시적으로 허용된 경로만 접근 가능  
  - 예시: `~/my-project`는 읽기/쓰기 허용, `~/.ssh`, `~/.aws`, `~/other-repos`는 접근 거부  
  
### 설치 및 실행  
- 설치는 단일 **셀 스크립트 다운로드**로 완료  
  - `curl` 명령으로 스크립트를 받아 `~/.local/bin/safehouse`에 저장 후 실행 권한 부여  
- 이후 `safehouse` 명령으로 원하는 에이전트를 실행  
  - 예: `safehouse claude --dangerously-skip-permissions`  
- Safehouse는 기본적으로 **현재 작업 디렉터리(git root)** 에 읽기/쓰기 권한을 부여하고, **도구 체인 디렉터리**에는 읽기 전용 접근을 허용  
  
### 샌드박스 검증 예시  
- 민감한 파일 접근 시 **커널 수준에서 차단**됨  
  - `safehouse cat ~/.ssh/id_ed25519` 실행 시 “Operation not permitted” 오류 발생  
  - 다른 프로젝트 디렉터리(`~/other-project`)는 보이지 않음  
  - 현재 프로젝트 디렉터리는 정상적으로 접근 가능  
  
### 자동화 및 프로필 생성  
- **쉘 함수 추가**로 모든 에이전트를 기본적으로 Safehouse 내에서 실행 가능  
  - 예: `.zshrc` 또는 `.bashrc`에 `safe()` 함수 정의 후 `claude`, `codex`, `amp`, `gemini` 명령을 자동 샌드박싱  
  - 샌드박스 없이 실행하려면 `command claude` 형태로 호출  
- **LLM 기반 프로필 생성 기능** 제공  
  - Claude, Codex, Gemini 등 모델이 Safehouse 템플릿을 분석해 **최소 권한 sandbox-exec 프로필**을 생성  
  - 홈 디렉터리와 도구 체인 정보를 기반으로 `~/.config/sandbox-exec.profile` 경로에 저장  
  - 현재 작업 디렉터리에 대한 접근 권한과 에이전트별 단축 명령어를 포함  
  
### 보안 및 활용 의의  
- LLM 기반 로컬 에이전트가 **의도치 않은 파일 삭제나 시스템 변경을 수행하지 못하도록 보호**  
- macOS 커널 수준의 접근 제어를 활용해 **기본적으로 안전한 실행 환경**을 제공  
- 단일 스크립트 기반으로 **개발자 워크플로우에 쉽게 통합** 가능

## Comments


### Comment 52656

- Author: neo
- Created: 2026-03-09T11:33:10+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=47301085) 
- 내가 만든 프로젝트가 이렇게 빨리 공개될 줄은 몰랐음  
  1️⃣ 나는 **로컬에서 직접 실행되는 에이전트**를 선호함. 컨테이너나 원격 서버가 아니라, 내가 세밀하게 조정한 내 머신 위에서 돌아가는 게 마음이 편함  
  2️⃣ 이건 사실상 sandbox-exec용 **정책 생성기**임. 의존성도 없고, 가상화도 없음. 대신 각 에이전트가 자동 업데이트, 키체인 통합, 이미지 붙여넣기 등을 수행하기 위해 필요한 최소 권한을 찾는 데 많은 시간을 들였음. 관련 조사 내용은 [agent-safehouse.dev/docs/agent-investigations](https://agent-safehouse.dev/docs/agent-investigations/)에 정리되어 있음  
  3️⃣ 프로젝트 전체를 쓸 필요도 없음. [Policy Builder](https://agent-safehouse.dev/policy-builder.html)만으로도 sandbox-exec 정책을 생성해 dotfiles에 넣어 쓸 수 있음
  - 미리 공개된 건 미안함. 예전에 남긴 댓글을 보고 써봤는데, 효율이 너무 좋아서 글로 소개할 만하다고 생각했음  
    기존에도 sandbox 정책 문서는 봤지만, 이렇게 **바로 쓸 수 있는 앱 형태**는 처음이었음  
    다만 몇 가지 불편한 점이 있었음 — 홈 디렉토리의 `.gitconfig`, `.gitignore` 접근이 제한되고, 프로세스 접근 제약 때문에 Claude에게 `lldb`나 `pkill` 같은 명령을 실행시킬 수 없음. **세밀한 권한 제어**가 가능하면 좋겠음
  - 이걸 **openclaw**에 적용할 수 있을지 궁금함. 로컬 머신에서 접근 가능한 형태로 돌리면 편하지만, 동시에 제어가 어려워지는 문제도 있음
  - 로컬 실행과 컨테이너 실행의 **실질적 차이**가 뭔지 궁금함
  - 오, 내가 찾던 게 이거였음. **microsandbox**를 잘 맞춰보려 했는데 이게 훨씬 현실적임  
    사이트랑 스크립트를 훑어봤는데 특별한 문제점은 못 찾았음. 혹시 문서화되지 않은 **주의할 점**이 있을까?
  - 아이러니하게도, 나는 AI를 신뢰하지 않아서 이런 프로젝트에 관심을 가졌는데, 설치하려면 **임의의 서버에서 .sh 파일을 받아 실행**해야 한다는 점이 좀 웃김  
    tarball 형태로 배포해줬으면 좋겠음. tarball은 내부를 직접 확인하고 CI에서 자동 생성된 건지도 검증할 수 있으니까 더 신뢰할 수 있음

- 이런 프로젝트를 보니 반갑고, 지금 **sandboxing이 가장 큰 과제**라고 생각함  
  초기 사용자들은 무턱대고 로컬에서 에이전트를 돌리겠지만, 장기적으로나 기업 환경에서는 절대 통하지 않음  
  단순히 네트워크, 파일, 실행 권한 제어를 넘어서, 브라우저 테스트나 클라우드 리소스 생성 같은 복잡한 시나리오를 다뤄야 함  
  결국 **보안·비용·권한 제어가 통합된 실용적 접근법**이 필요함
  - 하지만 혹시 이게 **근본적으로 해결 불가능한 문제**일 수도 있지 않을까? 기능성과 안전성은 항상 충돌하고, 사람들은 결국 전자를 선택함
  - 파일 수준의 샌드박싱은 기본이고, 진짜 어려운 건 **자격 증명과 네트워크 제어**임  
    나는 로컬 데몬이 짧은 수명의 JWT를 발급해 에이전트가 직접 키를 다루지 않게 하는 방식을 씀. API 접근엔 잘 맞지만, 여전히 파일 시스템 수준에서는 EC2 인스턴스를 무한히 띄울 수도 있음

- 여러 샌드박스를 비교 평가하는 게 어렵다는 게 문제임  
  이건 sandbox-exec의 **래퍼**로 보이는데, 요즘 이런 래퍼가 많이 생김  
  진짜 필요한 건 **신뢰성 검증 문서와 자동화된 테스트**임. 대부분의 샌드박스는 문서가 부족함  
  신뢰하려면 세부 문서와 작동 증거가 필요함
  - 그래서 나는 Bash로 구현했음 — **불투명한 바이너리**를 피하려고  
    각 에이전트별 sandbox-exec 프로필은 [GitHub 프로필 폴더](https://github.com/eugene1g/agent-safehouse/tree/main/profiles)에 분리되어 있고, 쉽게 검토 가능함  
    실제 에이전트로 **E2E 테스트**도 수행 중임  
    Safehouse 래퍼 없이도 [Policy Builder](https://agent-safehouse.dev/policy-builder)로 최소 권한 정책을 직접 생성 가능함  
    또 LLM에게 샌드박스 프로필을 작성하게 하는 [지침 파일](https://agent-safehouse.dev/llm-instructions.txt)도 제공함

- 이건 sandbox-exec의 **래퍼 스크립트**임. 미리 잘 짜인 프리셋이 많아서 좋음  
  sandbox-exec의 90%는 올바른 범위 설정이고, 나머지 90%는 그걸 이해하는 일임  
  단, **overlay나 copy-on-write 방식**으로 샌드박싱할 수 있으면 좋겠음. 내 `.bashrc`가 아닌 임시 환경만 수정되면 충분함
  - Bash를 쓴 이유는 Go나 Rust 바이너리를 믿기 어렵기 때문임  
    overlay FS는 macOS에서 어렵지만, CWD 외부를 읽기 전용으로 제한해 임시 폴더에서 작업하도록 유도하는 식으로 해결했음
  - 나는 **Amika**라는 OSS를 만들고 있음. 로컬·원격 샌드박스를 빠르게 띄워주는 도구로, Git과 잘 연동됨  
    TCP/UDP 포트 노출, 팀원과의 공유도 가능함. [GitHub 링크](https://github.com/gofixpoint/amika) 참고 바람
  - 나는 **Treebeard**라는 프로젝트를 만들었음. sandbox-exec, worktree, COW 파일시스템을 결합한 구조임  
    git-ignored 파일을 안전하게 접근할 수 있음. [Treebeard 링크](https://github.com/divmain/treebeard)
  - 그런데 sandbox-exec은 이미 **deprecated**된 거 아님?

- 흥미로운 사실: sandbox-exec은 **macOS Sierra(2016)** 부터 공식적으로 deprecated 상태였음  
  그래도 여전히 유용하게 쓰이고 있음. Apple의 App Sandbox는 이런 사용자 정의 규칙엔 맞지 않음  
  Apple이 완전 폐기하지 않길 바람
  - 사실 태생부터 deprecated였던 것 같음. **프로필 언어 문서화**가 거의 없고, 대부분 역공학으로 파악된 수준임

- **Sandvault**라는 프로젝트도 있음. sandbox-exec과 Unix 사용자 시스템을 결합한 방식임  
  각 에이전트에 별도의 비권한 사용자 계정을 주고, sudo·SSH·공유 디렉토리로 상호작용함  
  [Sandvault GitHub 링크](https://github.com/webcoyote/sandvault)

- 나는 macOS용 GUI 앱을 만들어서 sandbox-exec을 시각적으로 관리할 수 있게 했음  
  **도메인별 네트워크 필터링**과 **비밀 탐지 기능**도 포함함  
  [multitui.com](https://multitui.com/)
  
- Apple의 **container** 명령어를 이용해 Claude 코드를 Apple 컨테이너 안에서 실행하는 방법을 공유함  
  `container system start` → `container run` → `container exec` 순으로 환경을 구성하고, Node.js와 Claude를 설치함  
  - 고마움! Homebrew에도 [apple/container](https://github.com/apple/container)가 있음을 처음 알았음

- 왜 로컬에서 에이전트를 돌리는 게 더 낫다고 생각하는지 궁금함.  
  대부분의 사람에게는 **원격 실행**이 더 효율적일 것 같음 — 항상 켜둘 필요가 없으니까
  - 로컬 실행의 장점은 **통제권과 소유권**임. Plex나 웹서버를 직접 돌리는 이유와 비슷함  
    게다가 구독료를 피할 수 있음
  - 나는 이 문제를 해결하려고 **pixels**를 만들었음. TrueNAS SCALE이나 Incus 위에서 실행 가능함  
    보안 강화를 진행 중이며, AI 워크플로에는 충분히 적합함  
    [pixels GitHub 링크](https://github.com/deevus/pixels)

- “clunker”가 “clanker”의 새로운 속어인지 궁금함. 친구의 친구 Roku가 물어봄  
  지금 샌드박싱 문제로 고생 중이라 타이밍이 딱 좋음
  - 오타였음, 방금 수정 완료함