Vibium - AI와 인간을 위한 브라우저 자동화 도

▲

GN⁺ 4달전 | parent | ★ favorite | on: Vibium - AI와 인간을 위한 브라우저 자동화 도구 (github.com/VibiumDev)

Hacker News 의견들

Selenium 덕분에 커리어에 큰 변화를 겪었음. 진심으로 고마움을 전함
요즘은 Playwright를 쓰고 있지만, Vibium의 새로운 접근이 궁금함
- Playwright는 WebSockets+JSON 기반의 빠른 브라우저 제어로 큰 진전을 이뤘음. Vibium은 이에 대응하는 W3C WebDriver BiDi 표준을 사용 중임. 목표는 Playwright처럼 “클릭 몇 번이면 끝나는” 멋진 개발 경험을 제공하는 것임
- 이미 Playwright를 쓰고 있다면 Stagehand를 써보길 추천함. API는 유사하지만 테스트용이 아닌 자동화용으로 설계됨
Vibium이 JS 주입, DOM 수정, 네트워크 요청 감시·변경을 지원하는지 궁금함. Playwright를 쓸 때 거의 항상 이 기능들을 사용함
- 아직은 지원하지 않지만, 로드맵에 포함되어 있음. Playwright의 장점을 받아들이고 그 이상을 확장하는 것이 목표임
- 개인적으로는 네트워크 요청 모니터링만 있어도 충분함. Flutter + Amazon AppSync 앱은 디버깅이 너무 어려움
흥미로움. 최근 dev-browser를 사용해 컨텍스트 절약과 속도 향상을 얻고 있었음. Vibium도 꼭 시도해볼 예정임
- Vibium에서도 이런 skill 기반 확장성을 지원할 계획임
10년 넘게 UI 자동화로 생계를 이어온 입장에서 Selenium에 감사함. 지금은 Playwright가 사실상 표준이지만, Selenium이 원조 브라우저 드라이버였음. Vibium은 Playwright와 어떻게 다른지 궁금함
- Playwright가 “속도” 면에서는 앞서지만, Selenium은 여전히 전 세계적으로 깊게 뿌리내린 생태계를 가짐. Vibium은 Selenium 사용자들이 자연스럽게 미래형 에이전트 코딩으로 넘어갈 수 있는 다리를 만들 계획임
예전에 Selenium으로 Atlassian의 테스트 확장을 도왔던 사람임. 13~15년 전쯤 대화했던 기억이 있음. 여전히 이 분야에서 활동 중이라 반가움
오래된 Selenium 스크립트를 Vibium으로 옮기면 테스트 실패 시 자가 복구(self-heal) 기능을 활용할 수 있을지 궁금함
- 비유하자면, 나는 지금 섬 리조트를 짓는 중임. 다리(마이그레이션 경로)는 나중에 만들 예정임. 우선 리조트가 매력적이면 다리를 놓을 이유가 생길 것임. 지금은 리조트 건설에 집중 중이지만, 다리도 꼭 만들고 싶음
에이전트가 browser_screenshot으로 화면을 캡처한 뒤 클릭하려면 CSS 셀렉터를 어떻게 찾는지 궁금함. 스크린샷만으로는 요소 타입을 알기 어려움
- 현재 MCP 서버는 완전한 자율 탐색 기능이 부족함. 내 포크에서는 browser_evaluate 도구를 추가해 JS로 접근성 트리를 가져오고 이를 기반으로 탐색 가능하게 했음. 자세한 내용은 V2 로드맵 참고 바람
Claude 같은 도구가 브라우저 자동화를 자유롭게 쓰게 하려면, 특정 URL만 허용하는 브라우저 잠금 기능이 필요함. 이런 기능이 로드맵에 있는지 궁금함
- Claude Code를 쓴다면 browser_navigate 훅으로 간단히 제어 가능함. 화이트리스트용 스크립트는 5분이면 설정 가능함. 더 복잡한 정책은 cupcake와 Rego로 구현 가능함. 참고: Claude Code Hooks 문서
- Claude의 “blast radius” 위험성을 잘 알고 있음. 나도 Vibium 개발은 UTM VM 안에서 함. 네트워크 규칙 추가도 고려 중임. 이미 V2 로드맵을 올렸고, V3 초안도 준비해야 할 듯함
- 가장 확실한 방법은 방화벽이 있는 컨테이너 안에서 짧은 화이트리스트만 허용하는 것임
Skyvern과 비슷한 걸 만들 생각이었는데, 왜 Selenium 확장이 아니라 새로운 Vibium을 만든 이유가 궁금함
- Vibium v1 발표문에 일부 설명했음. Selenium이나 Playwright는 AI 중심 설계가 아니었음. Vibium은 처음부터 AI 기반 “vibe coding” 을 위해 최적화된 구조로 설계됨
브라우저와 LLM 간의 컨텍스트 부하(context bloat) 문제를 어떻게 처리하는지 궁금함. Playwright처럼 트레이싱 파일을 노출하거나 JS 실행을 허용할 계획이 있는지도 물음
- 브라우저 노출은 점차 확대할 예정임. 컨텍스트 부하는 아직 완벽히 해결된 곳이 없음. 장기적으로는 “MCP를 쓰지 않는 방향”이 답일 수도 있음. 현재 Vibium은 MCP 서버와 JS/TS API 두 가지를 제공함. JS/TS API에서는 임의의 JS 실행이 가능함. 에이전트가 Vibium 스크립트를 작성해 실행하도록 하는 방식이 컨텍스트 부하를 줄이는 우회로가 될 수도 있음