5P by GN⁺ 2일전 | ★ favorite | 댓글 2개
  • BrowserOSPerplexity Comet의 오픈소스, 프라이버시 중심 대안으로, 로컬에서 AI 에이전트를 실행하는 에이전틱 브라우저
  • Chromium을 포크하여 기존 Chrome 확장들을 모두 지원하며, 사용자 데이터가 로컬에만 저장되는 것이 특징
  • OpenAI, Anthropic, Ollama 등 다양한 AI 프로바이더와 연동 가능하며, 개인 API 키 또는 로컬 모델을 사용할 수 있음
  • 네이티브 하이라이터, ChatGPT 기반 북마커, 시맨틱 검색 등 최신 생산성 도구 내장 및 AI 기반 광고 차단 기능도 곧 지원 예정
  • 기존 브라우저와 달리 검색/광고 기업에 데이터가 넘어가지 않고, 자동화된 워크플로우를 로컬에서 AI가 수행

BrowserOS 개요

  • BrowserOS는 오픈소스 에이전트 브라우저로, 사용자의 컴퓨터에서 직접 AI 에이전트가 동작하는 환경을 제공함
  • 프라이버시 우선 철학을 바탕으로, API 키 또는 Ollama 등 로컬 모델을 사용해 데이터가 외부로 유출되지 않음
  • Chromium 포크 기반이어서 Chrome 사용자 인터페이스와 동일하며, 모든 크롬 확장 프로그램이 작동함

주요 기능

  • AI 에이전트 & 로컬 실행

    • 브라우저 내에서 AI 에이전트가 로컬로 직접 실행되어, 반복 업무 및 자동화 워크플로우 처리
    • Ollama 통합으로 대용량 언어 모델을 클라우드 대신 내 컴퓨터에서 구동, 데이터 프라이버시 보장
  • 생산성 도구

    • 하이라이터, ChatGPT 북마커 등 브라우저 내장 생산성 도구 지원
    • 시맨틱 검색으로 히스토리/북마크 등 브라우저 데이터를 빠르게 찾을 수 있음
  • 광고 차단 및 MCP 스토어(예정)

    • AI 기반 광고 차단(곧 출시), Chrome에서 uBlock Origin 차단 이후의 대안 제공 예정
    • MCP(멀티 커맨드 패키지) 스토어(곧 출시)에서 인기 MCP를 원클릭 설치 후 바로 브라우저 바에서 활용 가능
  • 오픈소스 및 커뮤니티 중심

    • AGPL-3.0 라이선스로 100% 오픈소스, 코드와 동작 투명성 보장
    • 커뮤니티 참여 및 기여를 적극적으로 장려

대표 활용 사례

  • 반복적이고 지루한 업무 자동화: 미팅 예약, 폼 작성, 반복 작업을 AI가 자동 처리
  • 딥 리서치: 웹을 탐색해 요약 리포트 생성, 수작업 탭 관리 없이 효율적 정보 수집
  • SNS 콘텐츠 스캐닝: LinkedIn, Twitter 등에서 유의미한 게시글 자동 선별 및 정리

타 브라우저와의 비교

  • Chrome: 10년간 큰 변화 없이 AI/자동화/MCP 기능 부재
  • Brave: 암호화폐/검색/VPN 등 분산 전략으로 AI 브라우저에 집중하지 않음
  • Arc/Dia: 폐쇄형으로 오픈소스가 아님, 사용 중단 시 대안 없음
  • Perplexity Comet: 검색/광고 기업 중심, 사용자 데이터가 서버로 전송되나 BrowserOS는 모든 데이터를 로컬에만 저장

설치 및 시작

  • macOS, Windows용 다운로드 지원
  • 크롬 데이터 가져오기(선택)
  • AI 프로바이더 연결(OpenAI, Anthropic, Ollama 등)
  • 바로 에이전트 자동화 시작 가능

라이선스

  • AGPL-3.0 오픈소스 라이선스 적용

https://news.hada.io/topic?id=21581
어딘가 익숙해서 봤더니 Nxtscape가 이름만 바꾼거였네요

Hacker News 의견
  • 데모에서 보여준 치약 구매 예시는 이 작업들이 얼마나 어려운지 보여줌, 치약이라는 자체가 매우 모호하게 지정되어 있어서, 결국 엄청나게 거대한 리스트 중에서 랜덤하게 고름, 일부 작업은 이전 행동이 가이드를 줄 수 있지만, 그렇지 않은 경우도 많음, 예를 들어 이전에 샀던 치약이 품절이면 어떻게 할지 알 수 없음, 결국 이런 예시가 정말로 시간을 절약해주는지 의문이고, 어차피 결과를 확인하려면 두 번 일하는 것임, 이 때문에 Alexa 같은 시스템이 처음에 Amazon이 기대했던 구매 경험을 제공하지 못했다고 생각함, 차라리 시간 절약이 분명하게 드러나고 실패 케이스가 최소화된, 더 복잡한 예시를 보여주거나, 오히려 실패 케이스에서 어떻게 복구할지에 초점을 맞추는 게 더 좋을 것 같음, 특정 문제에 맞는 UI를 제공하나, 아니면 채팅으로 해결함, 이 세계 전체가 결코 쉬운 일이 아니라고 생각함, 모두 행운을 빔
    • 맞는 말임, agentic browser 분야 전체가 아직 시작 단계임, 우리도 겨우 시작했고, 가치 있는 틈새 use-case를 찾으려는 중임, 반복적이고 지루한 작업 중에 시간 절약 효과가 분명한 경우가 있음, 예를 들면 Walmart 3자 셀러들이 하루에도 여러 번 경쟁사 가격을 체크해서 내 제품 가격을 조정하는 일임, 이건 agentic browser로 쉽게 자동화가 가능함
    • 사용자별 미적 취향에 맞춰 작업을 수행할 수도 있어야 한다고 생각하지만, 그렇게 하면 보안 악몽이 될 수 있을 거 같음
  • Nxtscape를 이미 설치해뒀는데, 제품명이 바뀌었는지 몰라서 BrowserOS를 실행했더니 같은 UI와 채팅창에 여우 이모지도 똑같이 떠서 당황했음, 솔직히 예전 이름이 더 좋았음, 법적인 이유로 이름을 바꾼 거라고 추정함.<br>Arstechnica 기사 댓글을 요약해달라고 시켜봤는데, 처음에는 "댓글이 포함되어 있지 않아 요약할 수 없다"는 답변만 받았음, 직접 "comments" 링크를 눌러보라고 지시해야만 제대로 댓글을 읽기 시작했고, 참고로 댓글 페이지가 총 3개인데 20분 넘게 100번 가량의 액션(그 중엔 매우 구체적으로 1074픽셀씩 스크롤하는 동작도 많음)을 수행하더니, 아직도 "Validating task completion..."이라는 상태에서 요약을 기다리고 있음<br>기능적으로는 파워풀해 보이지만, 너무 손이 많이 가고 느려서 실제로 쓸 순 없다고 느낌.<br>참고로 Nxtscape도 설치되어 있어서 같은 실험을 해봤는데 더 빠르고 적은 액션만으로 작업을 마쳤음, 그게 우연인지, 내부적으로 다른 로직 때문인지는 잘 모르겠음<br>그리고 iCloud 비밀번호를 Chrome에서 쓸 수 있게 해주는 Chrome 확장 프로그램이 있는데, Nxtscape와 BrowserOS에서는 작동하지 않음, 비번 관리자를 계속 직접 켜야 한다면 이런 브라우저는 쓸 생각 없음, 그리고 비밀번호 관리자도 바꿀 계획은 없음
    • 문제 생기는 걸 방지하려고 이름을 바꿈, 그리고 예전 이름은 발음하기도 어려웠음<br>피드백 고맙고, Discord(https://discord.gg/YKwjt5vuKr)에서 더 이야기 나누면 좋겠음! 우리 팀은 매일 배포하며 엄청 빠르게 개선 중이고, 에이전트도 며칠 내로 훨씬 나아질 예정임<br>iCloud 비밀번호 확장 건도 확인해볼 것임, 온보딩과 비밀번호 관리가 훨씬 더 쉬워지게 만드는 게 목표임
  • 이게 privacy first browser라면 왜 Firefox를 쓰지 않았는지 궁금함, Firefox는 이 목적에 훨씬 더 잘 맞고 기본적으로도 더 나은 옵션임, Tor Browser, Mullvad Browser, LibreWolf 등 보안/프라이버시 우선 웹브라우저는 전부 Firefox 엔진 기반임<br>그리고 다양한 "웹 브라우저 엔진"이 꼭 필요하다고 생각함, 대형 테크 기업 엔진만 쓰게 되면 결국 소비자 입장에서 엄청 손해이고 혁신도 막힘<br>Firefox 같은 독립 브라우저를 더 많이 지원해야 함
    • 정말 어려운 결정이었음<br>webkit 위에서 브라우저 만드신 분들과 얘기해봤는데, 무작위 버그를 고치고 사이트 호환 이슈를 잡는 데만 거의 2년은 걸렸다고 함, firefox/gecko 엔진이 webkit보단 나을 수도 있으나 결론은 chromium 아닌 다른 엔진을 쓰면, 웹사이트 호환성 문제랑 확장 프로그램 지원까지 엄청난 추가 작업이 필요함<br>우리도 단 2명의 스타트업이고, chromium 코드베이스가 빌드하기 훨씬 쉬운 출발점이라 선택함<br>그리고 Brave처럼 chromium 위에서도 충분히 프라이버시에 집중한 브라우저를 만들 수 있다는 점도 있음<br>특히 agentic browser 시대에선 프라이버시와 관련해 바로 개선할 수 있는 부분이 너무 많음——예를 들어 Perplexity Comet 같은 곳에 민감 데이터 보내는 건 광고 수익용이라서 정말 별로임, 로컬 LLM 지원하거나 사용자가 자기 API key를 쓸 수 있게 하는 것이 훨씬 중요함
    • 똑같은 의문을 가졌음<br>프라이버시 지향이라면서 chromium을 쓰는 이유가 뭔지 궁금함
  • "크롬의 C++ 소스코드를 직접 패치해서, Google Chrome과 동일한 보안을 얻고 있다"는 글을 봤음<br>그렇다면 Chromium이 업데이트될 때마다 매번 자체적으로 빌드를 다시 하는 것인지 궁금함, 왜냐면 가끔은 아무렇지 않은 commit 메시지로 보이는 패치가 실제론 심각한 취약점 관련이고, 90일 후 CVE로 공개되는 경우가 많기 때문임
    • 좋은 질문임, 우린 지금까지는 Google Chrome이 기반하는 Chromium 릴리즈 버전을 기반으로 계속 빌드를 진행하고 있음
  • 나는 이걸 독립 브라우저가 아니라, 브라우저 확장 프로그램 형태로 제공되면 더 좋겠음
    • 우리도 원래 브라우저 확장으로 만들고 싶었음<br>하지만 좋은 agent copilot을 만들려면 Chromium C++ 레벨에서 여러가지 변경이 필수라고 생각함, 예를 들어 모든 웹사이트의 접근성 트리를 Chromium이 가지고 있는데, 그걸 chrome extension API에서 못 불러옴, 접근성 트리에 직접 접근하면 agent 성능이 크게 향상됨<br>또한 click 동작이나 element 인덱스 등 agent가 웹사이트와 상호작용할 수 있는 여러 기능을 C++ 수준에서 추가하고 있음, 이런 걸 JS로 하면 20-40배 느림
    • 우리도 정확히 같은 생각임, agentic 기능을 구현하려면 꼭 브라우저 전체가 필요하지 않다고 생각함, 한정된 권한 내에서도 브라우저 확장만으로 충분히 구현할 수 있음<br>Google이 바로 배포하는 zero day 패치도 많고, Google이 Chromium에 넣지 않는 기능들도 분명 존재함, 그래서 내 주력 브라우저로선 무작위 오픈소스 포크는 신뢰하지 못하겠음<br>AI Web Agent 브라우저 확장 프로그램으로 rtrvr.ai(https://rtrvr.ai)를 추천함, 이미 사용자의 워크플로우에 맞게 구현되어 있음
    • nanobrowser가 여기서 언급될 때 나도 동일한 생각이 들었음
    • https://github.com/nanobrowser/nanobrowser 시도해볼 만함
  • 이건 chrome extension인 nanobrowser와 비슷한 프로젝트임 https://github.com/nanobrowser/nanobrowser
    • 프로젝트 페이지를 빠르게 훑어보니, 외부 LLM API 키를 사용하는 것 같음, 원래 글에서 소개한 이 프로젝트는 transformer.js를 사용해서 로컬에서 LLM이 돌아가는 형태로 보임
    • 이런 기능이 이미 확장 프로그램으로 구현 가능하다면 굳이 기존 소프트웨어를 포크해서 만드는 이유가 궁금함<br>nanobrowser와 browserOS 간에 확실하게 browserOS에서만 되고 nanobrowser에는 없는 기능이 있는지, 꼭 짚어야 할 차이점이 궁금함
    • 언급해줘서 고마움
  • "<i>우리는 Chrome이 uBlock Origin을 차단한 이후, LLM 기반 광고 차단기도 제작하고 있다</i>"는 말이 있는데, 어차피 Chromium 포크라면 uBlock Origin을 재사용하면 되는 것 아닌지 궁금함
    • Chromium이 Manifest V2 API를 없앨 예정이고, 어떤 포크도 이걸 계속 유지하고 싶어하지 않음, Brave조차 자체 내장 광고 차단기를 따로 만듦<br>진짜 의문은 '왜 Firefox를 포크하지 않고, Firefox가 다 해주는데도 굳이 Chromium을 택하는가'임
  • Linux용 로드맵이 궁금함, Mac이나 Windows가 없음
    • 이 부분 인지하고 있음, 다음 주 초에는 지원 가능하게 할 예정임<br>여전히 2인 팀이라 정말 할 일이 많음
  • AI가 마우스 커서를 직접 움직이고 클릭하며, 키 입력도 실시간으로 화면에 표시되는 모습을 보고 싶음, 마치 소프트웨어 튜토리얼처럼 실제 사람이 쓰는 듯한 인터랙션이 있었으면 좋겠음<br>지금처럼 AI가 페이지를 바꾸고 UI를 휙휙 바꿀 때는 화면이 툭툭 끊기는 느낌이라 흐름을 따라가기 힘듦<br>뭘 집중해서 봐야 할 지 힌트가 부족해서, 그냥 스크린레코딩을 보는 것 같은 느낌임<br>그래도 mcp/browser automation과 같은 분야에서 유용한 활용 사례가 있을 것 같아서, 앞으로 발전이 기대됨
    • 정말 유용한 피드백임, 고마움!<br>커서 움직임도 추가할 수 있는지 살펴볼 것임, 키 입력도 이미 실제 사람처럼 보이게 나오지만, 좀 더 천천히 보이도록 개선할 수 있을 것 같음
    • 정말 원하는 건 caretaker ai라고 생각함
  • 축하함!<br>이 프로젝트가 재무적, 개발적, 유지보수 측면에서 어떻게 지속가능하게 할 계획인지 궁금함
    • 고마움!<br>기본적으로 브라우저의 Enterprise 버전에 라이선스를 판매하는 방식으로 오픈소스 프로젝트들과 똑같이 갈 예정임
    • 내 추측엔 그냥 electron 앱 혹은 chromium wrapper에 ollama wrapper를 붙인 구조인 것 같음(브라우저를 제어할 수 있는 무료 오픈소스 라이브러리도 가득 있음)