2P by GN⁺ 12일전 | ★ favorite | 댓글 1개
  • AI 앱을 MCP를 통해 브라우저에 연결하여 웹사이트에서 작업을 자동화할 수 있게 하는 도구
    • 예를 들어, 웹사이트에서 반복적으로 양식을 작성하는 작업을 자동화
  • 워크플로우 자동화: 작업 속도를 높이고 자동화하여 효율성을 향상
  • 자동화된 테스트: AI 편집기를 사용하여 코드의 엔드 투 엔드 테스트를 자동으로 수행. 사용자 흐름을 테스트하고 UI 요소를 검증하며 다양한 시나리오에서 애플리케이션이 예상대로 작동하는지 확인
  • 작업 자동화: 데이터 수집, 양식 작성, 워크플로우 자동화 등 반복적인 웹 기반 작업을 쉽게 자동화하여 시간 절약과 오류 감소를 도모

Browser MCP의 장점

  • 속도: 자동화가 로컬에서 이루어져 네트워크 지연 없이 성능이 향상됨.
  • 개인 정보 보호: 자동화가 로컬에서 이루어지므로 브라우저 활동이 기기에 남고 원격 서버로 전송되지 않음.
  • 로그인 유지: 기존 브라우저 프로필을 사용하여 모든 서비스에 로그인 상태를 유지함.
  • 은밀함: 실제 브라우저 지문을 사용하여 봇 탐지와 CAPTCHA를 피함.

사용 방법

  1. Browser MCP 확장 프로그램 설치: 브라우저에 Browser MCP 확장 프로그램을 추가함.
  2. MCP 서버 설정: AI 애플리케이션에 Browser MCP 서버를 추가하여 브라우저 확장 프로그램과 연결함.
  3. 자동화 시작: 자동화된 워크플로우를 생성하고 AI 도우미가 브라우저에서 반복 작업을 처리하도록 함.

브라우저 자동화 기능 도구

  • 탐색: URL로 이동
  • 뒤로 가기: 이전 페이지로 이동
  • 앞으로 가기: 다음 페이지로 이동
  • 대기: 지정된 시간(초) 동안 대기
  • 키 누르기: 키보드에서 키 누르기
  • 스냅샷: 현재 페이지의 접근성 스냅샷 캡처
  • 클릭: 웹 페이지에서 클릭 수행
  • 드래그 앤 드롭: 두 요소 간 드래그 앤 드롭 수행
  • 호버: 페이지의 요소 위에 마우스 오버
  • 텍스트 입력: 편집 가능한 요소에 텍스트 입력
  • 옵션 선택: 드롭다운에서 옵션 선택
  • 콘솔 로그 가져오기: 브라우저의 콘솔 로그 가져오기

호환 가능한 MCP AI 애플리케이션

  • Cursor
  • Claude
  • Windsurf
  • VSCode
Hacker News 의견
  • 웹사이트는 "실제 브라우저 지문을 사용하여 봇 탐지와 CAPTCHA를 피함"이라고 주장함

    • 비슷한 시스템을 사용해봤지만, AI가 브라우저를 제어하면서 CAPTCHA가 나타나고 여러 웹사이트에서 차단당한 경험이 있음
    • 브라우저 세션 사용을 중단하자 차단이 해제되었지만, 이런 방식은 만능 해결책이 아님
  • 이 시스템은 Microsoft의 Playwright-MCP의 구식 복제본처럼 보임

  • 쇼핑 웹사이트에서 특정 조건에 맞는 상품을 필터링할 수 있는 브라우저가 있으면 유용할 것 같음

  • MCP가 무엇인지 모르겠고, 이제는 물어보기도 두려움

  • 웹에서 정보를 검색하고 Google Sheets에 결과를 삽입하는 작업이 처음에는 거의 완벽하게 작동했지만, 이후 시도에서는 실패함

    • 브라우저와 MCP 앱 간의 지연 문제가 있는지 궁금함
    • 처음 시도에서는 빠르게 "이 채팅 허용" 권한을 클릭했지만, 이후 시도에서는 LLM이 클릭 문제를 보고함
    • Google 스프레드시트의 제목을 클릭하여 이름을 입력하는 작업이 처음에는 성공했지만, 이후 시도에서는 실패함
    • 셀 A1, B1 등을 식별하고 행에 삽입하는 작업도 처음에는 성공했지만, 이후 시도에서는 실패함
    • 첫 시도에서는 거의 완벽했지만, 이후 시도에서는 100% 재현 불가능함
    • 경험이 매끄럽고 설정 및 실행이 훌륭함
  • Claude Desktop에서 테스트했을 때 매끄럽게 작동했고, Playwright보다 덜 번거로웠음

    • 페이지에서 CAPTCHA를 감지하면 자동화를 일시 중지하고 사용자에게 알리는 기능이 있으면 좋겠음
    • Playwright는 CAPTCHA를 계속 시도함
  • Chrome 개발자 도구의 접근성 트리를 사용하여 페이지를 탐색할 수 있으면 좋겠음

  • 수동 작업, 특히 환급 요청 같은 작업에 대해 기대감이 생김

    • 매달 서비스 제공업체에 로그인하고 명세서를 다운로드하고, Google 문서를 작성하고, 이메일을 작성하고 파일을 업로드하는 작업이 번거로움
    • 자동화가 이미 가능하고, 실제 비용 추적 앱이 이 작업의 절반을 줄일 수 있음
    • AI 도구가 세부적인 사양을 제거할 잠재력이 있음
    • 이러한 워크플로우는 종종 작은 변경에 영향을 받음
  • MCP가 새로운 RPA(로봇 프로세스 자동화)인지 궁금함

  • 하드웨어 신스를 제어하여 물리적 노브를 만지지 않고 사운드 디자인을 할 수 있는 유사한 작업을 수행함