# Cursor의 최신 ‘브라우저 실험’은 증거 없이 성공을 암시함

> Clean Markdown view of GeekNews topic #25896. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=25896](https://news.hada.io/topic?id=25896)
- GeekNews Markdown: [https://news.hada.io/topic/25896.md](https://news.hada.io/topic/25896.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-01-17T09:49:48+09:00
- Updated: 2026-01-17T09:49:48+09:00
- Original source: [embedding-shapes.github.io](https://embedding-shapes.github.io/cursor-implied-success-without-evidence/)
- Points: 5
- Comments: 5

## Summary

Cursor가 공개한 **‘자율 코딩 에이전트의 장기 실행 실험’** 은 실제 성과보다 가능성의 인상을 강조한 사례로 보입니다. 팀은 브라우저를 처음부터 만드는 목표 아래 100만 줄 이상의 코드를 생성했다고 밝혔지만, 공개된 저장소는 빌드조차 되지 않아 **작동 증거가 전무**합니다. 구체적 검증 없이 “의미 있는 진전”을 언급한 이번 발표는, 대규모 코드 생성을 넘어 **자율 에이전트의 신뢰성과 재현성**이 여전히 핵심 과제임을 보여줍니다.

## Topic Body

- Cursor는 **‘자율 코딩 에이전트’가 수주간 작동하는 실험**을 진행하며, 인간 팀이 수개월 걸리는 프로젝트를 자동화할 수 있는 지를 탐구했다고 발표함  
- 이 시스템을 검증하기 위해 **‘웹 브라우저를 처음부터 만드는’ 목표**를 설정하고, 에이전트들이 약 일주일간 100만 줄 이상의 코드를 작성했다고 주장  
- 그러나 공개된 **GitHub 저장소(fastrender)** 는 다수의 컴파일 오류와 CI 실패를 보이며, **실행 가능한 브라우저가 아님**이 확인됨  
- Cursor는 **작동 여부나 재현 가능한 데모, 빌드 가능한 커밋**을 제시하지 않았으며, 실험 결과의 구체적 성공 근거도 없음  
- 그럼에도 불구하고 Cursor는 **“에이전트가 대형 프로젝트에서 의미 있는 진전을 이뤘다”** 고 표현해, 실제 성능 검증 없이 성공적 인상을 남김  
  
---  
  
### Cursor의 블로그 실험 개요  
- 2026년 1월 14일 Cursor는 **“[Scaling long-running autonomous coding](https://news.hada.io/topic?id=25859)”** 이라는 블로그 글을 게시  
  - 목표는 “인간 팀이 수개월 걸리는 프로젝트를 자율 코딩 에이전트로 얼마나 멀리 확장할 수 있는가”를 탐구하는 것  
- 여러 접근법을 시도한 뒤, **“조정 문제를 해결하고 단일 에이전트 없이 대규모 프로젝트로 확장할 수 있는”** 시스템에 도달했다고 설명  
- 검증을 위해 **‘웹 브라우저를 처음부터 만드는’ 실험**을 수행, 에이전트들이 약 일주일간 1,000개 파일에 걸쳐 100만 줄 이상의 코드를 작성했다고 밝힘  
  - 소스코드는 GitHub 저장소 [wilsonzlin/fastrender](https://github.com/wilsonzlin/fastrender)에 공개  
  
### 실험 결과의 불명확성  
- Cursor는 “새로운 에이전트가 코드베이스를 이해하고 의미 있는 진전을 이뤘다”, “수백 명의 워커가 동시에 같은 브랜치에 푸시했다”고 주장  
  - 그러나 **브라우저가 실제로 작동하는지 여부는 명시하지 않음**  
- 게시글에는 **스크린샷 영상**이 포함되어 있으나, 실행 가능한 데모나 구체적 결과 설명은 없음  
- “브라우저를 처음부터 만드는 것은 매우 어렵다”는 문구 외에 **작동 증거는 제시되지 않음**  
  
### 코드베이스 검증 결과  
- 저장소를 직접 빌드하면 **‘fastrender’ 라이브러리 컴파일 실패(34개 오류, 94개 경고)** 가 발생  
- 최근 GitHub Actions 실행 결과에서도 **워크플로 오류와 다수의 컴파일 실패**가 확인됨  
  - 최근 100개의 커밋 중 **정상적으로 빌드된 커밋은 하나도 없음**  
- 코드 내부는 **의도나 구조가 없는 ‘AI slop’ 수준의 산출물**이라고 평가함  
  - `cargo build`나 `cargo check` 명령조차 실행되지 않은 것으로 보임  
  - 관련 이슈 [#98](https://github.com/wilsonzlin/fastrender/issues/98)도 현재 열려 있음  
  
### 재현성과 신뢰성 문제  
- Cursor의 블로그는 **실행 방법, 기대 결과, 작동 방식**에 대한 설명이 전혀 없음  
- **재현 가능한 데모, 빌드 지침, 검증된 커밋(tag/release/commit)** 이 제공되지 않음  
- 그럼에도 불구하고 글의 구성과 표현은 **“작동하는 프로토타입”** 처럼 보이게 함  
- Cursor는 “작동한다”고 명시하지 않았으므로 허위 진술은 아니지만, **성공을 암시하는 인상**을 남김  
  
### 결론 및 평가  
- Cursor는 “프로덕션 수준 브라우저”라고 주장하지 않았으나, **‘의미 있는 진전’과 ‘브라우저 구축’** 이라는 표현으로 **성공적 실험처럼 보이게 함**  
- 그러나 **작동 증거, 빌드 가능한 코드, 재현 가능한 결과**가 전혀 없음  
- “수백 명의 에이전트가 협업해 대형 프로젝트에서 진전을 이뤘다”는 주장은 **어떠한 증거도 없는 주장**임  
  - 최소한의 기준인 **“컴파일 가능하고 단순 HTML 파일을 렌더링할 수 있는 수준”** 조차 충족하지 못함  
- 결과적으로 Cursor의 실험은 **자율 코딩 확장의 가능성보다는, 대규모 코드 생성의 한계**를 드러낸 사례일뿐

## Comments


### Comment 49416

- Author: kimjoin2
- Created: 2026-01-18T14:43:55+09:00
- Points: 2

ㅋㅋㅋ

### Comment 49381

- Author: laeyoung
- Created: 2026-01-17T13:42:29+09:00
- Points: 2

관련 글 - https://news.hada.io/topic?id=25859

### Comment 49429

- Author: sinbumu
- Created: 2026-01-19T02:11:47+09:00
- Points: 1

사실 개발자들 아직 못짜른단걸 성공적으로 보여줬단거임~

### Comment 49419

- Author: jjw9512151
- Created: 2026-01-18T17:38:31+09:00
- Points: 1

성공적 결과 = 아직 우리 못짜른다고 경영진놈들아

### Comment 49375

- Author: neo
- Created: 2026-01-17T09:49:48+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=46646777) 
- 이번 주 실험이 결국 **Servo**(Rust 기반 브라우저)의 비작동 래퍼(wrapper) 수준이었다는 지적이 가장 위에 올라와야 함  
  관련 댓글은 [여기](https://news.ycombinator.com/item?id=46649046)에 있음
  - 누군가 인기 오픈소스 프로젝트를 **AI로 재작성**해본 적 있는지 궁금함  
    최신 LLM이라면 라이선스 세탁이나 의존성 표절에도 꽤 효과적일 수 있을 것 같음. 새로운 벤치마크로 흥미로울 듯함
  - 실제로 누군가 컴파일에 성공했다는 [트윗](https://xcancel.com/CanadaHonk/status/2011612084719796272#m)을 봤음
  - **부정적 결과**도 가치가 있음. 의도적으로 공개하면 존경스럽고, 실수로 드러나면 웃김  
    오늘의 엔터테인먼트를 제공한 Cursor에게 건배함
  - 처음엔 스크린샷 보고 잠깐 내 일자리가 위험하다고 느꼈음  
    그런데 엔진도 없고 완전히 깨진 상태라니, Cursor는 정말 **망신감**임

- Cursor의 [공식 블로그 글](https://cursor.com/blog/scaling-agents)은 꽤 **보수적인 어조**로 쓰였지만,  
  [트위터](https://x.com/mntruell/status/2011562190286045552)에서는 “GPT-5.2로 브라우저를 만들었다”는 식으로 과장된 인상을 줬음  
  실제로는 수천 개의 에이전트를 분리해 수주간 커밋을 쌓게 했지만, 결과물은 아직 작동하지 않음
  - “머지 충돌을 해결했다”는 표현은 별 의미 없음. ‘ours’나 ‘theirs’ 전략만 써도 항상 해결 가능함
  - 그렇다면 누군가는 실제로 실행에 성공했을까? 스크린샷은 어디서 나온 걸까? 코드엔 오류가 너무 많음
  - 링크 내용을 보면 브라우저가 작동한 것처럼 보이는데, 그게 어떻게 “보수적”이라는 건지 궁금함

- 나는 직접 확인해보려고 마지막 100개의 커밋에 대해 `cargo check`를 돌려봤음  
  결과는 전부 실패였음. [결과 로그](https://gist.github.com/embedding-shapes/f5d096dd10be44ff82b6e5ccdaf00b29) 참고  
  - 지금은 컴파일이 된다는 [새 댓글](https://news.ycombinator.com/item?id=46650998)이 있음  
  - 사실 스크린샷이 조작된 것일 수도 있음. **Occam의 면도날**로 보면 그게 가장 단순한 설명임

- 이런 홍보는 결국 **펀드레이징 전략**의 일환으로 보임  
  이전에도 내부 모델이 코드를 얼마나 작성했는지 등 모호한 포스트를 여러 번 올렸음  
  실질적인 내용이 없다는 뜻은 아니지만, 결과를 공개적으로 공유하지 않는 점은 아쉬움
  - 다른 모델 제공자들과 달리 **벤치마크를 공개하지 않는 점**이 늘 불만이었음  
    Cursor는 한때 화제였지만, 지금은 터미널 기반 에이전트가 대세임  
    우리 회사도 Cursor 계약을 종료하고 **Claude Code**로 바꾸려는 중임  
    아마 이번 브라우저 프로젝트는 다시 주목받기 위한 시도일 것임
  - 이런 식의 과장은 결국 **시장가치 부풀리기**일 뿐임. 정당화될 수 없음
  - 요즘은 모든 LLM 회사가 진실보다 **‘분위기 코드(vibe-coded)’ 마케팅**에 의존함  
    GPT-5 발표 때도 비슷했음. 실질적 발전은 둔화되고 있음
  - 예전엔 이런 과장이 싫었지만, 이제는 세상의 현실로 받아들이게 됨  
    결국 **신뢰보다는 검증**이 답임

- Cursor는 비슷한 실험으로 **Excel 클론**도 만들고 있음  
  [GitHub 저장소](https://github.com/wilson-anysphere/formula)에 따르면  
  16만 번의 워크플로 중 247번만 성공했고, 대부분은 예산 초과로 실패함  
  에이전트들은 그런 제약엔 전혀 신경 쓰지 않음

- 최신 커밋은 이제 빌드와 실행이 가능함 (적어도 Mac에서는)  
  하지만 여전히 **3백만 줄짜리 엉망 코드**임  
  Cursor 홍보 영상에 나온 페이지는 렌더링되지 않음. 아마 다른 빌드를 쓴 듯함
  - `cargo check`는 통과하지만, `git log`를 보면 뭔가 수상함  
    에이전트가 아니라 사람이 직접 수정한 흔적이 있음  
    [커밋 로그 분석](https://gist.github.com/embedding-shapes/d09225180ea3236f18039ca7a24b7ecb) 참고

- 원글은 단순히 **클릭 유도용 헤드라인**이었다고 생각함  
  “수천 개의 AI 에이전트가 브라우저를 만들었다”는 문구는 너무 자극적임
  - 이제 누군가 “AI가 브라우저를 만들었다”고 말할 때 이 사례를 링크할 수 있게 됨
  - 실제로 작동하지 않는 프로젝트들이 빠르게 뉴스 사이클을 돌고 있음  
    “가짜 뉴스”라는 말이 정치적으로 오염된 게 아쉬움. 이 분야엔 딱 맞는 표현임

- Cursor CEO는 “Rust로 **렌더링 엔진과 JS VM을 처음부터 만들었다**”고 주장했지만,  
  실제 [의존성 목록](https://github.com/wilsonzlin/fastrender/blob/main/Cargo.toml)을 보면  
  html5ever, cssparser, rquickjs 등 **Servo 기반 라이브러리**를 그대로 사용했음  
  결국 [Servo](https://github.com/servo/servo)를 감싼 수준이며, 컴파일조차 안 됨
  - 왜 굳이 CSS와 JS를 직접 구현했다고 주장했는지 이해가 안 됨  
    대부분의 사람은 코드만 봐도 바로 알 텐데, 아마도 **대중은 확인하지 않을 것**이라 생각한 듯함  
    이런 식으로 잘못된 인식이 퍼지고, 나중에 정정돼도 아무도 신경 쓰지 않음
  - 실제로는 Servo의 HTML/CSS 파서, QuickJS, resvg, egui, wgpu 등  
    기존 라이브러리로 구성되어 있음. 그게 3M 라인이라니 웃김
  - selectors, taffy도 포함되어 있고, 일부는 **구버전 의존성**을 사용 중임
  - JS 엔진은 개인 프로젝트를 vendor 폴더에 복사한 것일 뿐임  
    관련 내용은 [여기](https://news.ycombinator.com/item?id=46650998) 참고
  - 레이아웃 코드는 Servo의 것을 쓴 건지, Cursor가 직접 쓴 건지 궁금함  
    그 부분이 브라우저에서 가장 어려운 영역임

- 이런 **마케팅 접근법**은 오히려 자충수라고 생각함  
  Cursor의 디자인과 UX는 훌륭하지만, 깊이 있는 작업에서는 버그가 너무 많음  
  Claude 모델 추가로 조금 나아졌지만 여전히 **Antigravity**보다 못함  
  게다가 $20 구독 한도도 금방 소진됨. 모델이 10배 좋아지고 10배 싸질 가능성은 낮음
  - 여러 AI 회사의 버그투성이 앱을 써보며, 진짜 업무에는 여전히 **인간의 기술**이 필요하다는 걸 느낌  
    OpenAI의 비즈니스 모델이 광고 중심으로 변하는 걸 보면,  
    구글이 이 기술을 더 현실적으로 이해하고 있었다는 생각이 듦

- 이런 이야기들은 결국 **‘삽을 파는 사람들’** 을 위한 것임  
  잘 모르는 CEO가 이런 뉴스에 속아 실제 인력을 해고할 수도 있음