Anthropic, OpenAI를 제치고 가장 가치 있는 AI 스타트업이 됨
(qazinform.com)- Anthropic은 신규 투자 라운드 이후 평가액에서 OpenAI를 넘어 세계에서 가장 가치 있는 AI 스타트업이 됨
- Claude 개발사 Anthropic의 평가액은 1조 달러에 근접했으며, 2월 약 3,800억 달러에서 거의 3배 높아짐
- Series H 라운드에서 650억 달러를 유치했고 Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital이 주요 투자자로 참여함
- 성장 동력은 Claude AI 어시스턴트와 개발자들이 널리 쓰는 Claude Code이며, 연간 매출은 100억 달러에서 470억 달러로 증가함
- OpenAI는 3월 1,220억 달러 라운드 이후 8,520억 달러로 평가됐고, 양사 모두 공개 주식 공모를 검토 중임
평가액과 투자 유치
- Anthropic은 신규 투자 라운드 이후 시장 평가액에서 OpenAI를 넘어 세계에서 가장 가치 있는 AI 스타트업이 됨
- Claude AI 어시스턴트 개발사인 Anthropic의 평가액은 1조 달러에 근접함
- Anthropic은 Series H 투자 라운드에서 650억 달러를 유치함
- 주요 투자자는 Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital임
- 새 평가액은 2월 약 3,800억 달러보다 거의 3배 높음
- 투자 패키지에는 Amazon의 50억 달러를 포함해 이미 합의된 투자도 들어감
성장 요인과 경쟁 구도
- Anthropic의 성장 동력은 Claude AI 어시스턴트와 소프트웨어 개발자들이 널리 쓰는 Claude Code 서비스의 인기임
- 회사의 연간 매출은 약 100억 달러에서 470억 달러로 증가함
- Anthropic은 새 AI 모델 Claude Opus 4.8과 기업 고객을 위한 강화된 사이버보안 기능을 제공하는 폐쇄형 시스템 Claude Mythos Preview를 공개함
- Anthropic CFO Krishna Rao는 Claude 제품 수요가 전 세계에서 빠르게 계속 증가하고 있다고 밝힘
- OpenAI는 3월 1,220억 달러 투자 라운드 이후 8,520억 달러로 평가됨
- 대형 AI 기업들은 상장을 준비하고 있으며, CNBC에 따르면 OpenAI는 향후 몇 주 안에 IPO 신청을 할 수 있음
- Anthropic도 공개 주식 공모를 검토 중이지만 정확한 시점은 공개되지 않음
댓글과 토론
Hacker News 의견들
-
개발자들이 자신들은 마케팅에 휘둘리지 않는다고 다시는 말하지 않았으면 함. Claude만 다루는 모임도 자주 보이는데, 현대판 Tupperware 파티 같음
동료가 Claude가 더 낫다고 확신해서, Claude Code와 Codex 하네스를 써서 필요한 PR 몇 개를 gpt5.5와 opus4.7로 구현한 뒤 코드만 보고 어느 모델인지 맞혀보게 했지만 구분하지 못했음
여기 있는 99%도 결과가 모두 같은 모델에서 나온 5개 모델 테스트를 받으면 구분 못 할 것 같음. 결국 전부 느낌뿐임- PR 두 개만 보고 모델의 서명을 알아볼 거라고 기대하는 이유를 모르겠음. GPT-5.5와 Opus-4.8이 비슷하게 나온다는 수백 개 테스트 기반의 벤치마크가 이미 많은데, 그 테스트가 무엇을 검증하는지 이해하기 어려움
둘 다 구독해서 최대 추론으로 돌려보면 각 모델의 상대적 강점과 약점이 보임. 코드를 훑는 것만으로는 항상 드러나지 않고, 어떤 문제에서는 한쪽이 오래 헤매는 반면 다른 쪽은 코드베이스의 적절한 부분을 찾아 효율적인 해결책을 냄
antirez도 자신이 하던 최적화 작업에서는 GPT-5.5가 Opus보다 낫다고 했음. 반대로 GPT-5.5가 꾸준히 걸려 넘어지고 Opus가 더 빨리 푸는 작업군도 있음. 최근에는 둘 다 좋은 해법을 못 내는 코드도 다루고 있는데, 대규모 언어 모델이 원래 그런 식임
Claude 이야기가 더 많이 보였던 건 먼저 치고 나갔기 때문임. Codex는 한 발 늦었고 GPT도 처음에는 Opus에 못 미쳤음. 지금은 그 격차가 좁혀진 뒤에 테스트하는 셈임 - 이걸 Tupperware 파티라고 부르는 건 감정적으로 들림. 동등하다고 주장하려고 개발자에게 중요한 많은 요소를 의도적으로 무시하고, 실제 소프트웨어 제작 과정을 보지 않는 것 같음
그 테스트는 결과물만 보고 있고 생성 과정 전체를 무시함. Claude Code는 한동안 먼저 나왔고 더 좋았는데, 같은 결과물을 내는 도구로 굳이 왜 바꾸겠나 싶음
Claude Code는 에이전트형 소프트웨어 제작 과정에서 오래 앞서 있었고, 아직도 그 기능을 더 선호함. Opus 4.7은 큰 후퇴였다고 보며 Claude Code의 잦은 기능 변경 때문에 결과가 매일 나빠지는 느낌도 있음. 다만 내가 얼마나 적게 명시해도 괜찮은 결과가 나오는지 한계를 시험하고 있어서 구분이 어렵기도 함
이런 구체적인 현실을 전부 마케팅이라고 부르는 것 자체가, 지금까지 어떻게 왔고 앞으로 어디로 갈지를 보지 않은 채 Codex를 충분히 좋은 도구로 홍보하려는 것처럼 보임 - 개별 개발자에게 선택권이 얼마나 있는지 과대평가하는 것 같음. 회사가 Claude Code 멤버십을 계약했으니 Claude Code를 쓰고, Codex는 쓸 수 없음
직장에서 Claude Code 구독을 쓰는 사람들은 자주 듣지만, 직장 Codex 구독 얘기는 거의 못 들어본 것 같음. Anthropic은 OpenAI가 Sora 같은 소비자 제품을 쫓는 동안 기업 고객을 훨씬 잘 공략했음 - Vim으로 쓴 코드인지 VS Code로 쓴 코드인지 구분은 못 해도, 코드를 쓰는 사람에게는 큰 차이가 있음. 결과물 외의 요소도 도구 선택에 들어감
- 이게 늘 정말 재밌음. 사람이 실제로 얼마나 똑똑하든, 본인이 얼마나 똑똑하다고 생각하든 우리는 모두 영향에 취약하고 블라인드 테스트는 놀랄 만큼 쉽게 만들 수 있음
A와 B를 구분할 수 있다고 확신하나? 좋음, 해보면 됨. 고급 와인을 식탁에서 비교하든 에이전트를 비교하든 똑같음. 한 선택지를 써보고, 다른 선택지를 써보고, 어쩌면 전부 같은 선택지일 수도 있는데, 안정적으로 구분 못 하면 결국 우리 모두와 같은 사람이라는 뜻임
사후에는 알았다고 말하기 쉽지만, 진짜 차이는 블라인드 테스트에서 드러남. 아니면 드러나지 않음
- PR 두 개만 보고 모델의 서명을 알아볼 거라고 기대하는 이유를 모르겠음. GPT-5.5와 Opus-4.8이 비슷하게 나온다는 수백 개 테스트 기반의 벤치마크가 이미 많은데, 그 테스트가 무엇을 검증하는지 이해하기 어려움
-
Sam Altman은 별로인 사람이라고 생각하고, 내 돈은 다른 곳에 쓰고 싶음
최전선 모델의 상품화는 필연적임. OpenAI는 아직 기술로 경쟁한다고 생각하는 듯한데, 사용자 경험과 시장 평판으로 경쟁하고 있다는 걸 알았다면 Altman의 혼란이 계속 만드는 부정적 PR이 결국 모든 것을 잃게 만들 거라는 점도 이해했을 것임- Dario를 지지하는 게 더 낫다고 어떻게 말할 수 있는지 모르겠음
어떤 분야든 꼭대기에는 거의 괜찮은 사람이 없음. 그들은 진심으로 사용자를 신경 쓰지 않고 돈을 원할 뿐임 - Dario도 Sam만큼 나쁨
- Altman이 별로인 사람처럼 보이긴 하지만, Anthropic이 선한 쪽이라고 생각한다면 안 좋은 소식이 있음. 오히려 OpenAI보다 더 나쁠 수도 있음
- 지능이 상품화될 거라는 생각은 완전히 직관에 반함
그 생각은 지능이 우리를 넘어설 수 없다는 믿음에서 나오는데, 극한에서는 거의 확실히 틀렸음. 야생의 생명처럼 많은 초지능이 생길 가능성이 큼
- Dario를 지지하는 게 더 낫다고 어떻게 말할 수 있는지 모르겠음
-
이건 완전한 농담임
Anthropic은 잠깐 코드 중심으로 더 나았던 시기를 잘 활용했고, 그게 기업 계약으로 이어졌음
그런데 갱신 시점에 같은 기업들을 상대로 좌석에는 사용자가 합리적으로 필요로 하는 모든 사용량이 포함된다는 조건에서, 좌석 비용에 더해 모든 토큰을 API 가격으로 내는 방식으로 바꿔버렸음. 그 API 가격도 1년 동안 몇 번이나 올렸는지 모르겠음
Sonnet 3.5 시기의 호감과 기업 구매 지연 덕분에 사실상 인질 잡기로 매출이 미친 듯이 뛰었고, 그 매출 급증을 밸류에이션으로 연결한 셈임
같은 기업들은 청구서를 보고 충격받고 떠날 것임. 터무니없는 단기 사고방식임
OpenAI가 더 나은 회사라고 봄. 투명성, 오픈소스 공개, OpenClaw 같은 사안을 처리하는 방식, 경쟁 방식 등이 그렇고, 브랜드도 훨씬 강하며 소비자 접점도 더 좋고, 나와 많은 사람에게는 코딩 앱과 모델도 더 나음
Anthropic이 단기 매출 급등을 만들려고 반복해서 고객 적대적인 행동을 하는 건 장기적으로 지속 가능한 사업이 아님
이렇게 어린 회사가 이렇게 긴 미끼 상품식 전환 이력을 가진 건 정말 이상함. 가격 반복 인상, 속도 제한 반복 하향, 조건 변경, "OpenClaw"가 들어간 호출 차단, IDE 파트너와 기업 파트너를 등지는 행동까지 있었음
내가 보기엔 Anthropic을 믿어준 누구든 곧바로 어느 정도 이용당했음. 곧 AI 회사들의 Oracle이라는 평판을 얻게 될 것 같음
OpenAI의 절반 가치도 쳐주지 않겠음- 기업들은 이미 떠나고 있음. 청구서 충격도 있고, 개발자 정서가 Codex 쪽으로 옮겨가기 시작했기 때문임. 물론 한두 달 뒤에는 또 바람이 바뀔 것 같음
Claude Code가 이렇게 빨리 상품화되는 걸 보는 건 흥미로움
다만 OpenAI가 훨씬 더 나은 브랜드라는 데는 강하게 동의하지 않음. Anthropic은 두 회사 중 더 윤리적이고 인간적인 회사라는 브랜드를 꽤 성공적으로 만들었음. 실제로 그런지는 중요하지 않음 - 어느 정도는 동의하지 않음. 10월 Opus 4.5부터 에이전트형 개발에 대한 개발자 정서가 크게 바뀌었음. 많은 팀이 아주 최근부터 Anthropic에서 이전보다 훨씬 더 실질적인 가치를 보기 시작했음
OpenClaw 같은 것은 보안 위험 때문에 아직 진지한 기업 환경의 일부가 아님
좌석당 가격이 AI에서 절반이라도 viable하다고 믿는 이유를 모르겠음. 내가 아는 조직들은 API 가격으로 전환된 뒤에야, 어차피 얻는 가치가 크다고 보고 본격적으로 지출을 확정하기 시작한 편임 - 이 정도의 분노와 과장은 지나쳐 보임. Anthropic을 싫어하고 그 사업 관행에 동의하지 않을 수는 있지만, 인터넷 기준으로도 너무 과함
- Anthropic은 나에게 고객 적대적인 행동을 한 적이 없음
- 기업들은 이미 떠나고 있음. 청구서 충격도 있고, 개발자 정서가 Codex 쪽으로 옮겨가기 시작했기 때문임. 물론 한두 달 뒤에는 또 바람이 바뀔 것 같음
-
Sam Altman은 이제부터 OpenAI의 성공에 상당한 부채가 된 것처럼 보임. 지난 6개월 동안 Anthropic이 폭발적으로 성장한 동력 중 상당 부분은 사람들이 “Sam Altman이 운영하지 않는 그 AI 스타트업”이라고 인식한 데서 나온 듯함
Anthropic의 기술은 훌륭하지만, 지금 가장 큰 자산은 “OpenAI가 아니다”라는 점처럼 보임. 맞고 틀리고를 떠나, 지금 OpenAI를 붙잡는 요인인 건 분명함- 대부분의 사람들이 이걸 전혀 신경 쓰거나 알기나 하는지 모르겠음. ChatGPT는 여전히 소비자 시장과 브랜드 인지도에서 압도적으로 큼
Anthropic이 정말 잘한 건 기업 내부로 파고든 것임
지난 6개월 동안 기업의 일반 직원들이 Claude cowork를 엄청나게 받아들이는 걸 직접 봤음. 모두 자신에게 해주는 일에 진심으로 놀라고 있음
OpenAI는 더 Google 같은 회사가 되고 싶어 하는데, 여기서는 소비자 쪽이 그렇게 좋은 승부처가 아닐 수도 있어 보임 - 놀라운 건 Anthropic도 분명 성인은 아닌데 Altman이 그들을 좋은 쪽처럼 보이게 만들어 마케팅을 강화해준다는 점임
Anthropic이 Department of War와 아주 약한 조건을 두고 다퉜을 때, 진짜 도덕적인 AI 회사라면 애초에 전쟁범죄에 관여하지 않았겠지만, 그건 Altman에게 시험이었음. 같은 입장을 취하기만 하면 됐는데, 그가 사이코패스라서 그 기본적인 시험조차 실패했음 - Dario Amodei가 말하는 영상을 본 적 있는지 모르겠음. 둘 다 정말 싫지만, Dario는 부주의한 발언으로 사람들을 겁먹이는 걸 취미처럼 즐기는 듯하고 목소리도 Elizabeth Holmes 흉내처럼 들림
그가 말하거나 한 것 중 더 신뢰할 만한 사람처럼 보이게 하는 건 없었음
- 대부분의 사람들이 이걸 전혀 신경 쓰거나 알기나 하는지 모르겠음. ChatGPT는 여전히 소비자 시장과 브랜드 인지도에서 압도적으로 큼
-
OpenAI 모델이 Anthropic 모델보다 실질적으로 더 좋아도, Altman을 지지하고 싶지 않아서 쓰지 않을 것임
- Amodei는 다르다고 생각하나?
- 세상에서 어느 정도 권한을 갖고 있나? 사람들이 신경 쓰는 프로젝트나 누군가 의존하는 산출물이 있나?
네가 구매하는 API를 만들고 지원하는 사람들보다 7단계쯤 위에 있는 사람을 신경 쓸 여유가 어떻게 있는지 궁금함
-
어젯밤 아이들이 말다툼하는 걸 들었음. “우리 아빠는 엄청 커.” “우리 아빠는 집보다 커.” “아니, 우리 아빠는 롤러코스터보다 커.” “그래? 우리 아빠는 50km야.” “길다는 뜻이야?” “응, 우리 아빠는 너보다 길어.”
너무 웃겼음. 나는 컨디션 좋은 날에도 5피트 7인치 정도임. 밸류에이션도 이런 식으로 작동하는 느낌임. 우리는 5피트짜리 거인들을 떠받치고 있음 -
유니콘들이 로켓을 매단 채 서로만 보느라 지구가 이미 멀리 떠나버린 걸 깨닫지 못하는 모습임
그들은 우리 모두를 죽이거나 서로를 죽일 것임. 적어도 약속했던 것처럼 세상을 더 나은 곳으로 만들고 있지는 않음- Dario에게서는 “세상을 잿더미로 만든 뒤 더 나은 곳으로 만들게, 약속해” 같은 느낌이 강함
-
oAI와 Anthropic에 대해 gwern과 나눴던 대화를 다시 볼 좋은 시점임: https://news.ycombinator.com/item?id=40816755 그리고 대략 2년 전의 예측들임
결론적으로, 요즘은 시 전문성이 주된 초점은 아닌 듯하고 아마 전 세계에 해가 됐을 수도 있음. 학습 스케일링에서 “테스트 시간” 스케일링으로 넘어갔고, 개인적으로 그 이름은 싫음. Ilya는 필요하지 않았던 것 같지만, 그가 뭘 만들고 있는지는 정말 궁금함
깊이 내장되고, 매우 부유하며, 글로벌 인프라의 일부가 되는 쪽이 유리하다는 내 예측은 괜찮아 보임. oAI/MS가 2024년의 선두를 활용해 격차를 더 벌릴 거라는 제안은 틀렸음
코딩을 가치와 행동을 이끄는 제품으로 보는 이야기는 둘 다 많이 하지 않았는데, 그게 아주 흥미로움. 2024년 6월 당시에는 어떤 형태로든 진짜 역량을 보이기까지 아마 6개월쯤 남아 있었을 것임
둘 다 하나의 돌파 기업이 나오거나 나올 수 있다고 생각한 듯함. 나는 바스켓으로 사라고 제안하긴 했지만, GOOG, oAI, Anthropic 모두 지난 분기/연도에 상당한 매출을 올리면서 그건 분명 아니게 됨
2024년에는 초기 단계였지만 지금은 매우 가치 있다고 보게 된 Anthropic의 영역은 기계적 해석 가능성(mechinterp) 그룹임. 다른 연구소의 공개 작업 중 Anthropic에 거의 맞먹는 품질은 아직 못 봤음
그 그룹은 명확히 생산적인 시기로 들어섰고, 배를 조종하는 취향 결정자들이 쓰는 도구로서 진정 오래가는 전략적 우위를 줄 가능성이 꽤 있다고 봄. 2024년에는 해석 가능성이 거의 손댈 수 없는 문제처럼 보였지만, 지금은 꾸준히 조금씩 깎아가는 방식으로 훨씬 많은 게 가능해 보임- 기계적 해석 가능성 전반은 지금 완전히 저평가돼 있음. Anthropic 팀이 가장 엄밀한 작업을 하고 있다는 데 동의하고, 이제 Goodfire도 함께 있음
이들은 신경과학의 생체 내 사고 추적에 가장 가까운 일을 하고 있는데, 작업 주제로는 정말 거친 과학소설 같은 일임. 그런데도 보통 사람들은 이런 일이 벌어지고 있다는 걸 전혀 모르는 느낌임
“보편 부분공간 가설”이라는 논문에서 탐구된 아이디어와 결합하면, 공학에서 더 철학적이고 영적인 영역으로 가는 간극을 메우기 시작함. 하지만 이야기가 샜음
- 기계적 해석 가능성 전반은 지금 완전히 저평가돼 있음. Anthropic 팀이 가장 엄밀한 작업을 하고 있다는 데 동의하고, 이제 Goodfire도 함께 있음
-
Codex gtp-5.5는 대형 프로젝트에서 opus 4.7보다 훨씬 우월함
- gpt-5.x가 대형 프로젝트에서 잘하는 이유는 전용 apply_patch 프리미티브에 집중적으로 학습했기 때문이라고 강하게 봄
공식 apply_patch 구현은 잘 설계돼 있음. 변경 집합의 모든 파일이 모호하지 않을 때까지 실제 변경을 하지 않는 2단계 과정임. 커밋 전 오류 피드백은 보통 한두 번 추가 시도하면 앵커링 문제를 고침
대체로 “파일 A L1:154 읽기, 파일 B L1:123 읽기, 패치 적용 시도, A와 B 모두 앵커 오류, 파일 A L43:67 읽기, 파일 B L50:74 읽기, 패치 적용 시도, 패치 성공, 컴파일과 단위 테스트 실행” 같은 흐름임
이 구현에서는 문제가 발견된 현재 줄 번호도 반환하므로 앵커 오류 피드백이 엄청나게 도움이 됨
파일 전체를 교체하거나 찾기-바꾸기에 의존하는 기법은 더 고립된 맥락에서는 유용함. 하지만 파일 20개 이상을 리팩터링해야 한다면 apply_patch 같은 것이 필요함. 실제 교체 대상에 특정 줄 번호를 의존하는 방식은 복잡한 편집 시나리오에서 완전히 막다른 길임
https://developers.openai.com/api/docs/guides/tools-apply-pa... - 나도 같은 경험을 하고 있음. Codex gtp-5.5는 더 뛰어난 직관을 보이고 코드를 덜 쓰며, 수정해야 할 정확한 지점을 찾아냄
그래도 opus 4.7에서 4.8로 넘어오며 성격은 크게 개선됐음. 4.7은 너무 맞춰주는 편이었음 - GPT-5.5는 더 나은 프로그래머지만 Opus 4.8은 여전히 더 나은 시스템 설계자와 제품 디자이너임
Codex는 숲을 못 보고 나무만 보는 쪽에 가깝지만, 큰 코드베이스에서 대규모 변경을 성공적으로 수행하는 능력은 훨씬 좋음. Claude Code는 실수를 더 많이 하지만 취향이 더 좋고 관용적이고 우아한 소프트웨어 개발을 더 잘 이해함
여유가 된다면 둘 다 번갈아 쓰는 걸 추천함 - Codex/GPT의 문제는 너무 장황하다는 점임. 주로 JavaScript와 Python에서 헬퍼 함수가 많고, 한 곳에서만 쓰는 1~2줄 함수가 많고, 타입이나 프록시 비슷한 객체도 많음
이를 피하려고 특정 지시를 넣지만 그래도 시간의 절반은 그 장황함과 싸우는 데 씀
지금은 필요하다고 아는 함수/클래스를 NotImpelmented로 뼈대만 만들고, 그 특정 위치 안에서만 구현하라고 시키는 중임. 조금 나아졌지만 여전히 함수 안의 함수 정의와 싸워야 함 - 어떤 면에서 그런가? LM Arena의 코드 부문에서는 Opus 4.7이 1567 -/+ 7이고 GPT-5.5 Codex는 1505 -/+ 10임. 나는 현재 둘 다 쓰고 있음
최근 경험은 Opus, 이제 4.8 쪽으로 기울지만, GPT-5.5 Codex가 더 낫다는 얘기들이 흥미로워서 더 시험해보는 중임
- gpt-5.x가 대형 프로젝트에서 잘하는 이유는 전용 apply_patch 프리미티브에 집중적으로 학습했기 때문이라고 강하게 봄
-
이제는 회사들을 오가며 다음 반짝이는 릴리스를 쫓기보다, 자신이 쓰는 모델이 어떻게 작동하고 무엇을 할 수 있는지에 대한 탄탄한 작업 흐름과 이해를 갖는 게 더 중요하다고 봄
Codex로 첫 대형 프로젝트를 막 끝냈는데, Claude가 훨씬 더 좋을 수 있다고 믿기 어렵음. 조금 더 좋거나 나쁠 수는 있겠지만, 이제 모두 너무 좋아져서 차이를 만드는 건 사용자임- 이 업계에서 오래 일했다면 전혀 새롭지 않은 일임
예전부터 내 기술 선택이 네 기술 선택보다 나은지를 두고 이런 논쟁을 해왔음. 같은 성전이고 기술 종류만 다름
오늘의 조언도 10년, 20년, 30년 전과 같음. 자신에게 맞는 걸 골라 좋은 것을 만들면 됨
실제로 아무도 어떻게 만들었는지는 신경 쓰지 않음. 결과가 좋든 형편없든 그렇고, 형편없으면 도구 탓을 할 수는 있음 - Anthropic과 OpenAI 모두 현재 공급업체 종속을 만들 강한 유인이 있음. 특히 큰 사용자의 경우 회사 사이를 옮겨 다닐 수 있는 능력이 꽤 중요하다고 봄
지금은 어렵지 않아야 하지만, 앞으로는 훨씬 어려워질 수 있음
- 이 업계에서 오래 일했다면 전혀 새롭지 않은 일임