7P by GN⁺ 19시간전 | ★ favorite | 댓글 5개
  • AI 지능의 상품화가 가속되면서, 모든 기업이 최고 모델 경쟁에 뛰어든 사이 막대한 현금을 비축한 Apple이 오히려 유리한 위치를 확보
  • OpenAI는 $300B 밸류에이션에도 불구하고 Sora 서비스 중단, Stargate Texas 취소 등 수익 모델 없는 인프라 투자의 위험성이 현실화
  • 25억 대의 활성 기기와 온디바이스 처리 구조 덕분에 Apple은 개인 맥락 데이터와 프라이버시 중심 설계를 해자로 보유
  • 오픈 웨이트 모델 Gemma 4가 Claude Sonnet 4.5 Thinking과 동급 성능을 보이며, 노트북에서도 실행 가능한 수준으로 모델 격차가 급격히 축소
  • Apple Silicon의 통합 메모리 구조는 대형 모델의 로컬 실행을 가능하게 하며, MLX 프레임워크를 통해 생태계 확장 기반 형성
  • 전략이든 우연이든, Apple은 AI 시대에 최적화된 하드웨어·소프트웨어 기반 위에서 새로운 경쟁 우위를 확보한 상태

AI 경쟁에서 "패배"한 Apple의 ‘우연한 해자’

  • 지능이 상품화되는 추세에서, 기업들이 더 나은 모델을 만들수록 경쟁사 모델도 빠르게 따라잡는 구조 형성
    • 대규모 학습 투자로 이전 세대 모델의 비용이 낮아지고, 프론티어 모델과 오픈소스 모델 간 격차가 급속히 축소
    • Gemma4, Kimi K2.5, GLM 5.1 등 최신 오픈 모델이 개인 하드웨어에서도 충분히 작동 가능한 수준에 도달
    • 반면 OpenAI 등은 막대한 비용 구조와 불안정한 수익 모델로 인해 지속 가능성에 의문 제기
  • 이러한 변화는 ‘AI 패배자’로 불리던 Apple에 유리하게 작용
    • Apple은 Siri를 누구보다 먼저 보유했지만, ChatGPT 출시 이후 플래그십 프론티어 모델도 없고 $500B 규모의 컴퓨트 투자 약속도 없어 "AI 패배자"로 분류됨
    • 다른 AI 랩과 빅테크가 최신 벤치마크 1위를 차지하기 위해 막대한 자금을 소진하는 동안, Apple은 미사용 현금을 쌓으며 자사주 매입까지 확대하여 선택지를 넓힘

OpenAI의 과도한 지출과 리스크

  • OpenAI는 $300B 밸류에이션으로 자금을 조달한 뒤, Sora 비디오 서비스를 일일 비용 약 $15M 대비 수익 $2.1M으로 운영하다 결국 서비스를 중단
  • Disney는 Marvel, Pixar, Star Wars 캐릭터 콘텐츠 생성을 위해 Sora 3년 라이선스 계약을 체결하고 OpenAI에 $1B 지분 투자를 추진 중이었으나, Sora 중단으로 $1B 투자가 무산
  • 인프라 측면에서 OpenAI는 Samsung, SK Hynix와 월 최대 90만 장 DRAM 웨이퍼(글로벌 생산량의 약 40%)에 대한 비구속적 의향서를 체결
  • Micron은 이 수요 신호를 보고 29년 된 Crucial 소비자 메모리 브랜드를 폐쇄하고 AI 고객용으로 전환했으나, Stargate Texas가 취소되면서 수요가 사라지고 Micron 주가가 폭락
  • 벤치마크 성적이나 인프라 규모와 무관하게, 예상 수익의 작은 오차 하나로 게임에서 탈락할 수 있는 구조

지능에서 역량으로의 전환

  • AI 랩들의 핵심 가정은 원시 모델 역량(지능) 과 이를 운영할 인프라가 희소 자원으로 남을 것이라는 전제였으나, 덜 강력한 모델이 이전 프론티어 모델 수준으로 빠르게 성장 중
  • Google의 오픈 웨이트 모델 Gemma 4는 휴대폰에서 실행 가능하며, MMLU Pro에서 85.2% 를 기록하고 Arena 리더보드에서 Claude Sonnet 4.5 Thinking과 동급
    • 첫 주에 200만 다운로드 달성
    • 18개월 전 SOTA였던 모델이 이제 노트북에서 실행 가능하고 분기마다 성능 향상
  • AMD Ryzen AI Max+에서 Gemma 4를 직접 실행한 결과, 토큰/초 성능과 지능 수준이 뛰어나 개인 도구의 백엔드를 이 모델로 출력 품질 저하 없이 전환 완료
  • Anthropic은 이 흐름을 인지하고 Claude Code, Claude Cowork, Claude Managed Sessions 등 실용 도구를 빠르게 출시하여 사용자를 자사 생태계에 락인하는 전략 추진 중
    • 핵심 논리: 모델 자체가 해자가 되지 못하면, 사용 레이어를 장악하고 전환 비용을 높여야 함
    • 한 분석에 따르면 Max 요금제($200) 구독자가 $27,000 상당의 컴퓨트를 소비하는 구조로, 랩들이 수요를 보조금으로 유지하는 형태
  • Apple은 AI 인프라와 사용자 토큰 소비 보조에 거의 비용을 쓰지 않아, 다른 기업보다 더 큰 선택지와 레버리지를 확보

컨텍스트가 핵심 자원

  • 지능이 풍부해지면 컨텍스트가 희소 자원이 됨
    • 모든 것을 추론할 수 있지만 사용자에 대해 아무것도 모르는 모델은 범용 도구에 불과
    • AI가 일상에서 진정으로 유용하려면 추론 능력 + 개인 컨텍스트(메시지, 캘린더, 코드, 건강 데이터, 사진, 습관 등)가 필요
  • Apple은 25억 대 활성 기기를 통해 이 컨텍스트를 이미 보유
    • Apple Watch의 건강 데이터, iPhone 사진, 메모, 메시지, 위치 기록, 앱 행동, 이메일, 기기 센서를 통한 환경 인식
  • 온디바이스 처리를 통해 데이터를 기기 밖으로 내보내지 않으면서 모델에 전체 컨텍스트를 제공하는 구조가 가능
    • "Privacy. That's iPhone" 포지셔닝이 단순 PR이 아닌 핵심 가치 제안으로 전환 가능
    • OpenAI에 의료 기록과 15년치 사진을 넘기는 것과, 기기 내에서만 동작하는 모델에 접근을 허용하는 것은 근본적으로 다른 문제
  • Apple이 Google과 체결한 Gemini 딜($1B) 은 클라우드급 추론이 필요한 쿼리를 위한 것으로, OpenAI의 주간 컴퓨트 비용 대비 반올림 수준의 비용
    • Apple이 내부에 유지한 것: 컨텍스트 레이어, 온디바이스 스택, 모든 것을 중재하는 운영체제

Apple Silicon이 AI에 적합한 이유

  • OpenClaw 출시 이후 Mac Mini 열풍이 보여주듯, Apple Silicon은 AI용이 아닌 효율성·배터리·열 성능·하드웨어/소프트웨어 통합 설계용으로 개발되었지만, 로컬 모델 실행에 최적의 아키텍처로 판명
  • 핵심 설계: 통합 메모리(Unified Memory)
    • 기존 아키텍처는 CPU와 GPU가 별도 칩·별도 메모리 풀로 구성되어 데이터 이동이 느리고 전력 소모가 큼
    • Nvidia GPU는 행렬 연산에 빠르지만 PCIe 버스를 통한 CPU-GPU 간 데이터 전달이 병목
    • Apple M시리즈/A시리즈는 CPU, GPU, Neural Engine을 동일 다이에 배치하고 하나의 고대역 메모리 풀을 공유, 버스 교차·전송 오버헤드·레이턴시 없음
  • LLM 추론은 현재 컴퓨트가 아닌 메모리 대역폭에 병목이 있음
    • 핵심은 모델 가중치를 메모리에서 연산 유닛으로 스트리밍하는 속도와, KV 캐시를 저장할 메모리 크기
    • Apple의 통합 메모리 풀은 모든 연산 유닛에 동시에 고대역 직접 접근을 제공
  • LLM in a Flash 기법이 Apple 하드웨어에서 특히 효과적
    • M3 Max Mac에서 Qwen 397B(209GB 모델)를 활성 RAM 5.5GB만으로 ~5.7 토큰/초에 실행한 사례
    • 가중치는 SSD에 저장되어 ~17.5 GB/s로 스트리밍, MoE(Mixture-of-Experts) 아키텍처 덕분에 각 토큰이 전문가 레이어의 일부만 활성화
    • 이 실행을 위한 ~5,000줄의 Objective-C와 Metal 셰이더를 Claude가 작성

플랫폼 다이내믹과 App Store 유비

  • App Store처럼 Apple이 앱을 만든 것이 아니라 앱이 가장 잘 실행되는 플랫폼을 구축하고 생태계가 따라온 구조
    • 개발자는 Apple이 요청해서가 아니라, 사용자 기반·도구·일관된 하드웨어 때문에 iOS를 타겟
  • 로컬 추론에서도 동일한 현상이 발생할 가능성
    • MLX가 이미 온디바이스 AI의 사실상 표준 프레임워크로 부상
    • Gemma, Qwen, Mistral 등 주요 모델 아키텍처가 MLX를 지원
    • Apple이 모델 경쟁에서 이기지 않더라도 모델(또는 에이전트)이 실행되는 사실상의 플랫폼이 될 수 있음
    • OpenClaw 바이럴 이후 Mac Mini 열풍이 이 가능성을 보여주는 사례

전략인가, 행운인가

  • Apple의 하드웨어/소프트웨어 통합 설계 전략은 수년간 핵심 초점이었으며, 프라이버시 포지셔닝, 온디바이스 처리 집중, 업계가 Nvidia·Intel에 의존할 때 자체 실리콘 개발 결정 모두 상업적으로 위험한 선택이었음
    • 이 결정들은 AI가 아닌 비용과 거버넌스를 위해 내려졌지만, 결과적으로 AI 시대에 유리하게 작용
  • Apple이 예측하지 못했을 수 있는 것:
    • 통합 메모리 아키텍처가 LLM에 완벽히 적합한 점
    • 오픈 웨이트 모델이 이토록 빠르게 발전한 점
    • 400B 파라미터 모델을 SSD에서 스트리밍하는 것이 실제로 작동하는 점
  • 일부는 행운이지만, 올바른 기반을 구축한 기업에게 찾아오는 종류의 행운
  • 나머지 업계가 3년간 최고 모델 경쟁에 매진하는 동안, Apple은 사이드라인에서 자사 기기와 생태계가 이 미래에 어떻게 맞아들어갈지 관망
  • Siri의 한계 등 불완전한 부분은 남아 있으나
    • 25억 대 기기, 전체 개인 컨텍스트, 전용 실리콘에서의 로컬 모델 실행, 고난이도 쿼리를 위한 Gemini 온콜
    • 고정 CAPEX가 아닌 변동 비용 기반 추론 구조가 AI 보편화 시대에 불리한 포지션이라고 보기 어려움
  • 결론적으로, Apple은 AI 중심 미래에서도 여전히 중요한 위치를 차지할 가능성이 있음
    • 전략이든 우연이든, 올바른 기반 위에 서 있다는 점이 핵심

좀 개소리인게
지금 AI 모델 기업들이 출혈 경쟁을 하고 있으니까
아무것도 안한 애플이 개이득이지 않냐는 소리인데

그거야 지금 LLM모델 과도 경쟁 흐름이니 그런거고
AI의 모델이 안정화/성장 단계에 있다면 메타가 미쳤다고 젬마를 공개하겠습니까

그동안 모델을 개발하고 운영한 노하우가 금이 되고 다이아몬드가 되는거지

메타 -> 구글

애플 지출보면 가만히 있지는 않더라구요. 피지컬 ai 달성하기 좋은 기업이긴하죠.. 엔비디아도 결국 피지컬로 가기도하고.. 다 갖고 있는 구글이 대단한거죠

그것보다는 개인화 데이터가 결국 차기 AI 시대에 있어서 중요한 해자가 될거고, 그걸 애플은 이미 가지고 있으니 유리한 포지션이 될거라는 이야기가 아닐까 합니다

애플아 MLX 화이팅

Hacker News 의견들
  • 내 생각에 Gemma4는 코드 관련 도움이나 오류 제안 같은 건 잘하지만, 복잡한 도구 활용이나 전문가 수준의 맥락 이해는 부족함
    만약 몇 번 더 개선돼서 Gemma6쯤 되면 지금의 Opus 수준으로 Mac에서 완전히 로컬로 돌아간다면, 클라우드 모델은 굳이 쓸 이유가 없을 것 같음

    • 나도 비슷하게 느꼈음. 초반엔 Gemma4가 Qwen3.5보다 코딩 에이전트와의 호환이 떨어져서 실망했지만, 다른 용도에서는 꽤 괜찮았음
      방금 Ollama 0.20.6에서 Gemma4의 툴 호출 기능이 개선됐다는 소식을 봤음. 아침 먹고 다시 테스트해볼 예정임
    • “640k면 충분하다”는 옛날 말이 떠오르는 비슷한 분위기
    • 경제는 결국 경쟁임. 누군가 좋은 도끼를 얻어 만족할 수는 있지만, 다른 사람들은 불도저를 몰고 있음. 도끼로 행복하다고 해도 그건 경쟁에서 벗어난 상태임
    • 나만 그런 게 아니었군. Gemma4의 품질은 인상적이었지만, opencode와 함께 쓸 때 파일에 변경사항을 제대로 기록하지 못하는 경우가 10번 중 9번이었음
    • 솔직히 지금은 고성능 작업에 로컬 모델이 꼭 필요한 건 아님. OpenRouter 같은 곳에서 다양한 오픈 모델을 쓸 수 있고, 이들은 이미 SOTA에 근접한 수준임
      여러 제공자가 같은 모델을 서비스하며 가격·성능 경쟁을 하니 독점 위험도 줄어듦
      내 기기엔 Gemma가 있어서 개인 대화나 비프로그래밍 작업은 완전히 오프라인으로 처리 가능함
      이런 상황에서 OpenAI나 Anthropic이라면 고객 락인을 위해 별의별 비윤리적 꼼수를 쓸지도 모르겠지만, 결국 통하지 않을 것임
  • OpenAI의 기업가치는 AI가 검색처럼 작동할 거라는 전제에서 출발했다고 봄
    하지만 검색은 사용자가 쿼리를 던질수록 제품이 개선되는 구조였고, Google은 오랫동안 진짜 최고 제품이었음
    반면 AI는 학습과 추론이 분리돼 있고, OpenAI는 내부 분열 이후 경쟁자들이 빠르게 따라잡음
    이제는 수십억 달러를 쏟아부어야만 경쟁 가능한 소모전이 되었고, 모델 간 격차가 줄어들수록 배포력이 승부를 가름함
    Google, Meta, MSFT, Amazon은 가능하지만 OpenAI는 자금력이 부족함

    • OpenAI의 가치는 단순히 검색 대체가 아니라, 웹 전반의 플랫폼화 가능성에 있음
      기업 자동화와 소셜미디어 대체까지 아우를 수 있다는 기대가 컸고, 여기에 AGI의 가능성이라는 불확실한 미래 가치가 더해졌음
      Sam Altman의 역할은 이런 기대를 부풀려 투자 가치를 극대화하는 것임
    • 2000년대 초엔 Google에 맞설 자금과 인력이 없었지만, 지금은 AI 경쟁이 활발해져 사용자 입장에선 비용 절감과 빠른 발전이라는 순이익이 생김
    • 내 생각도 비슷함. 결국 Google은 버티고, OpenAI와 Anthropic은 자금난으로 MSFT나 Amazon에 흡수될 가능성이 큼
      Apple이 Google과 제휴한 것도 같은 흐름으로 보임
    • Google이 검색 품질을 스스로 망친 것이 아쉬움. + 연산자 제거나 정치적 검열 같은 결정은 이해하기 어려움
    • 실제 검색에서는 모델을 새로 만드는 것보다 RAG 기반 데이터 큐레이션이 더 효율적일 것 같음
  • Apple은 항상 ‘기다렸다가 도약하는 전략’ 을 써왔음
    다른 회사들이 시행착오를 겪는 동안 기술의 한계를 파악하고, 완성도 높은 제품으로 시장을 선도함

    • 맞음. 이번에도 ‘Apple Intelligence’를 발표해 시장을 안심시켰지만, 과도한 투자 없이 신중하게 접근함
      몇 년 뒤 진짜 완성도 높은 제품을 내놓을 가능성이 큼
    • 이미 온디바이스 OCR과 복사/붙여넣기 같은 기능에서 조용히 진보를 보여주고 있음
    • Newton, Pippin, Vision Pro 같은 사례를 보면 Apple의 실험적 시도가 반복되는 패턴임
    • 2007년 아이폰 이후로 진짜 ‘도약형’ 제품이 있었는지 모르겠음. 워치는 그나마 근접했지만 확실하진 않음
    • 부모님은 Android로 “사진 속 사람 지우기” 같은 걸 하는데, 내 iPhone은 아직 “Siri, 스톱워치 시작해줘” 수준임
      그래도 Google에 개인정보를 맡기기 싫어서 iPhone을 씀
  • Apple은 투자자용 챗봇 쇼케이스가 아니라, 소비자 하드웨어 중심의 회사임
    iPhone과 향후 AR 글래스가 핵심이며, 이를 위해 필요한 온디바이스 머신러닝이 칩 설계의 이유임
    OpenAI 같은 경쟁 제품을 만들 이유가 없음

    • FY25 기준으로 Apple 매출의 약 25%가 서비스, 50%가 iPhone, 나머지가 하드웨어임. 서비스만으로도 약 1,000억 달러 규모임
    • AR 글래스는 메인 베팅이라기보다 연구용 혹은 보험용 프로젝트에 가까움
    • 사람들은 iPhone을 원한다기보다 iMessage에서 배제되지 않기 위해 쓰는 경우도 많음
  • 다른 기업들이 VR을 포기하고 AI로 전환할 때, Apple은 반대로 VR 헤드셋을 내놓은 게 이해가 안 됐음
    비싼 가격, 개발자 부족, AI 진입 지연까지 겹침

    • Apple은 항상 늦게 진입하지만, 가격을 낮출 조건을 만드는 중일 수도 있음
    • 기술적으로 뒤처지지 않기 위한 체크포인트 전략으로 봄. 특허 회피와 브랜드 방어를 위한 기반 다지기임
    • 하드웨어는 성숙에 시간이 걸림. Apple은 2015~18년부터 프로토타입을 만들었을 가능성이 큼
      AR 글래스가 제대로 구현되면 거대한 플랫폼이 될 것이고, Meta가 실패한 뒤에 Apple이 등장할 타이밍을 노리는 듯함
  • 모든 게 로컬에서 실행된다는 점이 가장 좋음. 데이터가 외부로 빠져나가지 않음
    창작자들도 Apple AI에는 더 호의적일 것 같음. 윤리적 학습 데이터를 쓰고, 구독료 없이 개인 소유처럼 느껴지기 때문임

    • 왜 창작자들이 AI를 그렇게 혐오한다고 생각하는지 궁금함
  • Sequoia 이후로 Siri를 꺼놨는데, Apple이 다시 켜라고 강요하지 않는 점이 마음에 듦
    반면 JIRA나 Slack은 매번 새 AI 기능을 띄워 귀찮음

    • 기업들이 새 기능을 소음처럼 밀어붙이는 태도가 싫음. 하지만 유료 제품에 광고를 넣는 건 더 싫음
      Apple조차 App Store에서 스폰서 광고를 최상단에 노출하는 건 선을 넘은 느낌임
      Android에선 F-Droid 같은 대안이 있지만, iOS는 피하기 어려움
    • 이런 이유로 Google Maps를 삭제했음. AI 생성 요약이 리뷰를 가려서 불편함
      Amazon, Uber, Google Workspace 등도 비슷하게 AI를 강제함
    • Apple이 Tahoe 업데이트를 계속 강요하는 게 더 짜증남.
      내가 원하는 건 단순한 Sequoia 패치인데, 항상 Tahoe가 기본 선택됨
      심지어 Xcode의 Claude Code 통합도 Tahoe 전용이라 불합리함
  • MacBook Neo를 지금 시점에 내놓은 건 훌륭한 전략임
    AI 경쟁을 지켜보는 동안, 차세대 사용자를 Apple 생태계에 묶어두는 효과가 있음
    Neo는 이번 세대의 iPod 같은 존재로 느껴짐

    • 하지만 Neo의 진짜 경쟁자는 OpenAI의 가상 기기가 아니라, Chromebook과 Windows 노트북
  • Nvidia가 게이머용 GPU를 데이터센터에서 못 쓰게 제한하는데,
    Apple이 로컬 AI 시장을 위협하면 소비자용 AI 카드를 따로 내놓을 수도 있음
    같은 칩을 용도에 따라 가격 차등 판매하는 미래가 올지도 모름

    • Forbes 기사에 따르면 Nvidia-Mediatek의 Arm 기반 노트북이 2026년 상반기에 공개될 예정임
      NPU 성능이 Intel·AMD를 능가하고, RTX 5070급 GPU를 얇은 폼팩터에 통합할 수 있다면 게이밍 노트북의 구조 자체가 바뀔 것
    • GPU의 프로용·소비자용 분리는 예전부터 있었음
    • Intel 등 다른 회사도 비슷한 제한을 둠. 하지만 GPU 가격은 메모리 용량과 대역폭이 큰 변수임
      소비자용은 싸지만 메모리가 적고 느림
    • 결국 소비자 호감과 수익 극대화를 동시에 노리는 전략임
  • Apple은 LLM 경쟁에 뛰어들지 않았음. 그들의 강점은 인간 중심 설계
    iPod도 첫 MP3 플레이어가 아니었고, iPhone도 3G가 없었지만 성공했음
    Apple은 에너지 효율과 통합 메모리 구조에 집중해왔고, 이는 AR 글래스 같은 미래 제품을 염두에 둔 설계임
    NVidia나 Intel이 혼자선 못 하는 일을 Apple은 칩·메모리·SSD까지 통합 설계로 준비해왔음
    과거 64비트 ARM을 도입했을 때처럼, 지금도 많은 사람이 그 의미를 과소평가함
    NVidia GPU가 성능은 2~3배 높지만 전력 소모는 10배임
    Apple은 가격 대비 효율로 승부하며, 로컬 LLM이 필요한 즉시·개인·프라이버시 중심의 사용에 최적화돼 있음