1P by GN⁺ 7일전 | ★ favorite | 댓글 1개
  • OpenAI는 ChatGPT 내에서 동작하는 앱을 개발할 수 있도록 지원하는 프레임워크인 Apps SDK를 공개함
  • 개발자들이 이 SDK를 활용해 ChatGPT내에서 동작하는 새로운 앱을 만들고, 실험적 기능을 자유롭게 테스트할 수 있는 환경 제공
  • Apps SDK는 현재 프리뷰(미리보기) 버전으로 제공되며, 앱 제출 및 공식 배포는 이번 연도 후반에 진행 예정
  • 이 프레임워크는 ChatGPT 플랫폼의 확장성과 맞춤형 앱 개발 기회를 열어, 다양한 소프트웨어와 서비스의 연동 및 자동화가 가능해질 전망임
  • 개발 생태계 확대를 통해 생산성 향상과 혁신적인 서비스 창출이 촉진될 것으로 기대됨
Hacker News 의견
  • ChatGPT가 점점 더 웹 탐색의 출발점이 되어감이 흥미로움, 이제는 검색조차 굳이 하지 않고 기본적인 지도, Stripe 결제, 항공권 예약 등 워크플로우가 제공될 것이며, 사람들이 일상적으로 하는 대부분의 일상적인 작업이 커버됨
    과거 2년 간 이런 진전의 가장 큰 병목은 모델이 아니라 엔지니어링, 인프라, 그리고 기업들이 OpenAI와 직접 협업하려는 의지였음
    이제 OpenAI가 성장하고 사용자 기반이 커지면서 기업들은 훨씬 적극적으로 투자하거나 참여하려 함
    이런 변화는 사용자 중심의 인터넷 사용뿐 아니라 SDK 기반의 더 많은 도구가 생기면, 인간의 워크플로우가 챗봇을 통해 흐르는 트래픽과, SEO 최적화 및 챗/에이전트에 맞춘 새로운 웹으로 갈라지는 결과도 가져올 것임

    • 나처럼 AI를 사용하고 싶지 않은 사람도 많을 것 같음
      특히 항공권 구매에서는 AI가 실수할 거라는 불신 때문이 아니라, 내가 주도적으로 처리하고 싶기 때문임
      비유하자면, 운전이 비행보다 위험함을 알아도 운전이 더 안전하게 느껴지는 이유와 같음
      결국 내 통제권이 중요한 이유임

    • 왜 굳이 챗박스 안에서 억지로 앱을 띄우고 이상한 형식으로 보여준 뒤, 결국 진짜 앱으로 링크를 거는지 모르겠음
      차라리 앱 안에 챗박스를 넣는 게 표준적인 방식임

    • 한 기업이 인터넷 사용 전체를 통제, 필터, 관리하는 상황이 온다면 인터넷의 의미가 사라진다고 생각함
      물론 구글도 비슷하다는 주장은 이해하지만, 적어도 구글 검색을 통해 실제 사이트로 갈 수는 있음
      ChatGPT를 통해 일종의 '전화 게임'처럼 주고받는 구조는 너무 끔찍함

    • 음성 비서로 구매를 맡길 생각이 전혀 없듯, 중요한 결정을 LLM에게 맡기는 건 절대 불가임
      내 신용카드 결제권은 물론이고, 비행기 예약까지 맡긴다는 건 상상도 못함

    • OpenAI는 사용자가 폭발적으로 늘었을 때부터 이런 기회를 가졌지만, 실제로는 플러그인과 GPTs로 제대로 못 살렸다고 봄
      아이러니하게도 Anthropic의 MCP가 이 분야의 게임 체인저가 될 수 있음

  • ChatGPT가 미래의 범용 사용자 인터페이스가 될 거라는 믿음 하에서는 이런 구상이 그럴듯하게 보임
    하지만 실제로는 요즘의 에이전트 트렌드가 오히려 챗 인터페이스를 더 엄격한 UI 패러다임 뒤에 숨기는 게 낫다는 점을 보여줌

    • 챗이 훌륭한 인터페이스일 수 있는 영역이 아주 많다고 생각함
      ChatGPT가 이런 영역의 배포자가 되면 구글을 대체할 수 있음
      그래도 특정 도메인에 있어서는 맞춤형 인터페이스가 옳은 접근이고, 그 분야가 충분히 가치 있으면 전용 인터페이스를 만드는 사람이 반드시 등장할 것임

    • 요즘 에이전트의 주된 활용 예시는 코드 생성이고, 타깃 사용자는 IDE나 코드 에디터에 익숙함
      토큰 사용량의 큰 비중을 차지하지만, 이게 일반 사용자들의 니즈나 바람을 대표하지 않음
      채팅 인터페이스가 이렇게 보편화된 건 그 자체의 장점이 있기 때문이라고 확신함
      일반적인 에이전트 활용에 있어서도 채팅은 타이핑이나 음성 입력의 편리함을 줌
      오디오-오디오나 비디오 활용도도 쉽게 결합됨
      앞으로 영상 생성이 실시간으로 가능해져도, 대부분 결과는 텍스트로 소비할 것이 더 편함

    • 사람들이 chatGPT에게 Zillow나 Canva에 대신 문의해달라고 시키고 싶어하지 않을 거라고 생각함
      Zillow의 집값을 조회하거나 Canva로 그래픽을 만드는 의뢰 정도는 하겠지만, 특정 앱 자체를 호출할 필요까지는 느끼지 않음
      결국 앱들이 챗GPT에 의존해 사용자를 넘기다 보면, 챗GPT가 직접 기능을 제공하고 앱을 대체할 수밖에 없음
      즉, 챗이 만능 인터페이스라는 생각으로 자신의 서비스를 챗GPT에 노출하면, 스스로의 생존을 어렵게 하는 꼴임

    • 보이스 인터페이스와 챗이 정말 좋은 조합이라고 생각함, 예를 들어 걸으면서 음성으로 외국어 레슨 또는 웹검색을 할 때 매우 유용함
      NotebookLM 같은 노트 앱 형태도 일주일에 한두 번은 써봄
      작은 오픈 모델을 더 큰 시스템에 붙여서 구조적 데이터 추출에 활용하는 등 많은 실험이 가능함
      현재의 agentic 시스템(MCP 등)의 실질적인 유용성에는 회의적임
      그래도 오늘 AGI 얘기가 안 나와서 다행임
      ASI, AGI 환상에 FOMO로 매달리면 파산만 남을 수도 있음

    • 미래의 인터페이스는 데이터셋으로 학습된 기능이 하드웨어에 내장된 로컬 AI임
      EE이자 에너지 모델 분야에서 일하면서, 오실로스코프의 기하학적 특성을 떠올리면, 방정식이 그 구조를 복원 가능함
      사용자는 파라미터 UI로 손쉽게 원하는 결과를 얻을 수 있음
      현 시대의 OS는 문자열 가공용 가상 머신이지만, 미래는 좌표를 조작하는 벡터 가상 머신이 될 것임
      메모리 행렬과 디스플레이 행렬의 동기화로 단순화시켜서, 앞으로는 개발자가 구식 문자열 처리에서 벗어나게 될 것임

  • 막상 실물을 보면 생각보다 혁신적이지 않음
    "앱"들이 사실상 MCP 서버일 뿐이고, HTML 반환 가능하다는 옵션만 다름
    MCP의 근본적 문제 즉, 싱글플레이어적이고, 사용자가 항상 "가져오도록(pull)" 해야 하며, 앱을 여는 것보다 연결 구조가 직관적이지 않음
    이상적으로는 앱마다 고유 진입점이 있고, 사용자에게 푸시 알림도 보내고, UI에서 지속성도 있어야 함
    주요 인터페이스 역시 채팅이 아니라 HTML이 되어야 함
    지금 상황은 GPTs와 비슷한 결말이 날 것으로 예상함

    • MCP에는 "elicitation"이라는 스펙이 이미 있음, 이 기능 덕분에 OpenAI가 푸시 방식의 상호작용을 곧 지원할 수 있는 토대를 닦는 중이라고 봄
      서비스가 능동적으로 사용자와 LLM을 지속적으로 엮으면, MCP 서버는 정말 강력한 접착력을 가지게 됨
      설치/인증 과정도 비전문가를 위한 요구에 따라 점점 손쉬워질 것임
  • Phind 2를 만들 때 답변에 동적 위젯을 직접 삽입했던 기억이 나서 흥미로움
    이 방식의 약점은 앱/위젯의 입력과 출력 스키마가 하드코딩되어 있다는 것임
    위젯의 범위 안에 들면 매우 잘 동작하지만, Zillow에서 특수한 고급 필터링을 쓰거나 StreetEasy와 연동하고 싶으면 곧 한계를 체감함
    이제 사용자 입장에서 고급 기능이 빠져있으면, 그냥 못 쓰는 상황임
    진짜 혁신적이라고 생각하는 건, '즉석에서 생성되는 UI'임
    곧 Phind에서 이 부분에 대한 업데이트가 있을 예정임 (나는 Phind의 창업자임)

    • Phind 진짜 좋음
      옛날에는 엉뚱한 검색 결과만 던지는 구글 같은 기존 검색엔진에 지쳤을 때 Phind로 금방 원하는 정보를 찾곤 했음
      하지만 최근에는 LLM 자체가 검색도 잘해줘서 요즘에는 LLM만 써옴

    • 기존 MCP-UI 프로젝트가 이미 있는 걸 보면 가능한 건 놀랍지 않음
      그런데 여전히 실제 사용하기엔 속도가 너무 느려서 개선 필요성 느낌

    • 나도 비슷한 걸 우리 제품에 만들까 고민 중이고, 스키마 제약에 대한 해결책으로 위젯을 최대한 범용 블록으로 설계해서 활용성 높이는 방법을 고민함
      아직 아이디어 단계지만, 모델이 여러 모듈형 위젯 중에서 과제에 맞게 조합해서 골라 쓰게 하면 어떨까 생각함
      예를 들어 검색 결과를 단일 항목, 매트릭스 형태 비교, 필터링 섹션 등으로 쪼개고, 그 맥락을 바꿔가며 세션 내에서 여러 방식으로 다룰 수 있도록 연구 중임
      Phind에서 실제로 이런 경험에 대해 쓴 글이 있으면 참고하고 싶음

    • 이런 한계는 챗과 사전제작 혹은 온디맨드 위젯이 함께 붙으면서 해결된다고 봄
      키노트 데모에서 챗 인터페이스로 Zillow의 집 중 애견 공원 근처만 필터링하는 식의 고급 필터링이 여러 소스에서 정보 종합해서 가능했음

    • MCP로 이 문제는 해결 가능함
      앱을 건드리지 않고도 MCP 서버 스키마를 동적 업데이트할 수 있음
      앱이 자동으로 새로운 스키마를 인식하게 됨

  • 이번 OpenAI 발표는 진짜 새로운 걸 만드는 기회였지만, 그냥 챗에 기존 앱 화면을 고정적으로 삽입하는 데 그친 듯해 아쉬움
    진짜 강점은 사용자가 과제를 설명하면 AI가 어떤 도구가 필요한지 파악해서 스스로 조합하고, 사용자가 편집 가능한 워크플로우나 캔버스 형태로 결과를 보여주는 것임
    LlamaIndex Workflow나 LangGraph 같은 프레임워크는 이미 수작업으로 이런 그래프(workflow-DAG)를 파이썬에서 구현할 수 있도록 돕는데, LLM이 이런 DAG를 실시간으로 만들면 진짜 강력할 것임
    LLM은 이미 UI 코드를 잘 생성하고, 디자인 시스템도 잘 따르기 때문에, 굳이 화면을 하드코딩할 이유가 없음
    이번 길을 구글이 따라가지 않길 바람

  • 최근 OpenAI 조직 내부에 챗 인터페이스가 실제로 얼마나 깊게 각인되어 있는지에 대한 글이 있었는데, 이번 발표에서 그 집착을 더 느꼈음
    진짜 질문은 "정말 대부분의 사용자가 시각 요소보다 대화로만 소통하는 걸 좋아하냐"임
    특히 여러 앱 이름(Zillow 등)을 외워서 챗에 타이핑해야 한다는 점, 그리고 광고나 ‘우선 노출(app discovery)’ 같은 과금 전략의 가능성이 매우 불쾌하게 느껴짐
    개인적으로 이런 미래가 오지 않길 바람

    • GUI와 터미널(혹은 CLI)이 더 강력한가에 대해 다시 한번 토론하는 느낌임
      토큰 스트림에 잘 맞는 많은 작업에선 명령줄이나 챗이 더 우월할 수도 있음
      봇이나 MCP를 빠르게 불러올 수 있는 탭 자동완성 기능 등도 생길 수 있겠지만…
      반면, 새로운 내용을 탐색하거나 그래픽 상호작용이 필요한 경우엔 시각적, 전용 인터페이스가 훨씬 더 직관적임
      결국 과제에 따라 여러 UI의 적절한 혼합, 추상화가 정착될 거라고 봄

    • 챗 인터페이스 중심이 LLM의 활용도를 실질적으로 저해한다고 생각함
      대화의 연속성이라는 환상이 어떻게 만들어지는지(맥락관리, 이전 프롬프트가 기억에서 빠지는 구조 등)는 비전문가에겐 설명조차 힘듦
      내가 비기술 친구에게 일반적으로 하는 조언은 ‘프롬프트 하나마다 새 대화 시작’임
      이래야 명확하게 뭐가 먹히는지 파악 가능함
      UX 혁신은 Apple이 이끌길 기대했으나, 아직 그러진 못한 듯함

    • 반론을 들자면, 내가 아는 많은 사람이 Zillow에 접속하려고 그냥 구글에 “zillow”라고만 치니, 챗에 앱 이름 입력하는 것도 꼭 말이 안 되는 건 아닐 수 있음

  • 부정적인 반응이 많지만, 개인적으로는 OpenAI의 방향이 너무 당연해 보임
    궁극적으로 사용자가 원하는 걸 말하면 OAI가 알아서 앱들(이메일, 캘린더, 결제 등)과 연결해 처리해주는 플랫폼이 될 것임
    이 방식이면 OAI는 광고 없이 수익만 쉐어하면 됨

    • 이메일, 캘린더 앱에서 대단한 매출이 날 것이라고 믿는다면, 투자자에게 충격이 클 것임

    • 광고가 없다는 얘기는 틀림
      광고는 아주 교묘하게, 유용한 팁 같은 형태로 엄청나게 숨겨져 있을 것임

    • 분명 OpenAI는 두 가지 모두(수익쉐어, 광고)를 노릴 것임
      이미 광고팀도 꾸리고 있고, 자본도 충분하니 모든 확장 가능한 비즈니스 모델을 시험해보려 할 것임
      앱스토어, 알고리즘 피드 등 역사상 성공한 모델은 다 시도해 볼 것임

    • 플랫폼이 되려면 사용자 락인 혹은 불공정한 이점이 필수임
      단순히 더 뛰어난 모델 품질만으론 부족함

  • 아직까지 이런 방식이 실제로 무언가를 개선한다고는 느껴지지 않음
    누군가 Spotify 연동을 언급했던데, 구세대 비서도 이미 할 수 있는 일임
    단순히 기존과 똑같은 일을 훨씬 비싸게 처리하는 것처럼 보임

  • 결국 다들 OpenAI의 도구 생태계에 무료 앱을 쏟아붓게 될 운명임
    이런 흐름은 OpenAI의 방어력을 강화하고 다른 기회는 희생시킴

    • 아이폰 초창기엔 6개의 앱만 있었고, 앱스토어조차 없었음
      2024년 기준 iOS 앱스토어는 1.3조 달러의 매출을 올렸고, 그중 85%가 개발자 몫임

    • OpenAI의 'moat'(진입장벽)가 뭔지 궁금함

    • 정작 이런 흐름은 말이 안 됨
      실시간 데이터와 MCP 액션이 사용자에게 실질적인 도움을 주는 이유가 사라질 이유가 없음
      앱 연결 시 인증이 필요할 수 있지만, 결제가 없다면 엄청난 배포 경로임

  • 이번 발표는 브랜딩 측면에서 흥미로운 실험임
    MCP를 “앱”이라고 부르면 친숙하고 사용하기 쉬운 느낌을 주지만, 툴/서버/도구라고 하면 너무 기술적으로 들림
    Expedia, Spotify와의 데모 추가로 사용자가 곧바로 쓸 수 있는 MCP가 완성된 느낌을 줌

    • 결국 이번에 나온 건 ChatGPT가 사용할 수 있는 MCP 서버임