14P by GN⁺ 12시간전 | ★ favorite | 댓글 3개
  • OpenAI가 GPT-5.4의 프론트엔드 개발 역량을 끌어올리기 위한 실전 프롬프팅 기법과 디자인 가이드를 공개
  • 이미지 이해력, 기능 완성도, 컴퓨터 사용(Computer Use) 능력이 핵심 개선 축으로, 이전 모델 대비 시각적으로 세련되고 야심찬 결과물 생성 가능
  • 프롬프트가 불명확하면 모델이 훈련 데이터의 고빈도 패턴으로 회귀해 제네릭한 디자인에 머무르는 문제를 지적하며, 이를 극복하는 구체적 기법 제시
  • 디자인 시스템 정의, 비주얼 레퍼런스 제공, 내러티브 구조화, 낮은 추론 수준 설정 등 4가지 핵심 실전 팁 강조
  • 별도의 frontend-skill 프롬프트 패키지를 오픈소스로 공개해, Codex 등 코딩 에이전트에서 즉시 활용 가능

모델 개선 사항

  • GPT-5.4는 프론트엔드 작업에서 세 가지 실질적 개선에 집중:
    • 이미지 이해력 강화
    • 더 완성도 높은 앱/웹사이트 생성
    • 자체 작업을 검사·테스트·검증하는 도구 활용 능력 향상
  • 이미지 이해 및 도구 사용

    • 이미지 검색과 이미지 생성 도구를 네이티브로 사용하도록 훈련되어, 디자인 과정에서 시각적 추론을 직접 수행
    • 최상의 결과를 위해 최종 에셋 선택 전에 모델에게 무드보드 또는 여러 비주얼 옵션을 먼저 생성하도록 지시하는 것을 권장
    • 이미지가 캡처해야 할 속성(스타일, 색상 팔레트, 구도, 분위기)을 명시적으로 기술해 강력한 비주얼 레퍼런스로 유도 가능
    • 기본 설정으로 업로드/사전생성 이미지를 우선 사용하고, 없으면 이미지 생성 도구로 새 비주얼을 생성하도록 프롬프트에 명시하는 패턴 제시
  • 기능 완성도 향상

    • 더 완전하고 기능적으로 건전한 앱을 개발하도록 훈련
    • 장기간 태스크에서 더 안정적이며, 이전에는 불가능했던 게임이나 복잡한 사용자 경험도 1~2턴 만에 구현 가능
  • Computer Use와 검증

    • GPT-5.4는 Computer Use를 위해 훈련된 최초의 메인라인 모델로, 인터페이스를 네이티브로 탐색 가능
    • Playwright와 결합하면 렌더링된 페이지를 검사하고, 여러 뷰포트를 테스트하며, 앱 흐름을 탐색하고 상태·내비게이션 문제를 감지 가능
    • Playwright 도구/스킬을 제공하면 GPT-5.4가 세련되고 기능적으로 완성된 인터페이스를 생성할 가능성이 크게 향상
    • 개선된 이미지 이해력 덕분에 결과물을 시각적으로 검증하고 제공된 레퍼런스 UI와 일치하는지 확인 가능

실전 팁 퀵스타트

  • 채택할 실천법이 몇 가지뿐이라면 다음 4가지부터 시작할 것:
    • 낮은 추론 수준(low reasoning level) 으로 시작
    • 타이포그래피, 색상 팔레트, 레이아웃 등 디자인 시스템과 제약 조건을 사전 정의
    • 스크린샷 첨부 등 비주얼 레퍼런스나 무드보드 제공으로 시각적 가드레일 설정
    • 내러티브 또는 콘텐츠 전략을 사전 정의해 모델의 콘텐츠 생성 방향 안내
  • 시작용 프롬프트
    • When doing frontend design tasks, avoid generic, overbuilt layouts.
    • 프론트엔드 디자인 시에 제네릭하고 과잉 구축된 레이아웃을 피할 것
    • Use these hard rules:
    • 다음 하드 룰 적용할 것:
      • One composition: The first viewport must read as one composition, not a dashboard (unless it's a dashboard).
      • 첫 번째 뷰포트는 대시보드가 아닌 한 하나의 컴포지션으로 읽혀야 함
      • Brand first: On branded pages, the brand or product name must be a hero-level signal, not just nav text or an eyebrow. No headline should overpower the brand.
      • 브랜드 페이지에서 브랜드/제품명은 히어로급 시그널이어야 하며, 단순 내비게이션 텍스트나 아이브로우로 밀려나면 안 됨. 헤드라인이 브랜드를 압도하면 안 됨
      • Brand test: If the first viewport could belong to another brand after removing the nav, the branding is too weak.
      • 내비게이션을 제거한 후 첫 번째 뷰포트가 다른 브랜드의 것일 수도 있다면 브랜딩이 너무 약한 것
      • Typography: Use expressive, purposeful fonts and avoid default stacks (Inter, Roboto, Arial, system).
      • 표현력 있고 목적이 분명한 폰트를 사용하고, 기본 폰트 스택(Inter, Roboto, Arial, system)은 피할 것
      • Background: Don't rely on flat, single-color backgrounds; use gradients, images, or subtle patterns to build atmosphere.
      • 평면 단색 배경에 의존하지 말고, 그라디언트, 이미지, 미묘한 패턴으로 분위기를 구축할 것
      • Full-bleed hero only: On landing pages and promotional surfaces, the hero image should be a dominant edge-to-edge visual plane or background by default. Do not use inset hero images, side-panel hero images, rounded media cards, tiled collages, or floating image blocks unless the existing design system clearly requires it.
      • 랜딩 페이지와 프로모션 영역에서 히어로 이미지는 기본적으로 풀블리드(edge-to-edge) 비주얼 플레인 또는 배경이어야 함. 인셋 히어로, 사이드 패널 히어로, 둥근 미디어 카드, 타일 콜라주, 플로팅 이미지 블록은 기존 디자인 시스템이 명확히 요구하지 않는 한 사용 금지
      • Hero budget: The first viewport should usually contain only the brand, one headline, one short supporting sentence, one CTA group, and one dominant image. Do not place stats, schedules, event listings, address blocks, promos, "this week" callouts, metadata rows, or secondary marketing content in the first viewport.
      • 첫 번째 뷰포트에는 보통 브랜드, 헤드라인 하나, 짧은 서포팅 문장 하나, CTA 그룹 하나, 지배적 이미지 하나만 포함. 통계, 일정, 이벤트 목록, 주소 블록, 프로모, 메타데이터 행, 보조 마케팅 콘텐츠는 첫 뷰포트에 배치 금지
      • No hero overlays: Do not place detached labels, floating badges, promo stickers, info chips, or callout boxes on top of hero media.
      • 히어로 미디어 위에 분리된 라벨, 플로팅 배지, 프로모 스티커, 인포 칩, 콜아웃 박스를 올리지 말 것
      • Cards: Default: no cards. Never use cards in the hero. Cards are allowed only when they are the container for a user interaction. If removing a border, shadow, background, or radius does not hurt interaction or understanding, it should not be a card.
      • 카드 기본 사용 금지. 히어로에 카드 절대 사용 금지. 카드는 사용자 인터랙션의 컨테이너일 때만 허용. 테두리, 그림자, 배경, 라운딩을 제거해도 인터랙션이나 이해에 지장이 없다면 카드여선 안 됨
      • One job per section: Each section should have one purpose, one headline, and usually one short supporting sentence.
      • 섹션당 하나의 목적, 하나의 헤드라인, 보통 짧은 서포팅 문장 하나
      • Real visual anchor: Imagery should show the product, place, atmosphere, or context. Decorative gradients and abstract backgrounds do not count as the main visual idea.
      • 이미지는 제품, 장소, 분위기, 컨텍스트를 보여줘야 함. 장식적 그라디언트와 추상 배경은 메인 비주얼 아이디어로 인정하지 않음
      • Reduce clutter: Avoid pill clusters, stat strips, icon rows, boxed promos, schedule snippets, and multiple competing text blocks.
      • 필 클러스터, 통계 스트립, 아이콘 행, 박스형 프로모, 일정 스니펫, 경쟁하는 다수의 텍스트 블록을 피할 것
      • Use motion to create presence and hierarchy, not noise. Ship at least 2-3 intentional motions for visually led work.
      • 모션은 존재감과 위계를 만들기 위해 사용, 노이즈가 아님. 비주얼 중심 작업에는 최소 2~3개의 의도적 모션 구현
      • Color & Look: Choose a clear visual direction; define CSS variables; avoid purple-on-white defaults. No purple bias or dark mode bias.
      • 명확한 비주얼 방향 선택, CSS 변수 정의, 보라색-흰색 기본값 회피. 보라색 편향이나 다크 모드 편향 없을 것
      • Ensure the page loads properly on both desktop and mobile.
      • 데스크톱과 모바일 모두에서 페이지가 정상 로딩되도록 보장
      • For React code, prefer modern patterns including useEffectEvent, startTransition, and useDeferredValue when appropriate if used by the team. Do not add useMemo/useCallback by default unless already used; follow the repo's React Compiler guidance.
      • React 코드에서는 팀이 사용하는 경우 useEffectEvent, startTransition, useDeferredValue 등 모던 패턴 선호. useMemo/useCallback은 이미 사용 중이 아니면 기본 추가 금지, 리포의 React Compiler 가이드 준수
      • Exception: If working within an existing website or design system, preserve the established patterns, structure, and visual language.
      • 예외: 기존 웹사이트나 디자인 시스템 내에서 작업하는 경우, 확립된 패턴, 구조, 비주얼 언어를 유지할 것

더 나은 디자인을 위한 기법

  • 디자인 원칙부터 시작

    • H1 헤드라인 하나, 섹션 최대 6개, 서체 최대 2개, 액센트 컬러 하나, 폴드 위에 기본 CTA 하나 등 제약 조건 정의
  • 비주얼 레퍼런스 제공

    • 레퍼런스 스크린샷이나 무드보드가 레이아웃 리듬, 타이포그래피 스케일, 스페이싱 시스템, 이미지 처리 방식을 추론하는 데 도움
    • GPT-5.4가 사용자 검토용으로 자체 무드보드를 생성하는 예시 포함 (NYC 커피 문화와 Y2K 미학에서 영감)
  • 페이지를 내러티브로 구조화

    • 일반적인 마케팅 페이지 구조:
      • Hero — 아이덴티티와 약속 설정
      • Supporting imagery — 컨텍스트나 환경 표현
      • Product detail — 제안 설명
      • Social proof — 신뢰성 확보
      • Final CTA — 관심을 행동으로 전환
  • 디자인 시스템 준수 지시

    • 빌드 초기에 명확한 디자인 시스템 확립을 유도
    • 핵심 디자인 토큰 정의: background, surface, primary text, muted text, accent
    • 타이포그래피 역할 정의: display, headline, body, caption
    • 대부분의 웹 프로젝트에서 React와 Tailwind 스택으로 시작하는 것이 효과적이며, GPT-5.4가 이 도구들에서 특히 강력한 성능 발휘
    • 애니메이션, 오버레이, 장식 레이어 작업 시 고정/플로팅 UI 요소가 텍스트, 버튼 등 핵심 콘텐츠와 겹치지 않도록 안전한 레이아웃 동작 가이드 포함 권장
  • 추론 수준 낮추기

    • 단순한 웹사이트에서는 더 많은 추론이 항상 더 나은 것은 아님
    • 낮은(low) 및 중간(medium) 추론 수준이 더 강력한 프론트엔드 결과를 내는 경우가 많음
    • 모델이 빠르고 집중적이며 과잉 사고를 덜 하면서도, 더 야심찬 디자인을 위한 여유를 확보
  • 실제 콘텐츠로 디자인 기반 다지기

    • 실제 카피, 제품 컨텍스트, 명확한 프로젝트 목표를 제공하는 것이 프론트엔드 결과 개선의 가장 간단한 방법 중 하나
    • 이 컨텍스트가 올바른 사이트 구조 선택, 더 명확한 섹션별 내러티브 구성, 제네릭 플레이스홀더 대신 설득력 있는 메시징 작성에 기여

Frontend Skill 프롬프트 패키지

  • GPT-5.4의 일반 프론트엔드 태스크 활용을 돕기 위해 전용 [frontend-skill](https://github.com/openai/skills/…) 을 GitHub에 공개
  • 구조, 취향, 인터랙션 패턴에 대한 강력한 가이드를 제공해, 더 세련되고 의도적이며 즐거운 디자인을 기본적으로 생성
  • Codex 앱 내에서 $skill-installer frontend-skill 명령으로 설치 가능
  • Frontend Skill의 핵심 구조

    • Working Model: 빌드 전에 세 가지를 먼저 작성 — 비주얼 테시스(분위기·재질·에너지), 콘텐츠 플랜(hero, support, detail, final CTA), 인터랙션 테시스(2~3개 모션 아이디어)
    • Beautiful Defaults: 컴포지션부터 시작, 컴포넌트가 아님. 풀블리드 히어로 선호, 브랜드/제품명을 가장 큰 텍스트로, 카피는 몇 초 만에 스캔 가능하도록, 카드 없는 레이아웃 기본
    • Landing Pages 기본 시퀀스: Hero → Support → Detail → Final CTA
      • 히어로 룰: 하나의 컴포지션, 풀블리드 이미지, 브랜드 우선, 히어로에 카드·통계 스트립·로고 클라우드 없음
      • 뷰포트 예산: 고정 헤더가 있으면 히어로와 합산해 초기 뷰포트 내 수용 필요
    • Apps: Linear 스타일의 절제 기본 — 차분한 서피스 위계, 강한 타이포그래피와 스페이싱, 적은 색상, 카드는 인터랙션일 때만 사용
    • Imagery: 이미지는 내러티브 역할을 해야 하며, 추상 그라디언트나 가짜 3D 오브젝트보다 현장감 있는 사진 선호. 첫 뷰포트에 실제 비주얼 앵커 필수
    • Copy: 제품 언어로 작성, 디자인 코멘터리가 아님. 헤드라인이 의미를 전달, 카피 30% 삭제로 페이지가 개선되면 계속 삭제
    • Utility Copy: 대시보드·앱·관리도구에서는 마케팅 카피 대신 유틸리티 카피 기본 — 방향, 상태, 액션 우선
    • Motion: 존재감과 위계를 위한 모션, 노이즈가 아님. 히어로 입장 시퀀스, 스크롤 연동 효과, 호버/리빌 트랜지션 등 최소 2~3개 의도적 모션 구현. Framer Motion 선호
    • Hard Rules: 기본 카드 없음, 섹션당 하나의 지배적 아이디어, 서체 2개 초과 금지, 액센트 컬러 1개 초과 금지, 필러 카피 금지
    • Litmus Checks: 첫 화면에서 브랜드가 명확한지, 강력한 비주얼 앵커가 있는지, 헤드라인만으로 페이지 이해 가능한지, 각 섹션이 하나의 역할만 하는지, 카드가 정말 필요한지, 모션이 위계를 개선하는지 확인

예시 결과물

  • Frontend Skill을 활용해 생성한 예시를 랜딩 페이지, 게임, 대시보드 세 카테고리로 제시 (각각 다수의 비디오 데모 포함)

핵심 요점

  • GPT-5.4는 프롬프트에 명확한 디자인 제약, 비주얼 레퍼런스, 구조화된 내러티브, 정의된 디자인 시스템이 제공될 때 고품질 프론트엔드 인터페이스 생성 가능
  • Codex 등 코딩 에이전트로 GPT-5.4만으로 완전히 생성한 프로젝트를 OpenAI 갤러리에 제출해 쇼케이스 가능

프론트엔드에는 gpt 절대 쓰지 마세요. 최악입니다.동일 프롬프트로 opus랑 비교해보세요.

프론트 디자인은 gpt가 영 별로여서 다른 모델이 만들게 했는데, 이걸로 좀 괜찮게 나왔으면 하네요.

claude의 frontend-design과 어떤 차별성이 있을지 궁금하네요.
프론트엔드 디자인을 누가 더 잘한다~처럼 비교하기는 어려울 것 같은데 codex에도 나왔다는게 중요한 사실이겠죠?