안녕하세요.

요즘 Codex / Claude Code / Cursor 같은 코딩 에이전트로 비디오 작업을 어디까지 할 수 있을지 실험하면서 VibeFrame이라는 CLI를 만들고 있습니다.

기존 비디오 툴은 대부분 UI 안에 상태가 있어서 에이전트가 다루기 어렵다고 느꼈습니다. 그래서 비디오 프로젝트를 최대한 코드 프로젝트처럼 다루는 방향으로 만들고 있습니다.

기본 흐름은 이렇습니다.

  • STORYBOARD.md: 장면, 내레이션, 타이밍, 이미지/비디오 생성 cue
  • DESIGN.md: 톤, 레이아웃, 타이포그래피, 모션 방향
  • vibe build: asset 생성 + scene composition
  • vibe render: MP4 렌더링
  • vibe inspect: 렌더 결과 검사

실제로는 이런 식으로 씁니다.

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Codex / Claude Code / Cursor 등에게  
# STORYBOARD.md와 DESIGN.md를 조사 내용 기반으로 업데이트하게 한 뒤  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

scene composition 쪽은 Hyperframes의 아이디어에서 많은 영향을 받았습니다. 비디오 장면을 타임라인 위의 HTML/CSS/JS composition으로 보고, 브라우저에서 deterministic하게 캡처해서 MP4로 렌더링하는 방식입니다.

VibeFrame은 그 위에 코딩 에이전트가 다루기 쉬운 프로젝트 레이어를 얹는 쪽에 가깝습니다. STORYBOARD.md / DESIGN.md를 source of truth로 두고, multi-provider image/video/narration/music 생성, FFmpeg 기반 edit/remix, JSON 출력, dry-run, project-scoped config, inspect report 같은 agentic workflow를 붙였습니다.

이번 데모에서는 vibe setup --scope projectvibe init launch만 한 상태에서, 코딩 에이전트에게 특정 주제를 조사하게 하고 STORYBOARD.md / DESIGN.md를 업데이트한 뒤, 이미지 생성 cue를 포함해서 최종 MP4까지 빌드하는 과정을 녹화했습니다.

풀 프로세스 영상:
https://t.co/YD0SYyODcQ

아직 초기라서 특히 아래 부분에 대한 피드백이 궁금합니다.

  • STORYBOARD.md + DESIGN.md를 비디오 작업의 에이전트 인터페이스로 두는 방식이 자연스러운지
  • build / generate / edit-remix 세 가지 workflow lane 구분이 이해하기 쉬운지
  • CLI surface가 너무 넓거나, 반대로 빠진 기능이 있어 보이는지

비디오 편집을 GUI가 아니라 agentic CLI로 가져가려는 시도인데, 비슷한 문제를 겪어보신 분들의 의견을 듣고 싶습니다.