# 비디오 생성모델 Veo 2로 Gemini와 Whisk에서 비디오 생성하기

> Clean Markdown view of GeekNews topic #20372. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=20372](https://news.hada.io/topic?id=20372)
- GeekNews Markdown: [https://news.hada.io/topic/20372.md](https://news.hada.io/topic/20372.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2025-04-17T09:49:50+09:00
- Updated: 2025-04-17T09:49:50+09:00
- Original source: [blog.google](https://blog.google/products/gemini/video-generation/)
- Points: 1
- Comments: 2

## Topic Body

- **Gemini**와 **Whisk**를 통해 텍스트 기반 프롬프트를 고해상도 8초 비디오로 변환할 수 있는 기능이 제공됨  
- **Veo 2** 모델을 사용하여 현실감 있는 비디오 생성 가능하며, **Google One AI Premium** 구독자에게 제공됨  
- **Whisk Animate**를 통해 이미지를 8초 애니메이션 클립으로 변환 가능함  
- **안전성**을 위해 생성된 모든 비디오에 **SynthID** 디지털 워터마크가 포함됨  
  
---  
  
### Gemini에서 비디오 생성 방법  
  
- **Veo 2**는 고해상도, 세밀한 비디오를 생성할 수 있는 모델로, 현실적인 물리학과 인간의 움직임을 이해하여 생동감 있는 캐릭터 움직임과 사실적인 장면을 제공함  
- 사용자는 **Gemini**에서 **Veo 2**를 선택하여 720p 해상도의 8초 비디오 클립을 생성할 수 있음  
- 장면을 설명하면 **Gemini**가 아이디어를 비디오로 구현하며, 자세한 설명일수록 최종 비디오에 대한 제어가 가능함  
- 생성된 비디오는 **TikTok**이나 **YouTube Shorts**와 같은 플랫폼에 쉽게 공유할 수 있음  
  
### Whisk Animate로 이미지에 생명 불어넣기  
  
- **Whisk**는 텍스트와 이미지 프롬프트를 사용하여 새로운 아이디어를 시각화할 수 있는 **Google Labs** 실험임  
- **Whisk Animate**를 통해 이미지를 생동감 있는 8초 비디오로 변환할 수 있으며, **Google One AI Premium** 구독자에게 제공됨  
  
### 안전성 접근 방식  
  
- 비디오 생성의 안전성을 위해 **Veo 2**로 생성된 모든 비디오에 **SynthID** 디지털 워터마크가 포함됨  
- 사용자 피드백을 통해 지속적인 개선이 이루어질 예정이며, 정책 위반 콘텐츠 생성을 방지하기 위한 평가가 진행됨

## Comments


### Comment 37263

- Author: xguru
- Created: 2025-04-17T10:01:49+09:00
- Points: 1

[Google DeepMind, 비디오 생성 모델 Veo 2 공개](https://news.hada.io/topic?id=18307)

### Comment 37260

- Author: neo
- Created: 2025-04-17T09:49:50+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=43695592) 
* Whisk는 몇 달 전 Imagen 3의 데모로 조용히 출시되었음. 놀랍게도 재미있고 구현이 견고함
  - 업로드된 이미지를 텍스트 설명으로 변환하는 트릭을 사용함
  - Imagen 3의 현대적인 텍스트 인코더의 강점을 활용하여 긴 변환된 설명을 따를 수 있음

* 2027년까지 한 사람이 만든 영화가 1억 달러 이상 수익을 올릴 것이라는 Polymarket 이벤트에 "예" 주식을 사고 싶음

* Veo2에서 8초짜리 동영상 12개를 만드는데 GCP 크레딧 48달러를 소모했음. 주의 필요함

* 8초짜리 동영상을 생성하는 것이 유료 API 외부에서 가능할 것이라고 생각하지 않았음

* 이 분야에 기술적으로 능숙하지 않지만, 왜 모든 것이 텍스트-투-X인지 궁금함
  - 전통적인 키프레임 스타일 편집기를 사용하면서 지형의 대략적인 스케치를 그리고, 캐릭터 사진을 넣고, 3D 스플라인을 그려서 세부적인 창의적 제어가 가능한 것이 가능하지 않을까 생각함

* Ghibli 스타일로 광고를 만드는 것은 용감한 일임. 이제는 그 스타일이 소진되었을 것이라고 생각했음

* Google Vids도 Veo 2를 사용함. 제품 혼란이 있음

* 콘텐츠 조정이 매우 좌절스러움. Veo2와 Gemini가 궁극적으로 실패할 주요 이유일 수 있음
  - 아이가 슈퍼히어로로 노는 재미있는 동영상을 만들고 싶지만 계속 실패함

* 이 모든 것이 기술적으로 놀랍지만, 이 분야에서 열심히 노력한 사람에게는 큰 경고가 있음
  - 텍스트-투-무엇이든 매우 피곤함. 결과가 멋져도 내가 한 것이 아니기 때문에 아무 감정이 없음
  - 97%의 경우 결과가 원하는 것이 아님. 텍스트를 약간 변경하면 또 다른 잘못된 결과가 나옴
  - 이 모든 과정이 내 지갑과 인내심, 영혼을 소모함
  - 이러한 "도구"가 창작자에게 어떻게 도움이 될지 모르겠음. 현재까지 이러한 도구에서 나오는 제품은 TikTok/일반 인터넷 스팸 회사들뿐임

* Krita에 연결되어 img2img와 마스킹, txt2img를 결합한 Krita-ai-diffusion이 예술가들에게 힘을 실어주는 가장 가까운 도구임

* 1년 전과 비교해 매우 인상적인 출시임. 현재 ML에 있어 모든 대기업이 서로 경쟁하며 기술을 발전시키고 있어 좋은 상태임. 이는 미국(또는 일반적으로)에서는 드문 일임