AniSora: 오픈소스 애니메이션 비디오 생성 모델
(komiko.app)- AniSora는 Bilibili가 개발한 애니메이션, 만화, VTuber 등 다양한 스타일을 지원하는 오픈소스 AI 비디오 생성 모델
- 완성도 높은 고화질 애니메이션 비디오를 이미지나 텍스트 프롬프트로 쉽게 생성할 수 있음
- 만화와 애니메이션에 특화된 알고리듬과 대용량 데이터셋 기반으로 사실적인 동작과 표현력 있는 결과물을 제공함
- 비전문가도 손쉽게 활용할 수 있는 직관적인 인터페이스와 커뮤니티 기반 협업 환경이 강점임
- 단편 에피소드, PV, VTuber, 콘셉트 아트 등 다양한 활용 사례에 적합함
AniSora란 무엇인가
- AniSora는 Bilibili가 개발한 가장 강력한 오픈소스 애니메이션 비디오 생성 모델임
- 한 번의 클릭만으로 애니메이션 시리즈, 중국 애니메이션, 만화 원작, VTuber, 애니메이션 PV 등 다양한 스타일의 영상을 제작할 수 있음
- 이미지 또는 텍스트 프롬프트만으로 정적인 장면을 역동적이고 세밀한 애니메이션으로 구현할 수 있음
- AniSora의 기반 연구는 IJCAI’25에 채택된 최신 기술 논문을 바탕으로 함
AniSora 예시 소개
- AniSora로 생성된 예시 영상들은 정지 이미지를 자연스럽게 움직이는 애니메이션으로 전환하는 능력을 보여줌
- 예) 자동차 안에서 머리가 바람에 흔들리는 장면, 여러 소녀가 손을 들어 춤추는 모습, 고속으로 달리는 캐릭터의 동작 블러 등
- 이 모델은 등장인물의 감정 표현, 동세, 장면 전환 등 만화와 애니메이션에서 필요한 다양한 연출을 사실적으로 실현함
AniSora의 주요 장점
애니메이션/만화 스타일에 특화된 알고리듬
- 대용량 애니메이션, 만화 데이터셋으로 학습된 특화된 모델 구조를 사용함
- 고유한 시각 스타일과 연출을 정확하게 재현함
- 최신 만화 원작 및 트렌드까지 반영한 고품질 출력이 가능함
직관적인 인터페이스
- 기술에 익숙하지 않은 사용자도 직접 영상 생성을 할 수 있도록 설계됨
- 클릭 한 번으로 누구나 손쉽게 만화와 VTuber 영상 제작을 경험할 수 있음
고품질 애니메이션 영상 지원
- AniSora는 1080p 고화질 비디오 출력을 기본으로 제공함
- 다양한 플랫폼에 최적화된 영상으로, 프로젝트, SNS, PV 등 다양한 채널에 활용이 가능함
AniSora FAQ 요약
AniSora란?
- AniSora는 Project Index-AniSora의 일부로, Bilibili가 공개한 오픈소스 애니메이션 비디오 생성 모델임
- 이미지 또는 텍스트 프롬프트만으로 고해상도, 애니메이션 스타일의 영상을 자동으로 제작할 수 있음
- 동작 일관성과 표현력에 중점을 둔 최신 연구 결과가 반영됨
타 AI 비디오 생성 도구와의 차이점
- AniSora는 애니메이션, 만화 스타일에 특화된 성능에 집중함
- Bilibili의 전문성과 커뮤니티 중심의 오픈소스 프로젝트로서, 애니 시리즈, 만화 원작, VTuber 등 특수 목적 영상 제작에 최적화되어 있음
비디오&오디오 지원 여부
- 현재 AniSora는 비디오 생성에 중점을 둔 모델임
- 오디오 합성 등 추가 기능의 제공 여부는 최신 문서 참고 필요함
애니메이션/만화 창작자에게 적합한가?
- AniSora는 캐릭터 일관성, 표현력 있는 동작 구현에 최적화되어 창작자(특히 애니메이션, PV, 만화, VTuber 분야)에게 이상적인 도구임
주요 활용 사례
- 애니메이션 단편, SNS 영상, PV, 만화 패널 애니메이션, VTuber, 콘셉트 아트, 스토리보드 등 폭넓은 활용이 가능함
영상 퀄리티와 길이
- AniSora는 고해상도(1080p) 기준의 단편 영상 생성에 강점을 가짐
- 일반적으로 짧은 클립 형태가 적합하며, 구체적 제약사항은 공식 문서에서 최신 정보를 확인할 수 있음
스타일과 동작 컨트롤 방법
- 이미지 또는 텍스트 프롬프트 입력을 통해 사용자가 원하는 시각 스타일과 동작을 유도할 수 있음
- 애니메이션 분야 데이터를 기반으로, 동작 커스터마이징, 캐릭터 일관성, 세부 스타일 적용 등 고도화된 통제가 지원됨
- 버전이나 인터페이스에 따라 운영 가능 범위가 상이함
결론
- AniSora는 애니메이션 및 만화/VTuber 영상 제작에 특화된 최고 성능의 오픈소스 AI 영상 생성 모델임
- 차별화된 스타일 재현력, 직관적인 사용법, 고화질 영상 생성이 주요 이점임
- 커뮤니티 오픈소스 문화와 창작자 지원에 중점을 두어, 일본 애니메이션과 중국 애니메이션 분야 모두에서 활용 가치가 높음
Hacker News 의견
-
일부 결과물이 웹툰, 만화, 아마도 pixiv 등에서 명확하게 학습된 흔적이라는 생각이 든다. CG 건물이나 다양한 기타 인공물에서 그 증거를 쉽게 발견 가능. 결국 저작권이 있는 자료로 학습한 것이라는 결론. 예술은 텍스트처럼 합성된 방식으로 생성할 수 없는 영역이기 때문에 사람 아티스트가 영원히 중요한 자리를 차지할 것, 아니면 계속 이상한 인공물이 생기는 결과만 나올 것. 그래서 앞으로 아티스트가 "AI" 학습을 위한 직업군으로 격하되는 방향이 되지 않을까 하는 생각이 든다. 하지만 오히려 사람들이 각자 좋아하는 걸 그려서 그걸 모델 학습에 활용하는 구조라면 나쁘지 않다는 생각도 든다. 나는 저작권, 상표권에 관련해서 아주 AI를 지지하는 입장이지만, 우리에게 재미를 주던 많은 사람들에게 어떤 일이 벌어질지 계속 궁금증이 남는다. 퀄리티가 계속 오를지, 아니면 'AI에겐 너무 어렵다'는 이유로 도전적인 스타일이 사라지고 모든 게 비슷비슷해질지 고민. 이건 PC와 기계가 사람을 대체하는 것과는 다른 종류의 느낌, 뭔가 종착점에 온 듯한 기분.
- 삽화가나 예술가에 연민이 느껴진다. 하지만 학습 데이터가 소설, 그림, 노래, 코드, 심지어 법률 문서든 큰 차이점이 없다고 생각. 우리 엄마도 타자기 시절 번역가에서 기계 번역 코퍼스-데이터베이스 환경으로 바뀌었고, 일거리는 점점 줄고 임금도 내려갔음. 결국 기계적이고 반복적인 일들은 더 저렴한 로봇이 하게 될 운명.
- 30년 넘게 그림 그린 아티스트 입장. AI 학습보조직으로 격하된다는 건 말이 안 된다. 아티스트는 돈 벌려고만 그리는 게 아니라 "재미"로 그리는 경우도 많다. 지난 3년간 AI 관련 논의에서는 이 본질적인 부분이 다 빠져있어서 항상 아쉽다.
- 예술가를 "AI 학습" 직업군으로 격하시키는 게 그리 나쁘지 않다고? 그건 디스토피아 소설에 나올 상황이라고 생각. 대부분 아티스트는 본인 작품이 모델에 먹히고 해체당하는 용도로 일하는 걸 싫어한다. 그건 더 이상 예술이 아니라 기계의 부품 역할일 뿐. 예술이라는 건 그저 랜덤하게 그림 몇 개 그리는 개념이 아님. 그런 상황에서 예술가가 어떻게 먹고살지, 누가 '각자 그리고 싶은 것'을 그리고 그걸 모델에 제공하는 비용을 줄지, 그걸 위해 몇 명이나 고용하겠냐는 근본적 의문. 이미 인터넷에는 실패작 이미지들이 넘치고, 이걸로 사람을 속이는 스팸이나 사기층이 진짜 창작자층보다 더 큰 시장이 됐을 거라 확신. 앞으로 더 심각해질 것.
- AI와 저작권 논의에서 느끼는 문제는 커다란 기업들만 혜택을 누린다는 점. ChatGPT 등에서 유명 저작물은 자동 차단이지만, 소규모 아티스트의 작품은 그렇지 않다. 모두에게 개방하거나 아무에게도 개방하지 말아야 한다는 입장.
- 예술가의 저작권을 옹호하는 입장을 공감하면서, 동시에 저작권 면에서 AI를 적극 지지하는 태도가 참 흥미롭다. 이 분야는 많은 사람들에게 감정이 격한 주제여서 극단적 의견이 보통인데, 양쪽을 다 보는 입장은 보기 드물다. AI 시대에 저작권의 역할에 대해 생각이 궁금하다.
-
이제 드디어 우리가 원하는 Haruhi 시즌 3을 만들어낼 수 있는 시대가 오는 거 아닌가 하는 설렘. 정말 살기에 좋은 시기라는 느낌.
- 5년, 10년 후에 다시 이야기해보자. 아직은 그렇게 가까이 온 것 같지도 않다. 앞으로의 흐름이 궁금한 마음.
- 내가 애니메이션(영화나 DBZ 같은 걸 제외하고)에서 처음 제대로 본 시리즈가 바로 이거다. 아직도 추억이 생생하다. 감독 탓에 멈췄던 부분이 정말 아쉽다. 누구라도 이 시리즈를 마무리해주거나 리붓해서 완결내주면 정말 최고의 선물이 될 것.
- 또는 신세기 에반게리온 리메이크도 있었으면 하는 바람.
- 아니... 설마 아직 완결이 안 된 거였어? 나 지금 시즌1 처음 보고 있는데...
- 이 애니를 10년 넘게 잊고 살았다가 다시 듣고 나서 완전 향수 자극 느낌.
-
<i>Neon Genesis Evangelion</i> 홍보 일러스트로 시험해보았음. 결과는 괜찮은데, 머리가 돌아가는 동안 머리카락 애니메이션에 시간적 인공물이 발생. 예제 모음 등 참고할 페이지도 있음.
- 링크가 작동하지 않음.
-
논문 발췌 요약 내용 전달 : "가변 길이 학습 방식 도입, 2초 ~ 8초 구간 학습. 이 전략으로 2~8초 길이의 720p 영상 생성 가능." FramePack과 벤치마킹 해보고 싶다. 실제로 2d 애니메이션에서 프레임 지속시간 제약이 거의 없는 장점이 있다고 본다.
-
AI 애니메이션 콘텐츠에 관심 있으면 AniGen 경진대회 참가 추천.
- 마감이 5월 20일이라 서둘러야 할 듯한 생각.
-
동일한 캐릭터를 다양한 장면, 시점에서 일관되게 표현할 수 있는지 궁금. 그게 지금까지 이미지 생성계의 한계라 생각.
-
첫 예시부터 벌써 많은 오류가 보임. 셔츠의 팔 부분이 깨지고, 움직이는 머리카락이 사라졌다 다시 나오기도. 결국 대체로 움직이는 건 팔과 구름뿐.
-
계정과 입력값을 바꿔도 매번 이상한 오류가 발생해서 제대로 작동하지 않음.
-
이런 서비스로 만든 영상의 저작권 상태가 궁금. 저작권 보호가 되는지 알고 싶음. 현재 미국 저작권국 입장은 "생성형 AI의 결과물은 인간 저자가 충분한 창의적 요소를 결정(주입)한 경우에만 저작권 보호 대상"이라는 것. 만약 보호 안된다면, 해당 서비스로 영화 등 만들 경우 그대로 복제, 표절될 위험도 생김. 참고로 이 툴이 어떤 데이터로 학습했는지는 논외로 둠.
-
<i>The Beginning After the End</i>의 전투 장면이 이 툴을 거치면 얼마나 달라질지 보고 싶음. 진지하게 앞으로의 방향성이 궁금. 사람들이 시각적 오류, 인공물이 좀 더 많더라도, 좋아하는 프랜차이즈의 새 시즌이 나온다면 그걸 용인하게 될까, 아니면 3D 모델의 어설픈 사용처럼 거부감을 가지게 될까?
- Toei Animation이 AI를 여러 분야에 적용하려는 계획을 가지고 있음. 예를 들어 스토리보드 제작(단순 레이아웃과 촬영각도 생성), 색 지정 및 자동 색 보정, 동화(라인 드로잉 및 중간 장면 자동 생성), 배경(사진으로부터 자동 생성) 등에 활용한다는 방침. 감독이 여전히 최종 품질을 책임질 테니 인공물 없이 잘 나올 거라 보고, 인디 창작자들도 완벽하진 않지만 자기만의 작품을 만들 수 있으니 긍정적.
- 이 정도로 새로운 시도나 진보가 없는 상황에서 의미를 두고 논의할 가치가 있을까? 실제 사용해봤지만 영상 생성 AI의 기존 단점이 그대로 남아있음. 연쇄적이거나 역동적 액션 장면 처리에 가장 취약, 특히 애니에서 많은 액션 장면들을 제대로 커버하지 못함. 이 툴도 만족스럽지 않고, 대다수 비공개(상용) 모델도 별로.
- AI가 앞으로 동화(두가)에 쓰일 수 있는 미래가 올 거라는 상상.