AV2 비디오 표준 출시, 최종 v1.0 명세 공개
(av2.aomedia.org)- AV2는 AOMedia의 차세대 비디오 코딩 명세로, AV1 기반 위에서 더 높은 압축 효율과 낮은 비트레이트의 고품질 전달을 목표로 함
- 최종 v1.0.0 명세는 비트스트림 문법, 의미론, 디코딩 절차를 다루며 AV2 구현 적합성을 판단하는 기술 참조가 됨
- 스트리밍, 방송, 실시간 화상회의에 맞게 최적화됐고 AR/VR, 분할 화면 전달, 화면 콘텐츠 처리 개선도 지원함
- 현재 릴리스는 2026년 5월 28일 공개된 AV2 Bitstream & Decoding Process Specification v1.0.0과 AVM 참조 소프트웨어로 구성됨
- 구현자는 온라인 명세, PDF, C 헤더 조회 테이블, Syntax Browser, AVM v1.0.0 태그를 활용할 수 있으며 v13 초안은 참조용으로 남아 있음
AV2 개요
- AV2는 Alliance for Open Media(AOMedia)의 차세대 비디오 코딩 명세로, AV1 기반 위에서 더 높은 압축 효율을 제공하도록 설계됨
- 훨씬 낮은 비트레이트로 고품질 비디오를 전달하는 것이 목표이며, 스트리밍, 방송, 실시간 화상회의 요구에 맞게 최적화됨
- v1.0.0 명세는 AV2 구현을 위한 최종 기술 참조로, 완전한 적합성에 필요한 비트스트림 문법, 의미론, 디코딩 절차를 다룸
- AV2는 AR/VR 애플리케이션, 여러 프로그램의 분할 화면 전달, 화면 콘텐츠 처리 개선, 더 넓은 시각 품질 범위에서의 동작을 지원함
- 구현자를 위한 공식 참조 소프트웨어로 AOMedia Video Model(AVM) 이 제공됨
- 피드백과 이슈는 wg-codec-chair@aomedia.org로 보내거나 AVM issue tracker에 등록 가능함
릴리스와 구현 자료
-
AV2 specification and reference code v1.0.0
- 현재 릴리스는 2026년 5월 28일 공개된 AV2 Bitstream & Decoding Process Specification v1.0.0과 해당 AVM 참조 소프트웨어임
- Read Online: v1.0.0 명세 온라인 문서
- Download PDF: 전체 v1.0.0 명세 PDF
- Additional Tables: 섹션 9에서 추출한 조회 테이블 C 헤더 파일
- Syntax Browser: 문법 구조와 의미론을 함께 탐색하는 브라우저
- Software: v1.0.0 태그의 AVM 참조 소프트웨어
-
AV2 working draft v13
- v13 작업 초안은 2026년 1월 5일 공개됐으며 v1.0.0으로 대체됨
- “v13” 라벨은 작업 초안 마일스톤을 뜻하며, v1.0.0보다 최신 버전이라는 의미는 아님
- 참조 목적으로 보존되어 있음
- Read Online: v13 온라인 문서
- Additional Tables: v13 추가 테이블
- Syntax Browser: v13 문법 브라우저
- Software: research-v13.0.0 참조 소프트웨어
- Release Notes: v13 릴리스 노트
-
명세 활용 자료
- 전체 명세는 범위와 정의부터 부록까지 포함하며, 형식, 문법, 의미론, 디코딩 절차를 포괄함
- PDF 버전은 완전한 v1.0.0 명세를 오프라인 참조용으로 제공함
- Additional Tables는 구현 참조에 유용한 섹션 9의 조회 테이블을 C 헤더 파일로 추출한 자료임
- Syntax Browser는 섹션 5의 Syntax Structures와 섹션 6의 Semantics를 분할 창 인터페이스로 제공함
- Syntax Browser에서는 문법 정의와 의미론의 나란히 보기, 클릭 가능한 문법 요소, 양쪽 섹션 검색, 문법 구조 복사가 가능함
- Reference Software는 명세 v1.0.0에 대응하는 AVM이며, v1.0.0 태그가 해당 버전임
댓글과 토론
Hacker News 의견들
-
AV2는 아주 긴 여정의 한 단계일 뿐이고, 현재 상태로는 사실상 쓰기 어렵다고 봄
좋은 하드웨어에서도 인코더가 보통 1fps 정도라서, 첫 AV2 하드웨어 가속 칩이 나올 2028년쯤까지는 계속 그럴 가능성이 크고, AV2 스트림이 흔해지는 건 2030년쯤은 되어야 할 듯함
효율 향상만 놓고 보면 AV1 대비 20~30% 라 상당하긴 해도 AV2가 그만한 가치가 있는지는 애매함. 하지만 다중 스트림 지원은 VR과 라이브 스포츠에 큰 이점이고, 알파 채널을 별도 스트림으로 보내 파일에서 합성해 제대로 된 투명 동영상을 지원할 수 있다는 점도 재미있음- AV1의 흐름을 보면 하드웨어 인코딩이 꼭 필요하진 않음. 있으면 좋긴 하지만 현재 인코더는 참조 인코더임
사양이 확정됐으니 실제 제품용 인코더에서 속도가 크게 개선될 수 있고, 다만 실시간 인코딩은 하드웨어에 들어가기 전까지는 어려울 가능성이 큼 - “가장 큰 추가 기능이 다중 스트림 지원”이라면, 이건 비디오 코덱보다 컨테이너 포맷의 영역이라고 생각했음
- 지금 흐름대로라면 PC에서 AV2 하드웨어 인코더를 조만간 보기는 어렵다고 봄. 최신·최고 칩 생산 능력이 Apple과 AI 회사들에 거의 다 빨려 들어가고 있음
칩 제조사가 AV2 설계를 더 오래되고 저렴한 공정으로 옮기지 않는 한 일반 사용자에게는 힘들고, 중국 TV 칩 업체들이 체크박스 채우기용 AV2 디코더를 넣을 수는 있겠지만 실제 인코더는 당분간 기대하기 어려움 - GPU 개발이 NPU 쪽으로 빗나가는 걸 보면, 이건 빨라도 2035년 목표처럼 느껴짐. 제조사들은 행렬 연산용 실리콘 면적을 최대화하려 할 것임
데이터센터에 조 단위 투자가 들어가는 시대에는 트래픽 비용이 뒷전이고, 이득을 보는 곳은 YouTube나 Netflix 정도일 수 있음. 그 규모라면 ISP 수준 캐시에 투자하는 편이 더 쌀 수도 있음 - “훨씬 낮은 비트레이트로 고화질 동영상 제공”이 목표라면서, 실제로 필요한 느린 기기들은 아직 존재하지도 않는다면 무슨 의미인지 잘 모르겠음
- AV1의 흐름을 보면 하드웨어 인코딩이 꼭 필요하진 않음. 있으면 좋긴 하지만 현재 인코더는 참조 인코더임
-
AV2가 AVIF 이미지 포맷을 어떻게 개선할지가 궁금함. AVIF는 낮은 비트레이트 정지 이미지, 특히 크로마 서브샘플링을 쓰는 경우 경쟁 포맷을 압도함
하지만 무손실 이미지에서는 그렇지 않음. 무손실 JPEG XL과 무손실 WEBP에 비하면 무손실 AVIF는 우스워 보일 정도임- AVIF는 지금 가장 좋아하는 이미지 포맷임. 무손실, HDR, 투명도, 브라우저 지원을 모두 갖춘 포맷은 거의 없음
아주 강하게 압축한 이미지에서도 훌륭하고, 파일 크기가 얼마나 작아질 수 있는지 놀라움. HEIC나 Ultra HDR JPEG와 달리 사이드카 gain map 같은 편법이 아니라 파일 포맷 자체에서 HDR을 네이티브로 지원함. 모두에게 중요하진 않겠지만 HDR을 좋아하고, AVIF만이 그걸 진지하게 다루는 포맷처럼 느껴짐 - 항상 그런 건 아님 https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
- libavif가 AV2 지원을 가져가면, v2.0.0 같은 버전으로 업데이트만 해도 추가 효율을 얻을 수 있을지도 모름
- 솔직히 지금 필요한 건 AVIF2가 아님. 이미 소수파 이미지 포맷이 너무 많음
- AVIF는 지금 가장 좋아하는 이미지 포맷임. 무손실, HDR, 투명도, 브라우저 지원을 모두 갖춘 포맷은 거의 없음
-
AV1은 지금 여러 회사가 적극적으로 클레임 차트를 만들고 있고, 소송도 거의 확실히 올 것 같음. AV2에서도 같은 과정이 이미 시작됐지만, 대부분은 AV1 사건들이 무르익기를 기다리는 중임
사람들이 AV 계열 코덱을 계속 “로열티 무료”라고 부르지만, 실제로는 점점 법적·재정적 도박처럼 보임- 이런 얘기는 수십 년째 계속 나왔음
어떤 사람들이 기업이 수학을 소유하는 걸 동네 스포츠팀 응원하듯 좋아하는 이유를 이해한 적이 없음
한동안은 H.264 인코더에 많은 노력을 쏟은 사람들이 있어서, 디지털 소작농들이 지저분한 자유를 옹호하는 사람에게 화나고 질투하는 건가 싶었음. 하지만 어떤 사람들은 그냥 기업이 동영상 배포에 세금을 매기는 생각 자체를 즐기는 듯함
다행히 그 탐욕스러운 기업들은 반복해서 스스로 발등을 찍었고, 영향력은 줄어드는 중임 - AV1이 나온 지 얼마나 됐나? 약 8년이 지났는데도 아직 신뢰할 만한 특허권자는 없음
압축 표준 주변에는 늘 독수리들이 맴돌기 마련이라 너무 심각하게 받아들일 필요는 없음. 설령 소송이 제기돼도 근거 없는 청구를 막기 위한 법적 방어 기금이 있음 - AV 계열 코덱이 법적·재정적 도박처럼 보인다면, 대안은 무엇인가?
H.265는 가입해야 하는 HEVC 라이선스 풀이 두 개 있고, 풀에 속하지 않은 회사도 최소 두 곳은 있음
https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
AVx가 아닌 코덱을 택한다고 해서 덜 복잡하거나 소송 위험이 줄어드는 건 아닌 것 같음 - HEVC 같은 것과 비교해도 그렇다는 건가? HEVC는 확실히 하려면 서로 조건이 다른 특허 풀 3곳에 돈을 내야 하고, 그 밖에도 어느 풀에도 속하지 않은 특허권자들이 언제든 자기 조건으로 로열티를 요구할 수 있음
- 통신 표준은 특허를 낼 수 없어야 함. 락인 효과를 통한 남용 가능성이 너무 큼
- 이런 얘기는 수십 년째 계속 나왔음
-
이 표준을 누군가 구현했다가 Adobe나 Dolby 같은 곳이 한 번 얻어맞고 싶어 해서 소송당하기까지 얼마나 걸릴까? 내 지식이 오래됐을 수도 있지만, 이게 AV1만큼 “열려” 있다면 각 개별 회사가 실제로 허용할지 꽤 회의적임. 탐욕도 있고
- AV1에 대한 첫 특허 주장이 법원까지 가는 데 7년이 걸렸고, 그 사건이 해결되기까지도 시간이 꽤 걸릴 것 같음
재미있게도 지난 몇 년간 계속 뉴스에 이름을 올리던 그 특허 풀에서 나온 건 아니었음. 즉 시도가 나오기까지 꽤 오래 걸릴 수 있음 - 특허 트롤은 악질임. 자기 이익을 위해 미국 사법부의 독립성을 흔드는 이들의 전폭적 지원을 받는 데 얼마나 걸릴까? 그 부패가 그 전에 멈추길 바람
- AV1에 대한 첫 특허 주장이 법원까지 가는 데 7년이 걸렸고, 그 사건이 해결되기까지도 시간이 꽤 걸릴 것 같음
-
반쯤 농담이지만, AV1을 지원하는 Apple TV를 기다리고 있었는데 이제는 Apple TV의 AV2 지원도 기다리게 됐음
- 10년 된 iPhone 7도 VLC로 1080p AV1 영상을 소프트웨어 디코딩으로 200분 넘게 재생할 수 있음. iPhone 7은 AV1보다 1년 반 먼저 출시됐음
그러니 현재 Apple TV 기기들도 소프트웨어로 AV1 영상을 재생할 수 있다고 보는 게 안전함. Apple TV용 VLC 릴리스도 있음
https://www.videolan.org/vlc/download-appletv.html
https://apps.apple.com/us/app/vlc-media-player/id650377962?p... - Apple 생태계 밖에서는 AV1이 거의 어디서나 지원됨
- 10년 된 iPhone 7도 VLC로 1080p AV1 영상을 소프트웨어 디코딩으로 200분 넘게 재생할 수 있음. iPhone 7은 AV1보다 1년 반 먼저 출시됐음
-
비디오 인코딩 전문가는 아니지만, 미래에는 고정 기능 압축 방식보다 AI 네트워크가 영상을 재구성하면서 압축 영상보다 훨씬 가볍게 만드는 쪽에 더 의존할 수도 있지 않을까 궁금함
github.com/Orange-OpenSource/Cool-Chic 같은 신경망 코덱이 그런 예임- 아마 스마트폰에 NPU가 보편적으로 들어가느냐, 그리고 NPU에 접근하는 표준 API가 생기느냐에 달려 있을 것 같음
다만 AI 기반 코덱이 고정 기능 하드웨어와 경쟁할 만한 배터리 사용량을 낼 수 있을지는 모르겠음
- 아마 스마트폰에 NPU가 보편적으로 들어가느냐, 그리고 NPU에 접근하는 표준 API가 생기느냐에 달려 있을 것 같음
-
AV1은 이미 효율적이고 열린 비디오 포맷으로 가는 큰 도약이었고, AV2도 오래 기다려 왔음
칩과 하드웨어에 구현돼 효율적이고 빠른 하드웨어 인코딩·디코딩을 쓰기까지는 시간이 걸리겠지만, 저장장치 가격 상승과 칩 위기를 생각하면 약 25% 효율 향상은 매우 유망해 보임 -
Dav2d는 어감이 그만큼 좋지 않음. 그 전에 저장소 이름 말장난을 잘하는 누군가가 기여해 줬으면 함
avi2ude? av2go?- rav2d는 괜찮아 보임 — https://github.com/stukenov/rav2d. Rust 포트이고, rav1d→dav1d와 같은 분위기임
- av2로는 괜찮은 이름을 찾기 어려웠음
프랑스어로는 d2vid, 즉 Deuvid가 됨
-
꽤 빠른 인코더가 나오기를 기대함. AV1의 참조 인코더도 그다지 좋지 않았고, 여기서도 마찬가지임
하지만 SVT-AV2 같은 게 나오는 순간 아주 만족할 것 같음