1P by GN⁺ 1일전 | ★ favorite | 댓글 1개
  • 윌 스미스의 콘서트 영상이 AI로 생성된 가짜 관중이라는 의혹을 받았으나, 실제로는 실존하는 팬들의 촬영본이 기반이었음
  • 문제의 영상은 공연 장면과 실제 페스티벌 관객 사진을 섞어 만들었으며, 일부 관중 샷은 이미지-투-비디오 AI 모델로 애니메이션화됨
  • 그러나 YouTube Shorts의 후처리 실험(언블러링·디노이즈) 이 추가되면서, 관중 얼굴이 괴이하게 변형되고 표지판이 왜곡돼 AI 조작처럼 보였음
  • Instagram·Facebook에 게시된 동일 영상은 왜곡이 덜해, YouTube 자동 보정이 사태를 악화시켰음
  • 결론적으로 관중은 실제였으나, 아티스트 측의 AI 보정과 YouTube 필터가 겹치며 진짜·가짜 논란을 불러일으킨 사례임

논란의 시작

  • 문제의 1분짜리 영상이 공개되자, Rolling Stone, NME, Mashable 등 주요 매체들이 AI 조작 의혹을 보도
  • 영상 속 관중 얼굴은 AI 특유의 일그러짐, 다중 손가락, 해괴한 표식 등이 나타났음
  • 특히 “From West Philly to West Swizzy”라는 표지판이 잘못 인식돼 더 큰 논란을 일으킴

실제 공연 장면 확인

  • 영상은 프랑스 오랑주의 Positiv Festival을 비롯해, 스위스 Gurtenfestival·Paléo Festival, 벨기에 Ronquieres Festival 관객 장면을 교차 편집한 것임
  • 관련 공연 사진과 팬들이 찍은 영상으로 동일 인물과 표지판이 확인돼 실제 관중임이 입증
  • 암 투병 커플의 사연 표지판도 존재하며, Will Smith 인스타그램에 여러 장의 사진과 영상이 남아 있음

두 단계의 AI 조작

  1. 윌 스미스 팀이 공식 공연 사진을 활용해 AI 이미지-투-비디오 모델(Runway, Veo 3 등) 로 짧은 클립을 생성
  2. YouTube Shorts의 자동 후처리(언블러·디노이즈) 가 덧입혀지며 영상이 더 흐릿하고 부자연스럽게 변형

YouTube Shorts 실험

  • Instagram·Facebook 업로드본은 비교적 선명하지만, YouTube는 “AI 향상 기술 실험” 을 적용해 전반적으로 찌그러진 화면 효과가 나타남
  • YouTube는 “전통적 머신러닝 기반의 선명화 기술”이라고 설명했으나, 사전 고지 없는 적용이 논란을 키움
  • 이후 크리에이터 반발에 따라 옵트아웃 기능을 추가하겠다고 발표

결론

  • 대부분의 YouTube, Reddit, X 이용자가 “가짜 팬들을 생성 AI로 만든 영상”이라 믿고 있음
  • 실제로는 진짜 관중이 등장했으나, 윌 스미스 팀의 이미지-투-비디오 변환과 YouTube의 후처리를 거쳐 인공적인 모습이 극대화됨
  • 이미지-투-비디오 모델로 공연장 사진에 짧은 애니메이션 효과를 주는 것과, 완전히 허구의 군중을 생성하는 것의 윤리적 구분 필요성 제기됨
  • 결론적으로, 실제 공연이 AI 도구에 의해 ‘덜 진짜처럼’ 보이는 현상이 이번 사례에서 드러남
Hacker News 의견
  • AI 업스케일링된 영상은 마치 새 TV의 프레임 보간을 해제하기 전의 어색함만큼이나 눈에 거슬리는 느낌임. 누가 이런 잘못된 인공 선명을 더 멋지다 생각하는지 의문임. 최근에 David Bowie & Nine Inch Nails 공연의 AI 업스케일링 버전을 봤는데, 특히 2분 지점에서 현실감이 어긋난 듯한 기분이 들면서 심리적으로 불안감이 엄청나게 들었음. 원본 영상은 저해상도지만 오히려 그 분위기, 의도된 느낌을 훨씬 잘 살린다고 생각함. 지금 훌륭한 카메라와 렌즈가 있으니 AI로 화질을 억지로 올릴 필요가 없음
    • 놀라운 사실은 사람들이 이런 화질을 오히려 즐기는 것 같다는 점임. 어제 파트너가 새 스마트폰을 고르는데, 카메라 화질이 중요하다며 확대해도 선명하다며 좋아했음. 하지만 확대 후 잠깐의 딜레이 끝에 인위적으로 재구성된, 마치 옛날 콘솔 게임 에뮬레이터에서 쓰는 업스케일 필터 느낌의 왜곡된 이미지를 보면서, 내가 정말 좋아하는 사람이 현실감 있는 자연스러운 사진 대신 얼굴만 뽀샤시하게 보이고 배경이 부자연스러운 가짜 보케가 걸린 셀카를 더 좋아한다는 게 좀 씁쓸했음
    • 이 이미지는 정말 웃김
    • 예전에 부모님의 새 TV로 좋아하는 드라마를 봤을 때, 뭔가 이상하고 저예산에 배우 연기도 어색해진 듯한, 대사가 별로인 느낌이 들어서 이유를 고민했었음. 시간이 흘러 결국 그 TV의 오토 스무딩 때문이라는 걸 알게 됐음. 소위 Soap Opera Effect라는 현상임
    • 소비자가 원하지 않는 기술을 계속 밀어붙이는 건, 주식 가격 유지 압박 -> 시장점유율 올려야 한다는 경영 압박 -> PM들에게 새 기능 추가 요구 -> 개발자들은 신기술 적용해보고 싶어함 -> 그리고 생기는 게 우리가 원하지 않는 AI 챗봇, AI 요약, 차량 터치스크린, AI 업스케일링 같은 것임
    • 대부분의 사람들은 이런 차이를 잘 인식하지 못함. 집에 TV가 없지만 친구 집에 가면 바로 Soap Opera Effect를 알아차림. 두 번 다 그런 기능을 꺼보라고 하고 나서 친구들도 동의하고 다시 켜지 않음. 하지만 사실 대부분은 나를 믿고 넘긴 것일 뿐, 정말로 차이를 아는지는 확신이 없음. 혹시 이 기능을 꺼보고 싶으면 “TV 브랜드명 soap opera effect”로 검색해보면 설정 찾는 방법이 나옴. 제조사마다 이상한 명칭을 쓰는 경우가 많으니 주의 필요함. 2분 6초 부분에서 특히 얼굴이 변하는데, 원본은 그 구간이 많이 흐림. AI 버전은 카메라 효과를 전혀 이해하지 못함. AI 업스케일 버전원본 비교하니 정말 확실함. 덕분에 두 영상 링크 모두 알려줘서 비교가 쉬웠음
  • 많은 댓글이 YouTube 얘기를 하지만, 기사 내용에 따르면 대부분의 AI 작업은 Will의 팀에서 정지 사진을 영상으로 변환하는 데 AI를 사용한 것임. 실제로는 YouTube는 최종 결과를 약간 덜 흐리게 만들어주는 수준이고, 정말로 어색한 AI 아티팩트는 대부분 영상 제작 단계에서 발생함. 이건 Shorts에만 적용됨. 비교 영상 참고
    • 그 영상 안에서는 차이가 잘 보이지 않음
  • Coldplay가 이번 여름에 이런 기술을 썼다면 어땠을까 궁금함. 진지하게 얘기하자면, AI를 모든 곳에 밀어넣는 트렌드는 상당히 우려스러움. 예전엔 Spotify Discover Weekly에서 새 음악을 알게 되는 게 정말 즐거웠는데, 요즘은 AI가 만든 곡들이 너무 많아서 몰입이 깨지는 경험임
    • Spotify를 그만두고 동네 음악가게에서 CD를 사서 USB CD리더로 내 음악 컬렉션을 직접 쌓고 싶어짐. 계속 최신곡만 좇고 “모든 곡이 다 있다”는 걸 추구하다 보니 진짜 사람이 음악을 공유하는 감성적 요소를 잃어버린 듯한 느낌임
    • 그럴 수도 있겠음. 음악 추천에서 우연히 보석 같은 곡을 발견하는 즐거움이 중요한데 AI 생성 곡이 섞이면 그 마법이 사라진다고 생각함. Spotify에서 공식적으로 AI곡만 더 추천한다고 밝힌 적은 없지만, 최근 1년 간 스트리밍 플랫폼 전체적으로 AI음악이 폭증했음. Spotify 알고리즘도 인간/AI 곡을 구분하지 않고 추천해주는 경우가 많음(특히 AI가 쉽게 따라할 수 있는 앰비언트, lo-fi, EDM, 무난한 팝은 더욱 그러함). 결국 인간이 큐레이션하거나 예술적으로 접근해야 하는 영역에 AI가 스며드는 것에 많은 사람들이 불편함을 느끼는 중임. 서비스별로 AI 음악을 필터링하거나 사람의 곡만 추천받는 방법이 있는지 궁금하면 찾아봐 줄 수도 있음
  • 여기서 진짜 핵심 이슈는 <i>동의</i>임. 공연장에 들어가면 사진·영상 촬영에 동의하는 건 누구나 안다고 쳐도, 아티스트팀이 AI로 내 얼굴을 가짜 영상으로 변환하는 데까지 명확하게 동의한 사람이 과연 있었는지 의문임. 국가마다 이런 게 합법적인지도 정말 궁금함
    • 아마 표 구매 페이지 약관, 공연장 입구의 안내문 같은 데 “입장하면 촬영에 동의함” 등등 문구가 있었을 가능성이 큼. 도덕적으론 별로지만 법적으론 꽤 잘 커버된 케이스라고 봄
  • 만약 내가 마케터라면, 진짜 이미지를 오히려 AI가 만든 것처럼 보이게 만들어서 무료로 바이럴 효과를 노릴 거임. 실수나 합성 논란만큼 주목받는 게 없음. 실제로 가짜가 아니라면 아티스트나 팀에 전혀 손해가 없음. 대형 브랜드의 소셜 미디어 매니저와 얘기해본 적이 있는데, 일부러 맞춤법 틀린 글을 일부러 올려서 댓글, 반응을 더 이끌어낸다고 함
    • 이런 걸 ragebait라고 부름. 마케팅 업계에선 이미 흔히 통하는 수법임
    • 새 Naked Gun 영화가 포스터에 일부러 손가락을 더 많이 그린 것도 이런 사례임
  • 내 하드웨어/소프트웨어 혹은 눈이 고장난 건지 YouTube와 Instagram을 나란히 비교해봐도 큰 차이를 모르겠음. 만약 눈에 문제가 있는 게 아니라면 뭘 점검해야 할지, 모니터를 업그레이드해야 하는지 궁금함. GPU는 나쁘지 않은데 HDMI-VGA 변환기도 사용 중임. 다만 사진은 정말 못 봐주겠을만큼 이상했음. 영상도 아마 그 정도로 인위적으로 왜곡된 화면이 많을 거라고 생각함
    • 영상은 더 미묘한 부분에서 차이가 있음. 모든 프레임에서 뚜렷하게 보이지 않고, 배경이 갑자기 초점이 맞았다 흐려졌다 하거나, 인물의 머리와 목에 이상한 질감이 생기며, 얼굴 테두리만 또렷하고 피부는 부자연스러울 정도로 매끈하게 표현되는 경우가 너무 많음. 마치 Max Headroom 같은 느낌임
  • 내 주변에 진짜로 이런 기능을 바라는 사람은 한 명도 없음. 왜 이렇게 복잡하고 필요 없는 걸 자꾸 도입하는지 너무 궁금함
    • 어떤 나라들이 군비를 실전에서 시험하고 노하우를 축적하는 것처럼, Google도 앞으로 제대로 활용할 그날을 준비해서 조직 역량을 키우고 있는 거 아닐지 상상하게 됨
    • 복잡함은 필수적인 것에도 있지만, 이익이 안 나면 추진될 이유가 없음
  • Youtube PM: “AI가 만든 영상과 실제 영상을 더 구분하기 어렵게 만들어서 사용자들이 자연스럽다고 느끼도록 하지!”
    • 이런 계획적인 악의까지도 사실 별로 없다고 생각함. 진짜 AI에 열광하는 사람들은 모든 제품에 AI를 넣고 싶어 하고, 위에서 누가 “AI 정말 대단하니 넣어라”고 하면 다 끼얹는 식임. 회의도 “사용자 문제 X를 해결하자”가 아니라 “AI로 제품 어디를 바꿀 수 있을까”에 초점이 맞춰짐
    • 악의보다 잘못된 인센티브가 더 현실적임. 누군가의 KPI가 AI 기능 도입으로 되어 있고, 그런 이유로 유튜브의 옛날 sharpen + Denoise 필터 자리에 “AI enhancement”가 들어가게 됨
    • 실제로 YouTube의 AI 변환 설명 가이드도 있음
    • 이런 접근이 오히려 진짜 뉴스 영상도 AI 합성으로 오해받아 신뢰를 떨어뜨릴 수 있음. 오히려 사람들이 더 경계하고 안 믿게 됨
    • 앞으로 세대는 이미 기존 세대와 전혀 다른 미디어 환경에서 자랄 것임
  • "AI를 유용하게 만들어보자"는 시도 중 하나인 이 기능이 진짜 누구 머릿속 아이디어인지 의문임. 어차피 HD 원본이 있는데, 굳이 비용 들여서 업스케일링을 제공할 필요가 없다고 생각함. 혹시라도 저화질 영상에만 적용한다고 해도, 결국 현실감 왜곡이라 더 심각하게 다가옴
    • Google에게 현실감은 중요하지 않음. 광고·참여도만 신경 씀
  • “AI 글리치” 문구가 적힌 티셔츠를 팔면, 사진마다 이런 효과가 나면 진짜와 가짜를 구분할 수 없게 만들 수 있음
    • 시간이 지나면 이런 티셔츠는 여섯 번째 손가락 소품(생성형 AI의 대표적 문제), 5안경 마스크(안면 인식 회피)처럼 유행했다 사라질 소품이 될 듯함
    • 이미 그런 티셔츠는 존재하고, ChatGPT가 출력한 문구를 아무 검증도 없이 바로 인쇄하는 경우가 많음