7P by neo 1달전 | favorite | 댓글 9개
  • 요한슨의 홍보 담당자인 마르셀 파리소가 NPR에 제공한 성명서. 한국어로 기계 번역

    "작년 9월, 샘 알트먼으로부터 현재 ChatGPT 4.0 시스템의 음성 역할을 맡아달라는 제안을 받았어요. 그는 제가 기술 회사와 창작자 간의 간극을 좁히고, 소비자들이 인간과 AI에 관한 지각변동에 편안함을 느끼도록 도울 수 있을 거라고 말했죠. 제 목소리가 사람들에게 위안이 될 거라고도 했어요.

    오랜 고민 끝에 개인적인 이유로 그 제안을 거절했어요. 9개월 후, 제 친구들과 가족, 그리고 대중들은 "Sky"라는 이름의 새로운 시스템이 제 목소리와 얼마나 비슷한지 지적했어요.

    공개된 데모를 들었을 때, 알트먼 씨가 제 목소리와 너무나 흡사해서 가장 가까운 친구들과 뉴스 매체조차 구분하기 어려운 목소리를 추구했다는 사실에 충격을 받고, 분노했으며, 믿기 어려웠어요. 알트먼 씨는 심지어 그 유사성이 의도적이었음을 암시하며, 제가 채팅 시스템 사만다의 목소리 연기를 맡아 인간과 친밀한 관계를 형성했던 영화 "그녀"를 언급하는 단 한 단어 "her"를 트윗했죠.

    ChatGPT 4.0 데모가 공개되기 이틀 전, 알트먼 씨는 제 에이전트에게 연락해 다시 한번 고려해 달라고 했어요. 우리가 연결되기도 전에 그 시스템은 이미 공개되어 있었죠.

    그들의 행동으로 인해 저는 법률 자문을 받을 수밖에 없었고, 변호사는 알트먼 씨와 OpenAI에 두 차례 서한을 보내 그들이 한 일과 "Sky" 목소리를 만든 정확한 과정을 설명해달라고 요청했어요. 결국 OpenAI는 마지못해 "Sky" 목소리를 내리기로 합의했죠.

    우리 모두가 딥페이크와 자신의 초상권, 자신의 작품, 정체성 보호와 씨름하는 이 시기에, 저는 이런 문제들이 절대적인 명확성을 요구한다고 믿어요. 투명성과 개인의 권리를 보호하기 위한 적절한 법안 통과라는 형태의 해결을 기대하고 있어요."

개인적으로는 이미 Sky voice 는 6개월 전에 출시해서 누구나 iOS 앱으로 쓸수 있었고, 스칼렛 요한슨 혹은 'her' 와 유사하다고 화제가 된적이 없었는데... (reddit, hn 등에서도 써본 사람들은 같은 목소리로 혼동될 정도는 아니라고들..) 저도 지금은 분명 sky 설정해보면 'her' 의 스칼렛 요한슨 느낌의 목소리라는 건 알겠지만,,, 동일한 목소리는 아니라고 느껴지구요.
이런 경우에도 스칼렛 요한슨이 목소리 권리를 주장하는게 타당한지 의문입니다.

예전에 올라온 데모: https://www.youtube.com/watch?v=RcgV2u9Kxh0

스칼렛 요한슨이라고 알고 지금 들어보니 분명 스칼렛 요한슨과 비슷하긴 하지만... ㅎ

지금은 생각이 달라지셨길 빕니다.

참.. 그래도 AI 업계를 이끌어나간다는 기업이..

Hacker News 의견

해커뉴스 댓글 모음 요약

  • OpenAI와 Scarlett Johansson의 갈등

    • OpenAI가 Scarlett Johansson에게 접근했으나 거절당함. GPT-4o 출시 이틀 전, 다시 그녀의 에이전트에게 연락했으나 무응답. 결국 OpenAI는 그녀의 목소리를 흉내낸 제품을 시연함. 이후 Scarlett의 법률팀이 문의하자 OpenAI는 해당 목소리를 제품에서 제거함.
  • OpenAI의 무리한 행동

    • OpenAI가 Johansson을 여러 번 고용하려 했으나 실패하고, 그녀의 목소리를 흉내낸 것은 좋지 않은 행동이라는 의견.
  • ChatGPT-4o 데모에 대한 비판

    • Altman이 "그녀"를 복사하려는 시도가 불쾌하다는 의견. Johansson이 참여하지 않기로 한 것은 좋은 결정이라는 평가. TTS 엔진이 여전히 사용되고 있다는 점이 명확해짐.
  • Mira Murati의 발언

    • GPT-4o의 음성 모드는 영화 'Her'보다는 인간 대화의 자연스러운 측면에서 영감을 받았다는 Murati의 발언이 인상적이라는 의견. Murati가 질문에 얼어붙은 것은 법적 문제를 피하기 위한 행동으로 보임.
  • Sam의 트윗

    • Sam의 트윗이 Scarlett Johansson의 법률팀에게 필요한 모든 증거를 제공했다는 의견.
  • 법적 문제

    • Sky 목소리가 Scarlett Johansson이 아닌 영화 'Her'에서의 그녀를 흉내낸 것이라는 점. 성우의 목소리가 AI 모델에 의해 도용되는 문제와 관련된 법적 논의. Johansson의 계약에 따라 법적 지위가 달라질 수 있음.
  • Johansson의 선택

    • Johansson이 상당한 로열티와 협력 기회를 포기한 것이 흥미롭다는 의견. 자신의 목소리가 무단으로 사용되는 것에 대한 불쾌감을 이해할 수 있음. 이는 개발자가 자신의 코드가 AI에 의해 무단으로 사용되는 것과 유사함.
  • 법적 대응

    • Johansson이 변호사를 고용할 수 있는 재정적 여유가 있어 OpenAI가 물러났다는 의견. Altman과 OpenAI가 다른 사람들의 권리를 쉽게 침해할 수 있다는 우려.
  • Weird Al Yankovic의 사례

    • Weird Al Yankovic이 동의의 개념을 준수하면서도 원하는 것을 얻어낸 사례를 본받아야 한다는 의견.
  • 법적 대응 촉구

    • Johansson이 회사를 상대로 소송을 제기해 본보기를 보여주기를 바라는 의견. 그녀는 싸울 자원이 있고, 회사도 그럴 가치가 있다는 평가.

댓글 훑어보면 반AI 의견이 꽤 있어요.

OpenAI에서는 어떻게 나오려나요.

'이 목소리는 당신이 아니에요. 당신 목소리는 이겁니다.' 하면서 진짜 완벽하게 복제된 스칼렛 요한슨의 목소리를 들려주려나요?

일처리가 좀 아쉽긴 하네요. 자신감의 부작용인지...

이 업계 특유의 '허락보다 용서가 쉽다.'는 격언을 제대로 깨뜨릴 한 방을 날려줬으면 합니다. 헐리우드 스타에게 이런 태도면 일반인의 항의에 히트맨을 보낼지도 모르겠어요.

OpenAI는 이와 관련해서 ChatGPT의 음성을 선정한 방법 글을 별도로 올린바 있습니다.

ChatGPT 음성을 선택하는 과정

  • ChatGPT의 음성 모드는 사용자들에게 사랑받는 기능 중 하나임
  • 5개의 개성 있는 음성(Breeze, Cove, Ember, Juniper, Sky)은 5개월에 걸친 광범위한 과정을 통해 신중하게 선택됨
  • 전문 성우, 에이전시, 캐스팅 감독, 업계 고문 등이 참여함

창작 커뮤니티 지원과 성우업계와의 협력

  • OpenAI는 창작 커뮤니티를 지원하고 성우 캐스팅을 위해 성우업계와 긴밀히 협력함
  • 각 성우는 시장 최고 수준 이상의 보상을 받으며, 음성이 제품에 사용되는 한 계속될 예정임
  • AI 음성은 유명인의 독특한 목소리를 의도적으로 모방하지 않아야 한다는 신념을 가짐
  • Sky의 음성은 스칼렛 요한슨의 모방이 아니라 다른 전문 여배우의 자연스러운 목소리임
  • 성우들의 프라이버시 보호를 위해 이름은 공개하지 않음

음성 기준 설정을 위해 수상 경력의 캐스팅 감독 및 프로듀서와 협력

  • 2023년 초, 성우 선정을 위해 독립적이고 저명하며 수상 경력이 있는 캐스팅 감독 및 프로듀서와 협력함
  • 각 음성의 독특한 개성과 글로벌 청중에 대한 매력을 신중하게 고려하여 ChatGPT 음성에 대한 기준을 만듦
  • 기준에는 다양한 배경 또는 다국어 구사 가능, 시대를 초월하는 음성, 신뢰감을 주는 음성, 따뜻하고 매력적이며 자신감을 주는 음성 등이 포함됨

400개 이상의 지원을 받은 성우 및 스크린 배우

  • 2023년 5월, 캐스팅 에이전시와 캐스팅 감독은 인재 모집 공고를 냄
  • 1주일 만에 400개 이상의 지원을 받음
  • 배우들은 ChatGPT 응답 대본을 받아 녹음하는 방식으로 오디션을 봄

최종 5개 음성 선정 및 배우들과 AI 음성 상호작용에 대한 비전 논의

  • 2023년 5월 내내 캐스팅팀은 14명의 배우를 독립적으로 검토하고 선정함
  • 최종 후보 음성을 OpenAI에 제출하기 전 추가로 정제 작업을 거침
  • 각 배우와 AI 음성 상호작용에 대한 비전과 기술의 능력, 한계, 위험, 안전장치 등에 대해 논의함
  • 배우들이 프로젝트에 전념하기 전에 음성 모드의 범위와 의도를 이해하는 것이 중요했음
  • OpenAI 내부 팀이 제품 및 연구 관점에서 음성을 검토한 후 신중한 고려 끝에 최종 음성이 선정됨

녹음을 위해 샌프란시스코로 배우 초청 및 ChatGPT 음성 출시

  • 6월과 7월에 녹음 세션과 OpenAI 제품 및 연구 팀과의 대면 미팅을 위해 배우들을 샌프란시스코로 초청함
  • 2023년 9월 25일, ChatGPT에 음성을 출시함
  • 전체 과정은 5개월에 걸쳐 배우 및 캐스팅팀과 광범위한 협력이 이루어짐
  • GPT-4o의 오디오 연구 및 새로운 음성 기능을 위해 배우들과 계속 협력 중임

유료 사용자를 위한 GPT-4o의 새로운 음성 모드 및 추가 음성 도입 계획

  • 향후 몇 주 내에 ChatGPT Plus 사용자에게 GPT-4o의 새로운 음성 모드 알파 버전 제공 예정
  • GPT-4o를 사용하면 음성으로 ChatGPT와 훨씬 더 자연스럽게 상호 작용할 수 있음
  • GPT-4o는 중단을 원활하게 처리하고, 그룹 대화를 효과적으로 관리하며, 배경 소음을 필터링하고, 톤에 적응함
  • 앞으로 사용자의 다양한 관심사와 선호도에 더 잘 부합하기 위해 ChatGPT에 추가 음성 도입 계획을 가지고 있음