1P by neo 19일전 | ★ favorite | 댓글 1개
Hacker News 의견
  • 다양한 데모 도구 상자에 대한 설명임

    • Segment Anything 2: 비디오 컷아웃 및 재미있는 시각 효과를 몇 번의 클릭으로 생성함
    • Seamless Translation: 다른 언어로 들리는 자신의 목소리를 경험할 수 있음
    • Animated Drawings: 손으로 그린 스케치를 애니메이션으로 생동감 있게 만듦
    • Audiobox: AI로 생성된 목소리와 소리를 사용하여 오디오 스토리를 만듦
  • Seamless Translation은 꽤 놀라운 기능임

    • 영어와 스페인어를 구사하는 사용자가 영어 문장을 녹음하고 생성된 스페인어 출력을 들었을 때, 자신의 스페인어와 거의 비슷했음
    • 다만, 사용자의 스페인어에는 카스티야어 특유의 표현이 더 많이 포함되어 있음
  • 제목에 Aidemos라고 쓰여 있는 이유가 궁금함

  • Meta의 AI 연구 방향이 궁금함

    • Google과 MSFT의 목표는 이해되지만, Meta의 최종 목표는 잘 모르겠음
  • Seamless Translation 데모는 훌륭함

    • 번역된 목소리가 자신의 원래 목소리와 비슷함
    • 실시간으로 이 기능을 구현할 수 있다면 놀라운 일이 될 것임
  • Meta는 GPT-3와 ChatGPT의 영향을 깊이 이해하고 있음

    • 모델은 시작점이며, 모델을 활용한 UX가 지능을 보여줌
    • 특히 시각 모델에서 두드러짐
    • SAM2가 "무엇이든 볼 수 있다"고 말하는 것이 흥미로움
    • 축구공을 클릭하고 모델이 비디오에서 가려져도 매끄럽게 추적하는 것을 보는 것이 놀라움
  • 모든 데모가 포함된 것은 아님

    • 예를 들어, Meta Motivo 데모가 누락되어 있음 (휴머노이드 제어 모델)
  • "현재 귀하의 지역에서는 사이트를 이용할 수 없습니다"라는 메시지가 표시됨

  • 모델에 대한 모든 링크가 어디 있는지 궁금함

  • 흥미롭지만 Meta가 실제로 무엇을 원하는지 명확히 밝혔으면 좋겠음

    • "모델을 추가로 훈련시키기 위해 In the Wild 데이터를 제공해 주세요"라는 의미일 것임
  • 몇 년 전 나이 추정 기술을 사용한 경험이 있음

    • 사용자가 이미지를 업로드하고 얼굴 랜드마크 포인트의 10%를 정렬하는 데 도움을 주면 추정기를 실행함
    • 잘못된 경우 수정 요청을 받아 개선함
    • 여전히 멋지지만 이전 경험에 비해 큰 감흥은 없음