GN⁺: 구글의 최고 AI "Gemini" 데모는 조작되었다
(techcrunch.com)Google의 Gemini AI 모델 데모 조작 논란
- Google의 새로운 Gemini AI 모델이 대중에게 첫 선을 보인 후 혼합된 반응을 받음
- 가장 인상적인 데모가 사실상 조작된 것으로 밝혀져 사용자들의 신뢰에 타격을 줌
- "Hands-on with Gemini: Interacting with multimodal AI"라는 비디오가 100만 조회수를 기록하며, 다양한 입력에 유연하고 반응적인 멀티모달 모델의 능력을 선보임
실제와 다른 데모
- 비디오는 실시간으로 이루어진 것처럼 보이지만, 실제로는 이미지 프레임과 텍스트 프롬프트를 사용하여 Gemini의 능력을 테스트한 것임
- 실제 상호작용과는 다르게, 비디오에서는 반응 속도와 정확성, 그리고 모델과의 상호작용 방식에 대해 오해를 불러일으킬 수 있는 내용을 담고 있음
- "레이턴시를 줄이고, Gemini 출력을 단축했습니다."라는 경고 문구가 있긴 하지만, 매우 매력적으로 보임
문서화된 능력과의 차이
- 비디오에서는 직관적이고 단어 없는 평가로 보이는 반면, 문서화된 능력은 모델이 개별 제스처를 바탕으로 추론하지 않고, 모든 제스처를 한 번에 보여주고 힌트를 줘야 함을 나타냄
- 예를 들어, 비디오에서는 종이 공이 컵 아래에서 바뀌는 것을 모델이 즉각적으로 감지하는 것처럼 보이지만, 실제로는 활동을 설명해야 하고, 모델을 훈련시켜야 함
- Google은 이 동영상이 "Gemini의 실제 결과물을 보여준다"고 말한건 사실이지만 "데모를 몇 가지 편집했다(이 사실을 투명하게 공개하고 있다)"고 말하는 것은 사실이 아님. 이 동영상은 데모가 아니며, 실제로는 데모를 알리기 위해 만든 것과는 매우 다른 상호작용을 보여줌
GN⁺의 의견
- Google의 Gemini AI 모델 데모 비디오가 실제 모델의 능력을 과장하여 제작된 것으로 드러나, 기술의 신뢰성에 의문을 제기함.
- 멀티모달 AI의 발전 가능성과 현재 기술의 한계를 동시에 보여주는 사례로, AI 기술의 진정한 현황을 이해하는 데 중요한 교훈을 제공함.
- 이 사건은 AI 기술의 발표와 데모가 실제 사용자 경험과 얼마나 일치하는지에 대한 투명성과 정직성의 중요성을 강조함으로써, 기술 분야에 종사하는 사람들에게 흥미로운 논의를 제공함.
놀라운 영상이기는 했는데, 짧은 시간에 편집해서 제공하다 보면 나올수 밖에 없는 이슈라고 생각 되네요.
구글이 많이 힘든가 보다 생각도 들고, 실제로 나와보면 알겠지 라는 생각도 함께 듭니다.
어쨋거나 OpenAI가 혼자 달려나가는 것보다는 경쟁이 더 좋으니까, 구글도 화이팅