GN⁺: 브레인GPT, 생각을 텍스트로 변환
(iflscience.com)마음 읽기 기술의 새로운 돌파구
- 시드니 공과대학교의 GrapheneX-UTS 인간 중심 인공지능 센터 연구진이 '마음 읽기' 기술에 관한 새로운 돌파구를 발표함.
- 이 연구는 생각을 화면에 표시된 단어로 변환하는 데 성공, 원시 EEG 파동을 직접 언어로 번역하는 선구적인 노력으로 평가됨.
- 뇌파를 텍스트로 번역하는 과정에서 이산 부호화 기법을 도입하고, 대규모 언어 모델과의 통합으로 신경과학과 AI 분야에서 새로운 전망을 열었다고 함.
뇌파를 이용한 언어 번역 기술
- 참가자들이 텍스트를 조용히 읽는 동안, DeWave라는 AI 모델이 그들의 뇌파만을 입력으로 사용하여 화면에 단어를 투사함.
- 이 기술은 뇌 이식이나 전체 MRI 기계에 접근할 필요 없이 뇌 신호를 언어로 번역할 수 있는 유일한 기술임.
- 추가 입력, 예를 들어 안구 추적 소프트웨어가 필요한 이전 기술들에 비해, 이 새로운 기술은 그러한 추가 기능 없이도 사용 가능함.
실용성과 편의성
- 사용자는 EEG를 통해 뇌 활동을 기록하는 모자만 착용하면 되므로, 안구 추적기나 MRI 기계보다 훨씬 실용적이고 편리함.
- 연구진은 신호가 이식물에서 얻은 정보보다 다소 잡음이 많다고 인정했지만, 시험에서 기술이 상당히 잘 수행됨을 밝힘.
- BLEU 알고리즘을 사용한 정확도 측정에서 이 기술은 약 0.4의 점수를 받음.
정확도 개선 가능성
- 모델은 동사와 일치하는 데 더 능숙하지만, 명사의 경우 '작가' 대신 '남자'와 같이 동의어 쌍을 선호하는 경향이 있음.
- 연구진은 뇌가 이 단어들을 처리할 때 의미적으로 유사한 단어가 비슷한 뇌파 패턴을 생성할 수 있다고 생각함.
- 연구진은 정확도를 0.9까지 향상시킬 수 있을 것으로 믿으며, 이는 전통적인 언어 번역 프로그램과 비슷한 수준임.
- 연구진은 29명의 참가자를 대상으로 실험을 진행했는데, 이는 다른 디코딩 기술 시험보다 훨씬 많은 수치임.
GN⁺의 의견
- 이 기술은 뇌파를 통해 사람의 생각을 직접적으로 언어로 번역하는 놀라운 진보를 나타냄.
- 뇌 이식이나 복잡한 기계 없이 EEG 모자만으로 사용할 수 있는 접근성은 이 기술을 매우 혁신적으로 만듦.
- 미래에는 이 기술이 의사소통 장애를 가진 사람들에게 큰 도움을 줄 수 있으며, 인간과 기계 간의 상호작용을 새로운 차원으로 끌어올릴 잠재력을 가짐.
Hacker News 의견
-
뇌-컴퓨터 인터페이스(BCI) 연구는 주로 마비 환자들이 의사소통을 회복할 수 있도록 하는 데 초점을 맞추고 있음.
- EEG는 두개골 외부에서 뇌의 전기장이 약해지는 물리적 한계로 인해 충분한 신호 대 잡음 비율을 제공하지 못해 좋은 통신 속도를 지원하지 못함.
- 상업적 "마음 읽기" 장난감은 실제로 머리와 눈 근육 신호를 기반으로 작동함.
- 이식된 전극은 더 나은 신호를 제공하지만 상업적으로 실용화되기까지 여러 번의 개선이 필요함. 신호는 몇 달이 지나면서 뇌가 전극 주변에 흉터 조직을 형성함에 따라 저하되고, 뇌 수술은 분명 위험함.
- 인간을 대상으로 한 테스트에 대한 정부 승인이 필요하기 때문에 반복 주기가 매우 느림.
- 마비된 친구를 돕고자 한다면, 눈만 움직일 수 있는 경우 눈 추적 기술에 집중할 것임.
-
뇌 신호를 언어로 번역할 수 있는 기술은 처음이 아니지만, 뇌 이식이나 전체 MRI 기계에 접근할 필요가 없는 유일한 기술임.
- 센서 기술이 충분히 좋아져서 모자를 쓸 필요조차 없게 되면, 사람들이 공공장소에서 생각을 읽히는 것에 대한 합리적인 기대를 갖지 말라고 말하는 시대가 올지 궁금함.
-
이 기술은 자기 성찰에도 도움이 될 수 있음.
- 자신의 생각 패턴을 외부에서 분석할 수 있어 교육 기법의 효과를 찾고, 집중력이 가장 높고 낮은 시간을 객관적으로 파악하며, 불안한 생각이 시작되는 시점과 그 원인을 정확히 알 수 있음.
- FMRI를 뇌 스캐닝 거짓말 탐지기로 사용할 수 있지만, 그 정당성에 대한 많은 의문이 있음.
-
DARPA의 "Silent Talk" 프로젝트는 14년 전에 시작되었으며, 신경 신호 분석을 통해 전투 중 구두 의사소통 없이 사용자 간의 의사소통을 가능하게 하는 것이 목표였음.
-
이 기술은 뇌졸중 환자에게 도움이 될 수 있지만, 필터링되지 않은 생각을 내보낼 수도 있어 문제가 될 수 있음.
-
EEG를 사용하여 생각을 예측하는 것은 마치 뭄바이의 구름을 보고 오스틴의 구름을 예측하려는 것과 같음. 개별 뉴런의 전기 신호는 대규모 진동 속에서 사라지고, 뇌와 장치 사이의 뼈, 근육, 조직의 층에 의해 더욱 흐려짐. 비트율은 초당 1비트로 대부분의 사용 사례에 완전히 부족함.
-
이 모델의 기본 버전에는 코드에 버그가 있어 기준 결과가 부풀려졌으며, 문제를 조사 중임.
-
언어적이지 않은 생각도 작동할 수 있는지 궁금함. 예를 들어, 일상 활동과 관련된 신호 데이터셋을 기반으로 개의 생각이나 꿈을 알아낼 수 있음.
-
모든 끔찍한 함의를 제외하고, 이 기술은 매우 멋진 것을 가능하게 함: 양방향 정신적 의사소통.
- 메시지를 생각하고 "보내기"를 생각하면, 이어버드를 통해 응답을 들을 수 있음. 음성 복제 기술을 사용하면 발신자의 목소리로 메시지를 받을 수 있음. 외부 관찰자에게는 완전히 조용하고 보이지 않음.