- Toyota Research Institute(TRI)는 Diffusion Policy를 기반으로 한 생성 AI 접근법을 사용하여 로봇에게 새로운 기술을 가르치는 돌파구를 발표했습니다.
- 이 새로운 접근법은 로봇의 유용성을 크게 향상시키며, 대화형 AI를 혁신시킨 Large Language Models(LLMs)와 유사한 "Large Behavior Models(LBMs)"을 로봇에게 구축하는 방향으로 한 걸음 나아갔습니다.
- 이 새로운 교육 기법은 효율적이며 높은 성능의 행동을 생성하므로, 로봇이 사람들을 더 효과적으로 지원할 수 있습니다.
- 이전의 로봇 교육 기법들은 느리고 일관성이 없으며 비효율적이었으며, 대부분은 매우 제한된 환경에서 수행되는 좁은 범위의 작업에 한정되었습니다.
- TRI는 새로운 접근법을 사용하여 액체를 붓는 것, 도구를 사용하는 것, 변형 가능한 물체를 조작하는 것과 같은 60가지 이상의 어려운, 민첩한 기술을 로봇에게 가르쳤습니다.
- TRI는 올해 말까지 수백 가지의 새로운 기술을, 2024년 말까지는 1,000가지를 가르치려는 목표를 가지고 있습니다.
- TRI의 로봇들은 이제 다양하고 풍부한 방법으로 세상과 상호작용할 수 있으며, 이는 언젠가 로봇이 일상적인 상황과 예측 불가능하고 끊임없이 변하는 환경에서 사람들을 지원할 수 있게 할 것입니다.
- TRI의 로봇 행동 모델은 선생님의 촉각적 시연과 목표에 대한 언어적 설명을 결합하고, AI 기반 Diffusion Policy를 사용하여 시연된 기술을 배웁니다.
- TRI와 Columbia University의 Song 교수님의 그룹과의 협업을 통해 Diffusion Policy를 개발했는데, 이는 행동 학습에 대한 강력한 생성 AI 접근법입니다.
- TRI의 로봇 플랫폼은 촉각적 피드백과 촉각 감지를 가능하게 하는 민첩한 양팔 조작 작업에 맞춤형으로 제작되었습니다.
- TRI는 Drake를 사용하는데, 이는 로봇 설계를 위한 모델 기반 설계로, 최첨단 도구 상자와 시뮬레이션 플랫폼을 제공하여 시뮬레이션과 현실에서의 개발을 더욱 확대하고 가속화할 수 있습니다.
- 안전성은 TRI의 로봇 개발 노력의 핵심이며, 시스템에는 로봇이 자신이나 환경과 충돌하지 않는 등의 안전 보장을 존중하도록 설계된 강력한 보호장치가 포함되어 있습니다.
- TRI의 이번 돌파구에 대한 보다 기술적인 정보는 TRI의 Medium 블로그에서 찾아볼 수 있으며, 10월 4일에 LinkedIn Live Q&A 세션에서 논의될 예정입니다.