5P by xguru 6달전 | favorite | 댓글과 토론
  • Eureka는 LLM(GPT-4)을 사용하여 로봇이 복잡한 작업을 수행하도록 훈련시키는 보상 알고리듬(소프트웨어 코드)을 자동으로 생성
  • 사람이 하는 것과 비슷한 "펜 돌리기" 기술을 로봇 손에게 훈련시킴
  • 또한 Eureka는 로봇에게 서랍과 캐비닛을 열고, 공을 던지고 잡고, 가위를 조작하는 등의 작업을 가르침
  • 작업별 프롬프트나 사전 정의된 보상 템플릿이 필요없으며, 사람의 피드백을 쉽게 통합