# 인간 수준의 경쟁력 있는 로봇 탁구 달성

> Clean Markdown view of GeekNews topic #20747. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=20747](https://news.hada.io/topic?id=20747)
- GeekNews Markdown: [https://news.hada.io/topic/20747.md](https://news.hada.io/topic/20747.md)
- Type: news
- Author: [baeba](https://news.hada.io/@baeba)
- Published: 2025-05-07T10:12:59+09:00
- Updated: 2025-05-07T10:12:59+09:00
- Original source: [sites.google.com](https://sites.google.com/view/competitive-robot-table-tennis/home?pli=1)
- Points: 2
- Comments: 0

## Topic Body

1. DeepMind 팀은 계층적 정책 구조와 실시간 적응 기술을 활용해 **로봇 탁구 에이전트가 아마추어 인간 수준의 경기력을 달성**했다고 발표했다.  
2. 이 로봇은 **제로샷 시뮬레이션-현실 전이(sim-to-real)**, **실전 적응**, **실제 인간 상대와의 경기 테스트**를 통해 검증되었다.  
3. 그 결과, 초보자에겐 100%, 중급자에겐 55%의 승률을 보이며 **확실한 중급 인간 수준의 경기력**을 입증하였다.  
  
---  
  
##### 1. 연구 배경과 기여  
  
* 탁구는 **전략성과 고속 운동 제어가 동시에 요구되는 복잡한 스포츠**로, 로봇에게 인간 수준의 도전 과제를 제공함.  
* 기존 연구는 단순한 랠리 수행에 머물렀고, **실제 인간과의 경쟁적 경기 플레이는 본 연구가 최초**.  
* 본 연구의 기여는 다음과 같음:  
  
  * **계층적 정책 구조(HLC + LLC)**  
  * **제로샷 sim-to-real 전이 기법**  
  * **실시간 상대 적응 시스템**  
  * **29명의 실제 인간 플레이어를 통한 사용자 평가 실험**  
  
---  
  
##### 2. 시스템 구성 및 학습 방법  
  
* \*\*하위 제어기(LLC)\*\*는 특정 기술(포핸드, 백핸드, 서브 등)에 특화된 정책과 능력 설명자(skill descriptor)를 가짐.  
* \*\*상위 제어기(HLC)\*\*는 경기 상황, 상대 통계, 각 LLC의 특성을 고려해 적절한 기술을 선택함.  
* **훈련 과정**은 초기 인간 데이터 → 시뮬레이션 → 실전 적용 → 반복 학습 순으로 진행되며, 이로 인해 **자동 커리큘럼 학습 구조**가 형성됨.  
  
---  
  
##### 3. 성능 평가 및 한계 분석  
  
* 총 29명의 다양한 실력의 인간 플레이어와 경기:  
  
  * 초보자: 100% 승  
  * 중급자: 55% 승  
  * 상급자 이상: 전패  
    → 종합 승률: **45%** (경기 기준), **46%** (세트 기준)  
* **질적 평가**에서 참가자들은 “재미있고 몰입감 있다”고 평가했고, 평균 5분 중 4분 이상을 자발적으로 플레이함.  
* 단점:  
  
  * **언더스핀 처리 미숙**  
  * **낮은 공 대응 어려움**  
    → 이는 탁구대와의 충돌 회피 및 스핀 추정의 어려움 때문으로 향후 개선 과제

## Comments


_No public comments on this page._