7P by ninebow 2023-07-27 | favorite | 댓글 1개

소개

이번 해에는 여섯 편의 논문이 뛰어난 논문상을 수상하였습니다. 선정 과정은 다음과 같습니다.

먼저, 논문들이 사전 필터링을 거쳐 32편의 잠재적인 수상 논문들로 선정되었습니다. 이 과정에서는 평균 점수가 높은 논문들과 프로그램 위원회의 추천을 받은 논문들이 선택되었습니다. 결과적으로 이 세트는 구두 발표 세션에서 다루어진 16개의 주제를 다루는 논문들을 포함하고 있었습니다. 이 논문들은 뛰어난 논문상 위원회에게 제공되었습니다.

위원회는 이 논문들을 고려하여 그들의 탁월한 명료성, 통찰력, 창의성, 그리고 지속적인 영향력에 따라 수상 논문을 선정하였습니다.

물론, 수상 논문을 선택하는 완벽한 과정은 없지만, 우리는 ICML 커뮤니티가 이 논문들의 매우 강력한 기여를 인정할 것이라고 믿습니다.

  • 뛰어난 논문상 위원회: Danqi Chen, Bohyung Han, Samuel Kaski, Mengdi Wang, Tong Zhang

수상자들은 다음과 같습니다(논문 ID 순서대로):

  1. 학습률 없는 학습에 의한 D-적응 (Learning-Rate-Free Learning by D-Adaptation)
    Aaron Defazio (FAIR), Konstantin Mishchenko (Samsung AI Center)
    https://openreview.net/forum?id=GXZ6cT5cvY
    이 논문은 비스무수한 확률적 볼록 최적화에 대한 학습률 없는 최적의 경계를 얻는 도전을 해결하려는 흥미로운 접근법을 소개합니다. 저자들은 이러한 문제를 최적화하는 데 전통적인 학습률 선택이 가지는 제한을 극복하는 새로운 방법을 제안합니다. 이 연구는 최적화 분야에 귀중하고 실용적인 기여를 합니다.

  2. 대형 언어 모델에 대한 워터마크 (A Watermark for Large Language Models)
    John Kirchenbauer, Jonas Geiping, Yuxin Wen, Jonathan Katz, Ian Miers, Tom Goldstein (University of Maryland)
    https://openreview.net/forum?id=aX8ig9X2a7
    이 논문은 대형 언어 모델의 출력에 워터마크를 적용하는 방법, 즉 생성된 텍스트에 사람에게는 보이지 않지만 알고리즘적으로 감지할 수 있는 신호를 임베딩하는 방법을 제안합니다. 워터마크는 언어 모델을 다시 훈련하지 않고 생성할 수 있으며, API나 매개변수에 접근하지 않고도 감지할 수 있습니다. 논문은 또한 워터마크를 감지하기 위한 해석 가능한 p-값을 가진 통계적 테스트를 제안하고, 그 민감도를 분석하기 위한 정보 이론적 프레임워크를 제시합니다. 제안된 방법은 간단하고 새로운 것이며, 철저한 이론적 분석과 탄탄한 실험을 제시합니다. LLM에 의해 생성된 합성 텍스트를 감지하고 감사하는 데 생기는 중요한 도전을 감안할 때, 이 논문은 커뮤니티에 중요한 영향을 미칠 가능성이 있습니다.

  3. 보이지 않는 것에 대한 일반화, 논리적 추론, 그리고 학위 커리큘럼 (Generalization on the Unseen, Logic Reasoning and Degree Curriculum)
    Emmanuel Abbe (EPFL, Apple) , Samy Bengio (Apple), Aryo Lotfi (EPFL), Kevin Rizk (EPFL)
    https://openreview.net/forum?id=3dqwXb1te4
    이 작업은 불린 함수의 학습에 중요한 발전을 제공하며, 특히 보이지 않는 것에 대한 일반화(GOTU) 설정을 대상으로 합니다. 이는 분포 외 일반화 문제를 제기하는 도전적인 문제입니다. 논문은 이 중요한 주제를 깊게 다루며, 이론적 분석과 광범위한 실험을 지원하는 잘 구조화된 접근법을 제시합니다. 이 연구는 불린 함수 학습의 이론적 이해를 향상시키고, 이를 실제 알고리즘에 적용하는 방법을 보여줍니다.

  4. 알고리즘 정보 비율을 사용한 탐색-이용 전략의 설계 (Designing Exploration-Exploitation Strategies Using the Algorithmic Information Ratio)
    Yonathan Efroni (Technion), Gal Dalal (Technion), Shie Mannor (Technion), Ofer Shayevitz (Tel Aviv University)
    https://openreview.net/forum?id=tRhQsHnoFw
    이 논문은 밴딧 및 기타 순차적 의사결정 전략을 설계하는 매우 일반적인 문제를 다룹니다. 이는 알고리즘 정보 비율이라는 새로운 수량을 사용하여 어떤 전략의 후회를 제한하는 방법을 제안하며, 이 경계를 최적화하는 방법을 도출합니다. 이 경계는 이전의 유사한 정보 이론적 수량보다 더 타이트하며, 방법들은 확률적 및 적대적 밴딧 설정에서 잘 수행되며, 모든 세계에서 최고의 성능을 달성합니다. 특히 흥미로운 점은 이 논문이 밴딧을 위한 잘 알려진 톰슨 샘플링과 UCB를 넘어서 새로운 탐색-이용 전략의 전체 라인을 열 수 있을 것이라는 가능성을 제시한다는 것입니다. 이 원칙이 강화 학습에 확장되는 것은 매우 유망합니다. 이 논문은 전문 리뷰어들에게 일치되게 강력하게 지지받았습니다.

참고 자료

ICML 2023의 공식 웹사이트입니다. 다양한 논문과 수상작들을 확인할 수 있습니다:
https://icml.cc/Conferences/2023

논문들의 리뷰와 토론을 확인할 수 있는 플랫폼입니다. 각 논문의 링크를 통해 더 자세한 내용과 토론을 볼 수 있습니다:
https://openreview.net/


  • *이 글은 GPT-4를 사용하여 자동 생성한 설명으로, 잘못된 내용이 있을 수 있습니다. *
  • 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다! ‍♂️