"LLMs의 '급발진' 능력, 사실은 점진적이고 예측

▲

GN⁺ 2024-03-26 | parent | ★ favorite | on: "LLMs의 '급발진' 능력, 사실은 점진적이고 예측 가능하게 발달한다 – 연구 결과"(quantamagazine.org)

Hacker News 의견

연구와 관련된 몇 가지 문제점
- 연구에서 사용된 평가 방식이 기술력을 제대로 반영하지 못할 수 있음.
- 저자들의 측정 기준에도 불구하고 몇 가지 잠재적인 능력이 나타남.
- 과거 데이터를 바탕으로 결과를 예측하는 것은 쉽지만, 실제로는 예상치 못한 결과가 나타난 것이 중요한 현상임.
- 이 논문에는 가치가 있으나 결론을 지나치게 확장해서는 안 됨.
미래 예측의 어려움
- 미래를 예측하는 것은 이미 일어난 후에야 쉬워짐.
- 고차원 능력은 여러 하위 능력에 의존하며 예측하기 어려움.
- 예측을 위해서는 필요한 기본 요소들을 미리 식별하고, 이들이 어느 수준에 도달해야 하는지 시뮬레이션해야 함.
- 데이터의 종류와 품질도 중요하며, 모델 버전 간에 급격한 변화가 있을 수 있음.
측정 기준 변경에 따른 결과의 변화
- 다른 측정 기준을 사용하면, 나타나는 현상이 사라질 수 있음.
- 물 분자를 개별적으로 관찰하면 갑자기 나타나는 얼음 덩어리 대신 점진적인 결정 구조 형성을 볼 수 있음.
논문 제목: "Are Emergent Abilities of Large Language Models a Mirage?"
- 논문 링크: arXiv:2304.15004
능력의 급격한 변화에 대한 관찰
- 다른 연구에서도 능력의 급격한 도약을 발견함.
- 모델이 점진적으로 더 똑똑해지고 있을 수 있으며, 부분적인 답변에 대한 점수를 주지 않는 측정 방식으로 인해 이러한 진전을 놓칠 수 있음.
부분 점수 접근법과 모델 훈련
- 부분 점수를 주는 것은 좋지만, 정확한 답을 얻기 위한 훈련이 중요함.
- 모델 크기가 클수록 수렴에 도달하기 쉬움.
- 모델 크기가 증가함에 따라 능력이 갑자기 나타나는 것으로 볼 수 있음.
능력의 점진적 출현
- 능력이 나타나는 데 급격한 도약이나 예측 불가능성이 필요하지 않음.
- 새로운 능력은 점진적으로 나타날 수 있음.
대규모 언어 모델(Large Language Models, LLMs)의 한계
- LLMs는 가능성을 평가하는 엔진임.
- 단순히 LLMs의 규모를 확장하는 것만으로는 인공 일반 지능(Artificial General Intelligence, AGI)을 생성하지 못함.
측정 기준에 대한 혼란
- 편집 거리(edit distance)를 사용한 측정 방식이 적절하지 않을 수 있음.
- 모델이 산술을 이해하는지 테스트하는 데 이상한 방법으로 보임.
- 실제 값과 예상 값의 차이를 고려하는 것이 더 나을 수 있음.
- 논문 링크: arXiv:2206.07682