긴 컨텍스트의 문제를 해결하는 방법

(dbreunig.com)

9P by GN⁺ 2달전 | ★ favorite | 댓글과 토론

긴 컨텍스트 사용 시 발생하는 대표적인 문제로는 컨텍스트 오염, 혼란, 충돌, 산만함 등 다양한 정보 관리 이슈가 존재함
정보 관리가 핵심이며, 잘못된 정보는 결과의 품질에 직접적인 악영향을 미침
주요 해결책으로는 RAG, Tool Loadout, Context Quarantine, Pruning, Summarization, Offloading 등의 전술이 효과를 보임
최신 LLM의 컨텍스트 윈도우가 큰 경우에도 불필요한 정보 남용은 여전히 실제 문제를 일으킨다는 점에 주의 필요함
각 전술은 에이전트 설계자가 컨텍스트를 체계적으로 관리하고 효율성 및 정확성을 높이는 데 큰 도움이 됨

긴 컨텍스트에서 발생하는 문제와 요약

긴 컨텍스트를 사용할 때 시스템에서 발생할 수 있는 대표적인 실패 유형은 다음과 같음

컨텍스트 오염: 헛소리(hallucination) 또는 오류가 컨텍스트에 포함되어 반복적으로 참조되는 문제
컨텍스트 산만함: 컨텍스트가 너무 길어져 모델이 본래 학습 내용 대신 컨텍스트에만 집중하는 현상
컨텍스트 혼란: 불필요한 정보가 추가되어 품질이 낮은 응답을 생성하는 상황
컨텍스트 충돌: 새롭게 추가된 정보나 도구가 기존 정보와 충돌하는 경우

이러한 문제는 모두 정보 관리에 기인하며, 프로그래밍에서 “Garbage in, garbage out” 격언처럼 입력 정보가 결과에 큰 영향을 줌.
다행히 여러 가지 전술로 위와 같은 이슈를 효과적으로 완화하거나 예방할 수 있음

주요 컨텍스트 관리 전술

RAG (Retrieval-Augmented Generation)

RAG란 필요한 정보만 골라 LLM에 제공하여 응답 품질을 높이는 방식임
LLM의 컨텍스트 윈도우가 커지면서 ‘모든 정보를 다 집어넣자’는 시도가 많지만, 불필요한 정보는 오히려 결과를 망침
RAG는 오늘날에도 여전히 매우 중요한 기술로 활용 중임

Tool Loadout (도구 구성 선택)

필요한 도구만 선택적으로 컨텍스트에 삽입하는 방법
도구 설명을 벡터 DB로 관리하다가 프롬프트별로 RAG를 활용해 최적의 도구를 선택함
30개가 넘는 도구 부터는 겹치는 설명으로 혼란이 발생하며, 100개가 넘으면 모델의 성능이 급격히 저하됨
“Less is More” 논문에서 Llama 3.1 8b는 46개 도구를 제공할 때 실패하지만 19개만 제공할 때 성공함
동적으로 필요한 도구를 선택할 수 있도록 LLM 기반 추천기를 사용했으며, 이로 인해 성능, 속도, 전력 효율성 모두 상승함

Context Quarantine (컨텍스트 격리)

컨텍스트를 분리된 스레드에서 각각 관리하는 방법
연구, 탐색 등 문제를 여러 부분으로 분할해 각각 별도의 에이전트(Agent)가 담당하도록 설계함
Anthropic의 multi-agent 시스템에서는 서브에이전트별로 독립된 컨텍스트 윈도우를 사용하여 효율성 및 정밀성을 높임
이 설계는 특히 여러 방향으로 동시에 탐색해야 하는 과제에서 강점이 뚜렷하게 나타남

Context Pruning (컨텍스트 가지치기)

불필요한 정보나 오래된 정보를 계속 걸러내는 방법
NLP 분야에서는 오래 전부터 다양한 pruning 기법이 활용되어왔음
최신에는 Provence처럼 가볍고 빠른 컨텍스트 ‘정리’ 전용 모델이 등장함(1.75GB, 95% 문서 압축 가능)
컨텍스트를 딕셔너리 등 구조화된 형태로 관리하면 가지치기와 요약(압축)이 쉬워짐

Context Summarization (컨텍스트 요약)

컨텍스트 길이가 길어질 때 전체를 압축·요약하는 방식
단순히 창을 넘지 않게 유지하는 용도뿐 아니라, 불필요한 반복이나 산만함 현상을 예방하는 데 효과적임
압축 단계에서 어떤 정보를 유지할지 정의하는 것이 중요함
별도의 LLM-powered 요약 단계를 통해 평가 데이터를 축적·개선 가능함

Context Offloading (컨텍스트 오프로드)

컨텍스트 외부에 메모 공간을 만들어 기록을 남기는 전략
예시로 Anthropic의 “think” tool은 별도 scratchpad를 마련해 LLM이 필요한 중간 메모를 남기도록 유도함
도구 출력분석, 정책 검증, 순차적 의사결정 등에서 유용하게 적용됨
중간 결과를 별도로 보관함으로써 컨텍스트가 불필요하게 오염되거나 복잡해지는 것을 방지함
성능 및 정확도 향상, 54%까지 개선되는 경우도 확인됨

결론 및 에이전트 설계 시 유의점

컨텍스트 관리야말로 에이전트 설계에서 가장 까다로운 부분임
LLM을 프로그래밍할 때 정보, 도구, 맥락 등을 어떻게 조합하고 관리하느냐가 성패를 좌우함
컨텍스트 윈도우가 아무리 커도, 모든 정보가 도움이 되는 것은 아님.
각 항목이 실제로 효용을 발휘하고 있는지 점검하고, 위에 소개된 6가지 방법(RAG, Tool Loadout, Context Quarantine, Pruning, Summarization, Offloading)으로 컨텍스트를 적극적으로 관리할 필요가 있음