맥락 검색 기술

▲

GN⁺ 2024-09-22 | parent | ★ favorite | on: 맥락 검색 기술(anthropic.com)

Hacker News 의견

첫 번째 의견
- 정부 기관을 위한 기업 RAG 구축 경험 공유
- RAGAS 지표를 사용한 A/B 테스트 결과:
  - 하이브리드 검색(의미론적 + 벡터)과 LLM 기반 재랭킹은 합성 평가 질문에서 큰 변화 없음
  - HyDE는 합성 평가 질문에서 답변 및 검색 품질을 심각하게 저하시킴
- 하이브리드 검색은 항상 유용하지만, 한 가지 방법이 항상 우승하지 않음
- Azure AI Search의 의미론적 검색이 벡터 유사성과 함께 충분히 효과적임
- 다양한 방법을 테스트할 필요가 있음
- 다음 시도할 것들:
  - RAPTOR
  - SelfRAG
  - Agentic RAG
  - 쿼리 정제(확장 및 하위 쿼리)
  - GraphRAG
- 배운 점:
  - 항상 기준선과 실험을 사용하여 귀무 가설을 반박하려고 시도해야 함
  - 세 가지 유형의 평가 질문/답변 사용: 전문가 작성, 실제 사용자 질문, 합성 질문
두 번째 의견
- 프롬프트 캐싱을 활용하는 방식이 마음에 듦
- 캐싱 덕분에 프롬프트 비용이 1/10로 줄어듦
- 캐싱 비용 절감으로 다양한 트릭이 가능해짐
- 컨텍스추얼 검색과 프롬프트 캐싱에 대한 노트 공유
세 번째 의견
- RAG 결과를 개선하기 위해 LLM을 사용하여 기본 청크를 확장하는 접근법은 흔함
- HyDE를 사용한 쿼리 확장은 항상 개선되지 않음
- Anthropic의 새로운 점은 프롬프트 캐싱 도입
- 프롬프트 캐싱은 긴 문서를 컨텍스트로 제공하여 비용을 절감함
- Cohere API가 매우 만족스러움
네 번째 의견
- 문서를 h1, h2, h3 헤딩을 기준으로 청크로 나누고, 청크 시작 부분에 헤더를 추가하는 방식 사용
- 예시:
  - 기존 청크: "성인의 일반적인 복용량은 하루에 3번 200mg 정제 또는 캡슐 1~2개"
  - 새로운 청크: "# 열 ## 치료 --- 성인의 일반적인 복용량은 하루에 3번 200mg 정제 또는 캡슐 1~2개"
- 이 방식은 LLM 없이도 잘 작동함
다섯 번째 의견
- 이 기술에 반대하는 입장
- 벡터 임베딩은 첫 번째 줄 바꿈 텍스트 블록에 과도하게 집중할 수 있음
- IDF 검색이 어느 정도 극복하지만 충분하지 않음
- "semantic boost"를 사용하여 임베딩을 문서의 제목, 요약 등으로 이동시킬 수 있음
- Trieve API의 "semantic boost" 설명 공유
여섯 번째 의견
- "링크드 리스트" 전략을 사용하여 청크가 참조된 항목에 여러 포인터를 가지게 함
- 각 댓글이 원래 게시물에 대한 포인터가 되는 방식으로 설명
- 이 기술의 예시 공유
일곱 번째 의견
- 200k 토큰을 사용하여 작은 데이터셋에서 최상의 답변을 얻는다는 주장은 경험과 다름
- 프롬프트가 커질수록 출력이 일관되지 않고 지시를 따르기 어려워짐
- 다른 사람들도 비슷한 경험을 했는지, 이를 피하는 방법이 있는지 궁금함
여덟 번째 의견
- RAG를 사용하여 지식을 검색하는 대신 규칙을 검색하는 문제에 직면함
- 특정 규칙이 적용될 수 있는지 판단하기 위해 작은 분류기를 훈련시키는 접근법 제안
- 예시: 멀티 유저 던전 게임에서 특정 규칙이 적용되는지 여부를 판단하는 방식
- 규칙이 적용되는지 여부를 결정하는 것이 더 추상적이고 어려운 문제임
- 이 문제를 해결할 방법을 찾고 있음
아홉 번째 의견
- 지식 베이스가 200,000 토큰(약 500 페이지)보다 작을 경우
- Anthropic이 토크나이저를 공개해주길 바람
열 번째 의견
- AI 산업이 다시 TF-IDF로 돌아가는 날을 기다림