▲GN⁺ 2024-09-22 | parent | ★ favorite | on: 맥락 검색 기술(anthropic.com)Hacker News 의견 첫 번째 의견 정부 기관을 위한 기업 RAG 구축 경험 공유 RAGAS 지표를 사용한 A/B 테스트 결과: 하이브리드 검색(의미론적 + 벡터)과 LLM 기반 재랭킹은 합성 평가 질문에서 큰 변화 없음 HyDE는 합성 평가 질문에서 답변 및 검색 품질을 심각하게 저하시킴 하이브리드 검색은 항상 유용하지만, 한 가지 방법이 항상 우승하지 않음 Azure AI Search의 의미론적 검색이 벡터 유사성과 함께 충분히 효과적임 다양한 방법을 테스트할 필요가 있음 다음 시도할 것들: RAPTOR SelfRAG Agentic RAG 쿼리 정제(확장 및 하위 쿼리) GraphRAG 배운 점: 항상 기준선과 실험을 사용하여 귀무 가설을 반박하려고 시도해야 함 세 가지 유형의 평가 질문/답변 사용: 전문가 작성, 실제 사용자 질문, 합성 질문 두 번째 의견 프롬프트 캐싱을 활용하는 방식이 마음에 듦 캐싱 덕분에 프롬프트 비용이 1/10로 줄어듦 캐싱 비용 절감으로 다양한 트릭이 가능해짐 컨텍스추얼 검색과 프롬프트 캐싱에 대한 노트 공유 세 번째 의견 RAG 결과를 개선하기 위해 LLM을 사용하여 기본 청크를 확장하는 접근법은 흔함 HyDE를 사용한 쿼리 확장은 항상 개선되지 않음 Anthropic의 새로운 점은 프롬프트 캐싱 도입 프롬프트 캐싱은 긴 문서를 컨텍스트로 제공하여 비용을 절감함 Cohere API가 매우 만족스러움 네 번째 의견 문서를 h1, h2, h3 헤딩을 기준으로 청크로 나누고, 청크 시작 부분에 헤더를 추가하는 방식 사용 예시: 기존 청크: "성인의 일반적인 복용량은 하루에 3번 200mg 정제 또는 캡슐 1~2개" 새로운 청크: "# 열 ## 치료 --- 성인의 일반적인 복용량은 하루에 3번 200mg 정제 또는 캡슐 1~2개" 이 방식은 LLM 없이도 잘 작동함 다섯 번째 의견 이 기술에 반대하는 입장 벡터 임베딩은 첫 번째 줄 바꿈 텍스트 블록에 과도하게 집중할 수 있음 IDF 검색이 어느 정도 극복하지만 충분하지 않음 "semantic boost"를 사용하여 임베딩을 문서의 제목, 요약 등으로 이동시킬 수 있음 Trieve API의 "semantic boost" 설명 공유 여섯 번째 의견 "링크드 리스트" 전략을 사용하여 청크가 참조된 항목에 여러 포인터를 가지게 함 각 댓글이 원래 게시물에 대한 포인터가 되는 방식으로 설명 이 기술의 예시 공유 일곱 번째 의견 200k 토큰을 사용하여 작은 데이터셋에서 최상의 답변을 얻는다는 주장은 경험과 다름 프롬프트가 커질수록 출력이 일관되지 않고 지시를 따르기 어려워짐 다른 사람들도 비슷한 경험을 했는지, 이를 피하는 방법이 있는지 궁금함 여덟 번째 의견 RAG를 사용하여 지식을 검색하는 대신 규칙을 검색하는 문제에 직면함 특정 규칙이 적용될 수 있는지 판단하기 위해 작은 분류기를 훈련시키는 접근법 제안 예시: 멀티 유저 던전 게임에서 특정 규칙이 적용되는지 여부를 판단하는 방식 규칙이 적용되는지 여부를 결정하는 것이 더 추상적이고 어려운 문제임 이 문제를 해결할 방법을 찾고 있음 아홉 번째 의견 지식 베이스가 200,000 토큰(약 500 페이지)보다 작을 경우 Anthropic이 토크나이저를 공개해주길 바람 열 번째 의견 AI 산업이 다시 TF-IDF로 돌아가는 날을 기다림
Hacker News 의견
첫 번째 의견
두 번째 의견
세 번째 의견
네 번째 의견
다섯 번째 의견
여섯 번째 의견
일곱 번째 의견
여덟 번째 의견
아홉 번째 의견
열 번째 의견