# R2R V2 - 프로덕션 준비된 오픈 소스 RAG 엔진

> Clean Markdown view of GeekNews topic #15575. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=15575](https://news.hada.io/topic?id=15575)
- GeekNews Markdown: [https://news.hada.io/topic/15575.md](https://news.hada.io/topic/15575.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2024-06-28T10:12:48+09:00
- Updated: 2024-06-28T10:12:48+09:00
- Original source: [github.com/SciPhi-AI](https://github.com/SciPhi-AI/R2R)
- Points: 5
- Comments: 1

## Topic Body

- 로컬 LLM 실험과 프로덕션 레벨  Retrieval-Augmented Generation (RAG) 시스템 사이의 격차를 메우기 위해 설계됨  
- 개발자를 위해 RESTful API를 중심으로 사용하기 쉽게 구축된 포괄적이고 최신 RAG 시스템을 제공  
  
#### 주요 기능  
- **멀티모달 지원**: `.txt`, `.pdf`, `.json`, `.png`, `.mp3` 등 다양한 파일 형식 지원.  
- **하이브리드 검색**: 시맨틱 및 키워드 검색을 결합하여 관련성 향상.  
- **그래프 RAG**: 관계를 자동으로 추출하고 지식 그래프를 구축함.  
- **앱 관리**: 문서와 사용자를 효율적으로 관리하며 풍부한 관찰 가능성과 분석 기능 제공.  
- **클라이언트-서버**: RESTful API 지원.  
- **구성 가능**: 직관적인 구성 파일을 사용하여 애플리케이션을 프로비저닝할 수 있음.  
- **확장 가능**: 빌더 + 팩토리 패턴을 통해 애플리케이션을 쉽게 확장 가능.  
- **대시보드**: 사용자 친화적인 상호작용을 위한 오픈 소스 React+Next.js 앱인 R2R 대시보드 제공.  
  
#### R2R 대시보드  
오픈 소스 React+Next.js 대시보드를 사용하여 R2R과 상호작용 가능. 대시보드 Cookbook을 참조하여 시작할 수 있음.

## Comments



### Comment 26725

- Author: neo
- Created: 2024-06-28T10:12:48+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=40799791) 
- **데이터 추출의 정확성과 효율성**: RAG 시스템에서 데이터 추출 과정이 중요한 도전 과제임. 전통적인 OCR 접근법이 부족하여, 멀티모달 LLM + OCR 접근법을 사용하여 정확성과 일관성을 높임.

- **유사한 스택 운영 경험**: 2년 동안 유사한 스택을 운영해왔으며, Pgvector, HyDe, 웹 검색 + 문서 검색 등의 기술을 사용함. 로그와 분석을 포함한 좋은 대시보드가 있음.

- **빠른 시작의 어려움**: 빠른 시작이 실제로는 빠르지 않음. Docker Compose와 Postgres 이미지를 포함한 설정을 제공해야 함. 대시보드를 사용하려면 별도의 레포를 클론해야 하는 불편함이 있음.

- **프로젝트의 복잡성**: 프로젝트가 많은 요소를 포함하고 있지만 개발을 더 쉽게 만들지는 않음. SDK인지 앱 모음인지 혼란스러움. "1 클릭" 설치 경험을 제공하여 모든 기능을 미리보기 할 수 있도록 해야 함.

- **정확성 검증**: 답변의 정확성을 어떻게 검증할 수 있는지에 대한 질문. 답변이 생성된 과정을 추적할 수 있는 방법이 있는지 궁금해함.

- **데이터 수집의 어려움**: 많은 RAG 프로젝트에서 데이터 수집이 제대로 해결되지 않음. 대량의 HTML 문서를 시스템에 일괄적으로 수집하는 방법에 대한 질문.

- **멀티모달 데이터 수집**: 멀티모달 데이터 수집 과정에 대한 자세한 설명을 요청함. R2R이 현재 처리할 수 있는 데이터 유형과 비텍스트 데이터 유형의 임베딩 방법에 대한 질문.

- **개발팀 최적화**: 프로세스가 개발팀에게 어떻게 더 빠르고 최적화되었는지에 대한 설명을 요청함. MVP(최소 기능 제품) 개발 시간을 가속화할 잠재력이 큼.

- **소스 코드와의 작업**: 소스 코드를 이해할 수 있는 RAG 솔루션을 찾고 있음. 예를 들어, "제출 버튼을 클릭할 때 호출되는 분석 이벤트"를 이해할 수 있는 기능을 원함.

- **Neo4j 사용 반대**: Neo4j를 사용하지 않기를 원함. 리소스 소모가 크기 때문임.

- **인기 있는 채팅 프론트엔드와의 통합**: OpenWebUI와 같은 인기 있는 채팅 프론트엔드와의 통합 여부에 대한 질문.
