LlamaCloud 와 LlamaParse 공개

▲

xguru 2024-02-22 | parent | ★ favorite | on: LlamaCloud 와 LlamaParse 공개(blog.llamaindex.ai)

Hacker News 의견

LlamaParse 개발팀의 일원으로, 이전에 여러 PDF -> 구조화된 텍스트 추출기를 개발한 경험이 있는데, LlamaParse는 다른 추출기들에 비해 개선된 점이 있음. 문자 추출을 위해 OCR과 PDF에서의 문자 추출을 혼합 사용하며, 문서 재구성을 위해 휴리스틱과 머신러닝 모델을 혼합 사용함. 재귀적 검색 전략과 결합하여 복잡한 텍스트에 대한 질문 응답에서 최상의 결과를 얻을 수 있음.
LlamaParse는 복잡한 표가 있는 PDF를 잘 구조화된 마크다운 형식으로 파싱하는 데 매우 뛰어난 독점 파싱 서비스를 개발함. 오픈소스 프로젝트가 커뮤니티 기여와 주목으로 유명해진 후 프로젝트 리더들이 VC 자금을 받고 독점적인 것을 만드는 것은 문제 아닌가?
Medium에 게시하는 이유를 이해하지 못함. Medium은 더 이상 읽을 수 없게 되었고, 관객이 접근할 수 있는 블로그 포스트가 있어야 함
LlamaParse가 unstructured.io와 직접 비교했을 때 어떤지 궁금함
LlamaParse에 대한 초기 경험이 인상적이지 않음. 이메일로 가입 시 무한 리디렉션 문제, Google로 로그인 후 PDF 파서에 대한 실망감. 이미 많은 옵션이 있는데 왜 이 서비스가 필요한지 혼란스러움.
LlamaParse는 어려운 문제를 해결하려고 시도하는 것 같음. 많은 기업 고객들이 PDF 파일을 파싱하고 데이터를 정확하게 추출할 필요가 있음. 인터페이스가 다소 혼란스러움. LlamaParse는 테이블의 숫자를 추출할 수 있지만, 출력이 표 형식으로 제공되지 않고 질문-응답을 통해서만 숫자에 접근할 수 있는 것으로 보임.
AWS Textract가 하는 것과 비슷하지 않음? 테이블과 양식에서 정보를 파싱하고 질의하는 기능이 있음. LI에게는 워크플로우와 RAG를 위한 검색 기록이 사용자에게 더 쉽게 만들어주지만, 왜 바퀴를 다시 발명하는지 의문.
LLMS를 사용하여 처음부터 가장 적절한 형식으로 데이터를 추출할 수 있는데, 왜 이를 구축하는지 의문. 비용 때문에 단기적으로는 의미가 있을 수 있지만, 장기적으로는 LLMS로 일반적으로 해결할 수 있는 문제.
RAG와 관련하여 반복적으로 마주쳤던 문제를 LlamaParse가 정확히 해결함. 구조화되지 않은 데이터에서 구조화된 정보를 얻는 것은 어려움.
가격이 어떻게 될지에 대한 질문.