16P by xguru 2023-04-21 | favorite | 댓글과 토론
  • 다수의 큰 PDF 파일을 LLM에 로딩해서 파일 내용에 대해 대화 가능
  • PDF를 넣으면 텍스트를 추출하여 다수의 Chunk로 만들고, Embedding을 생성하여 Pinecone 벡터스토어에 저장
  • 질문에 대해서 OpenAI Embeddings API로 문서의 관련 부분을 찾아서 GPT에 넣고 답변을 생성
  • LangChain + Pinecone + TypeScript + OpenAI Embeddings / GPT-3.5 & GPT-4 + Next.js