1P by neo 2023-11-16 | favorite | 댓글 1개

GPT 구성 방법

  • GPT는 ChatGPT의 명명된 설정으로, 이름, 로고, 짧은 설명을 포함함.
  • GPT의 행동을 지시하는 사용자 정의 지침이 포함되며, 이는 "시스템 프롬프트"와 동등함.
  • 대화를 시작하는 데 사용할 수 있는 최대 4개의 예시 프롬프트를 선택적으로 제공함.
  • 추가 컨텍스트를 제공하고 답변 생성에 도움을 주기 위해 여러 파일을 업로드할 수 있음.
  • Code Interpreter, Browse 모드 및 DALL-E 3을 활성화하거나 비활성화할 수 있음.
  • GPT가 호출할 수 있는 API 엔드포인트인 선택적 "Actions"를 설정할 수 있음.

GPT 구축기의 작동 방식

  • GPT 구축기는 사용자와의 대화를 통해 GPT를 자동으로 생성하는 챗봇임.
  • "Create" 탭은 사용자가 대화를 통해 GPT를 생성할 수 있도록 하지만, 실제로는 "Configure" 양식을 자동으로 채움.
  • 많은 사람들이 첫 GPT 생성 후 "Create" 탭을 피할 것을 권장함.

GPT의 흥미로운 예시들

  • Dejargonizer: 전문 용어를 해석해주는 GPT로, 텍스트를 분석하여 전문 용어를 정의함.
  • JavaScript Code Interpreter: JavaScript 코드를 실행할 수 있는 GPT로, Deno 런타임을 첨부하여 사용함.
  • Dependency Chat: GitHub 프로젝트의 의존성 문서를 분석하여 관련 질문에 답변함.
  • Add a walrus: 이미지에 바다코끼리를 추가하는 GPT로, GPT-Vision과 DALL-E를 사용함.
  • Animal Chefs: 동물 셰프가 개인적인 이야기와 함께 레시피를 제공하는 GPT임.
  • Talk to the datasette.io database: SQL 쿼리를 실행하여 질문에 답변하는 GPT임.
  • Just GPT-4: 모든 추가 기능을 비활성화하고 순수한 GPT-4 경험을 제공하는 GPT임.

GPT의 지식 기능

  • 파일을 GPT에 첨부하면, 해당 파일을 사용하여 질문에 답변을 시도함.
  • Retrieval Augmented Generation(RAG)의 구현으로 보임.
  • OpenAI는 이 기능에 대한 자세한 정보를 공유하지 않아 사용자가 효과적으로 사용하는 데 어려움을 겪음.

GPT의 결제 모델

  • GPT는 $20/월의 ChatGPT Plus 구독자만 사용할 수 있어 배포에 제한이 있음.
  • 사용자가 자신의 API 키를 제공하지 않고도 OpenAI 플랫폼을 기반으로 한 프로젝트를 배포할 수 있음.

프롬프트 보안과 공개의 중요성

  • 사용자가 충분히 노력하면 GPT에 추가된 문서와 프롬프트가 유출될 수 있음.
  • 프롬프트가 유출될 것이라고 가정하고, 오히려 공개하는 것이 좋음.

향후 GPT에 대한 기대

  • 지식 기능에 대한 더 나은 문서화, API 접근성, 비구독자에게 GPT를 제공할 수 있는 방법, 예산 제한 설정 등이 포함된 개선 사항을 기대함.

GN⁺의 의견

이 글에서 가장 중요한 것은 GPTs의 새로운 기능과 가능성에 대한 탐색이며, 이는 소프트웨어 엔지니어링과 인공지능 분야에 종사하는 사람들에게 흥미로운 주제임. 사용자가 자신만의 GPT를 생성하고 다른 사용자와 상호작용할 수 있는 기능은 맞춤형 대화형 인터페이스를 구축하는 새로운 방법을 제시함. 또한, 코드 실행, 문서 검색, 이미지 생성 등 다양한 기능을 통합하여 사용자 경험을 향상시킬 수 있는 잠재력을 보여줌.

Hacker News 의견
  • GPT 사용자로서 프롬프트를 볼 수 없다면 GPT를 사용하고 싶지 않음을 깨달았음. 낯선 사람이 내 지식 없이 이상한 행동을 주입할 수 있는 ChatGPT를 사용하는 것은 원치 않음.
    • OpenAI에 GPT에 "소스 보기" 옵션 추가를 원함. 기본적으로 "켜짐" 상태여야 한다고 생각하지만, 이것이 인기 없는 결정일 수도 있음을 상상함.
  • GPT 기반 챗봇을 피하는 경향이 있음. 내가 모르는 맞춤형 지시에 따라 미묘하게 조작되는 것을 원하지 않음.
    • "소스 보기" 옵션 추가는 이 기능을 "별로"에서 "돈을 지불할 가치가 있는 것"으로 바꿀 것임.
    • 대부분의 시간을 Kagi 사용에 할애하고 있어 GPT Plus를 취소하는 것을 고려 중이지만, 이러한 변화는 구독을 계속하게 만들 것임.
  • 새로운 OpenAI 기능에 대해 알게 되는 방법:
    1. Twitter에서 새로운 것을 호들갑스럽게 발표하는 헤드라인을 훑어봄
    2. Twitter 인플루언서들로부터 해당 사항에 대한 압도적인 수의 트윗을 받음
    3. 무시하고 simonw가 설명할 때까지 기다림
    4. simonw가 이미 여러 방법으로 기능을 시험해보고 명확한 설명과 비평을 작성한 블로그 포스트를 읽음. 모든 것이 즉시 이해됨.
  • "단지 ChatGPT에 사전 프롬프트가 있는 것"이라는 것은 사실임.
    • "단지 좋은 UI를 가진 Custom Instructions"라는 것도 사실임.
    • 하지만 "좋은 UI"의 세계를 바꾸는 영향을 절대 과소평가하지 말 것. GPT-3는 몇 년 동안 사용 가능했지만, 좋은 UI를 만들기 전까지는 거의 아무도 알거나 신경 쓰지 않았음.
    • 이것은 사용성의 "작은 조정"처럼 보이지만, 비슷한 "양자 도약" 수준의 영향을 가짐.
  • GPT/AI에 대한 의견을 자주 묻는 사람들이 있음. 그들이 사용해봤는지 물어봄. "아니오". "무료인 것을 알고 있나요?" "예". 이러한 태도는 이해하기 어려움. 미지의 것에 대한 두려움인가? 게으름인가? 무언가를 시도하기 전에 사회적 증거를 요구하는 것인가?
  • OpenAI의 프롬프트를 볼 수 없고, 아마도 저자도 볼 수 없지만, 여전히 OpenAI의 GPT를 사용하고 싶어함.
    • 여기에는 상당한 신뢰 도약이 있음. OpenAI가 신뢰성이나 일관성을 향한 구체적인 로드맵을 가지고 있는지 궁금함.
  • Custom GPT Builder 프롬프트 전체를 가지고 있음: [GitHub 링크 제공]
  • simonw에게 실시간으로 이 모든 것을 문서화하고 이해하기 쉽고 접근하기 쉬운 도구들(llm 명령어 줄 등)을 만들어준 것에 대한 감사를 표함.
    • 검색 API가 적절한 인용을 제공하지 못해 잘못하고 있는 것 같았는데, 혼자만 그런 것이 아니라는 것을 알게 되어 좋음.
  • openAI가 RAG "지식 베이스" 기능을 어떻게 구현했는지에 대해 더 알고 싶어함. 하지만 세부 사항이 부족함.
    • grugbrain.dev의 모든 텍스트를 업로드하고 매우 합리적인 grug brain과 대화를 할 수 있었음: [OpenAI 채팅 링크 제공]
  • 최근에 "synbiogpt"를 만들고 있으며, 여기서 custom GPT의 한계를 깨닫게 됨.
    • 생물학적 시퀀스 데이터는 보통 매우 길음. 파일에 있는 데이터는 괜찮지만, 고급 기능(예: 코돈 최적화)을 위해 API와 상호 작용해야 할 경우, 이 데이터를 네트워크를 통해 보내야 함. 그러면 API 호출 컨텍스트 창이 시퀀스 데이터로 가득 차서 실패함.
    • 의존성을 주입할 수 없음. 때때로 GPT는 자체 구현을 시도하지만, 종종 잘못됨.
    • GPT-4가 자신이 무엇에 대해 이야기하고 있는지 알고 있다고 생각하면, 검색 API는 종종 파일을 열지 못함. 유전자 부분에 대해 이야기할 때, GPT-4가 생각하는 부분이 아니라 내 라이브러리의 특정 부분에 대해 매우 구체적이고 싶음.
    • 자체 lua 스크립팅 환경을 만듦으로써 대부분의 문제를 해결함(생물학적 기능은 golang에 있고, lua 환경을 실행하기 위해 gopher-lua를 사용함). 스크립팅 기능을 사용하는 방법에 대한 예제 lua와 현재 작은 유전자 부분 라이브러리를 주입하고, 제공된 파일에 대해 특정 작업을 수행하는 lua를 생성하도록 요청함. GPT-4는 파일을 전혀 보지 않고 내부 golang 앱이 스크립트된 lua를 실행함. 이 방법은 훌륭하게 작동하며 custom GPT보다 훨씬 빠름.
    • 현재 가장 큰 문제는 프론트엔드 부분임. 첨부 파일을 끌어낼 수 있고 초기 사용자 입력을 수정할 수 있는 오픈 소스 ChatGPT 클론을 갖고 싶음. 지금까지 좋은 옵션을 찾지 못함.
  • RAG를 사용하여 더 나은 결과를 얻는 방법에 대해.
    • 이와 관련하여 일부 성공을 거둠.
    • Assistant API를 사용하는데, 이것은 GPT와 같지 않은 것으로 믿음. 웹 인터페이스를 통해 이것을 사용해봄.
    • Tesseract로 OCR 처리된 100개 이상의 PDF 파일을 가지고 있음. 그런 다음 ChatGPT에게 모든 파일을 레이아웃을 유지하면서 단일 txt 파일로 결합하는 스크립트를 작성하도록 함.
    • 파일을 업로드하고 질문을 시작함. 파일에는 영어가 아닌 건축 규정에 대한 매우 기술적인 데이터가 포함되어 있어 모델이 그러한 유형의 언어에 익숙하지 않을 것임.
    • 어쨌든 결과는 놀랍도록 좋았음. 질문에 대한 답변이 가능했고 답변은 좋았음. 답변이 어디서 왔는지 주석을 달아야 하지만, 제대로 작동하지 않았음.
    • PDF, JSON 파일, CSV 등을 업로드해봄. 지금까지 원시 텍스트가 가장 잘 작동함.
  • "지식" RAG 기능에 대한 메모가 흥미로움.
    • 대화와 경험에서 사람들은 RAG 검색이 비즈니스와 데이터 모델에 매우 특정하다는 것을 발견함. 여기서 일괄적인 해결책은 없음. CMS에서 고객의 다음 단계는 스키마를 기반으로 SQL을 생성하는 것과 다름. 전자 상거래 카탈로그를 쇼핑하는 것과도 다름.
    • 기본적으로 검색 관련 문제임. 실제로는 더 어려움. 이러한 문제는 악명 높게 어려움.