Claude의 메모리 아키텍처는 ChatGPT와 정반대

▲

GN⁺ 8달전 | parent | ★ favorite | on: Claude의 메모리 아키텍처는 ChatGPT와 정반대임(shloked.com)

Hacker News 의견

구현의 차이는 결국 비즈니스 목표에서 비롯됨
ChatGPT는 명확히 광고와 제휴 링크를 통한 수익화를 목표로 하며, 메모리 구현도 사용자 프로필을 만드는 데 중점을 두고 있음
반면 Claude의 메모리 구현은 과거 상호작용과 추상화 접근이라는 장기적 목표에 더 가까움
인간의 기억 접근 방식과 유사하게 대화를 검색할 수 있도록 설계되어 있고, 차후 강화학습을 통해 사용자가 지적한 실수를 기억하거나, 과거 대화에서 추상화를 도출하여 능동적으로 작업을 처리할 수도 있을 것이라 생각함
결국 ChatGPT는 사용자 자체를 기억하려는 반면, Claude는 개별 상호작용 내역에 집중하고 있음
- AGI라면 광고 없이도 수익을 만들 수 있겠지만, 새로운 Google 같은 회사는 광고가 필요함
  말과 실제 행동이 일치하지 않는 부분이 있다고 느낌
- Anthropic 역시 개인화 광고를 제공하지 않을 것이라고 믿지 않음
- 사용자가 LLM을 a, b, c 주제로 자주 쓰고 d, e, f는 덜 쓴다고 가정하면
  b, c, f 같은 일부 주제엔 OpenAI가 중단형 광고(전체화면, 30초 이상)로 수익을 낼 수 있음
  이것은 단순히 주제를 분석하면 가능함
  만약 OpenAI가 채팅 및 코딩 세션 1000개 정도를 분석해 사용자가 특정 회사에 취업하거나 다른 회사에서 차를 사도록 유도해 수익을 극대화할 수 있다면, 그 과정에서 중단형 광고뿐 아니라 응답의 질이나 내용을 조정할 수도 있음
  이런 점이 충분히 현실적이면서도 디스토피아적인 상황임
  반면 DeepSeek가 광고 없이 운영된다면 닫힌 소스 LLM들이 시장점유율을 얻기 위한 기준은 훨씬 더 높아질 것
  결국 LLM은 모든 상품처럼 사용자가 품질에 따라 비용을 지불하게 될 것이며, 각기 다른 수준의 품질을 원하게 됨
  광고가 AI의 답변 신뢰성을 손상시킬 수 있으므로 전체화면 광고가 가장 현실적인 귀결이라 생각함
- 왜 광고로 가는 명확한 방향성을 본다고 생각하는지 궁금함
  ChatGPT는 SNS가 아니므로 같은 방식으로 수익화할 필요가 없음
  구독, 엔터프라이즈, 비즈니스, API 등에서 이미 충분히 수익을 올리는 중임
ChatGPT 메모리 구현에 대한 분석 글의 링크가 잘못되었음을 지적하며, 정확한 링크를 공유함
ChatGPT의 메모리 구현 방식이 궁금했었는데, Claude와 완전히 다른 접근법을 보면 아주 흥미로움
Claude의 방식은 기술적 과제 해결에 더 적합해 보이고, ChatGPT는 일상 대화 및 광고 통합에 유리해 보임
언젠가는 이러한 언어 기반 메모리 방식이 구식이 될 것이고, 누군가는 언어적 표현을 뛰어넘는 인코딩된 기억 저장/조회 방식을 찾을 것임
이것이 AGI의 마지막 돌파구가 될지도 모름
- AGI를 위한 마지막 돌파구라는 주장에 동의하지 않음
  현재 LLM들은 개념을 이해하지 못하며, 실제로 ‘이해’라는 기능이 없고, 본질적으로는 고도화된 마르코프 체인임
  진짜 인텔리전스가 AGI의 전제 조건이라고 생각함
- 최근 대화 리스트는 실제 메모리가 아닌 대화 압축형태로 저장되어 필요 시에만 접근한다는 점에서 Claude와 유사하다고 생각함
  ChatGPT의 메모리가 엔티티별 요약인 실제 Memory만 문맥에 넣을 수 있게 한 것 같음
- ChatGPT는 일상 대화, 기술적 과제 등 모든 것을 아우르려 하기 때문에 이 전략이 잘 먹히고 있음
  그리고 과거 대화 요약이나 Embedding 방식도 인코딩 방식의 메모리 저장이라고 볼 수 있지 않냐는 의견을 제시함
- AGI는 원하지 않음
  어떻게 AGI가 명령을 따르도록 만들 수 있을지 고민이 생김
Claude의 메모리 구현에 만족함을 밝히지만, ChatGPT의 메모리는 꺼두었음
ChatGPT는 너무 다양한 일에 사용하고 있으니 연결되지 않은 내용을 의미 없이 연결하려고 하는 점이 어색했기 때문임
- ChatGPT의 메모리가 가장 편리한 기능이며, 이를 통해 계속 사용하게 됨
  개인화와 필요한 정보 참조를 원함
  예를 들어 한 프로젝트의 정보를 기억하게 해 두면 이후부터는 매번 컨텍스트를 설명할 필요 없어서 삶의 질이 크게 개선됨
  단, 내가 직접 통제할 수 없는 백그라운드 대화 메모리 생성 방식은 별로 좋아하지 않음
- 반대로 ChatGPT가 자동으로 메모리에서 정보를 불러오는 기능이 훨씬 더 편리하게 느껴짐
- 메모리 기능을 끈 이유는 이전에 거짓 정보를 기억에 남겼었는데, 그걸 계속 반복해서 불러와서였음
- 언제 이전 대화 내용을 불러올지 통제할 수 있다는 점이 가치 있다고 생각함
  ChatGPT는 원하지 않는 옛 대화 내용이 불필요하게 섞여 쓸데없음
- ChatGPT가 기본적인 것조차 기억 못해서 신기함
  언어 학습 목적으로 다양한 AI 튜터를 써봤는데 ChatGPT가 가장 좋았음
  하지만 ‘느리게 말해줘’를 자꾸 반복해서 요청해야 했고, 이 규칙을 대화 전체에 적용하라고 말해도 불가능했음
  이외에도 기억이 제대로 동작하지 않는 부분이 있음
곧 ChatGPT의 메모리 방식이 바뀔 것임
참고 링크: X.com - 메모리 변경 소식, Anthropic 공식 발표
- 메모리 시스템이 바뀐다면 아쉬울 것 같음
ChatGPT 메모리 및 채팅 히스토리 관련해서 직접 글을 쓴 경험을 공유함
직접 정보 덤프하는 프롬프트도 포함되어 있음
관련 링크
항상 정확한 입력 컨트롤을 원해서 메모리를 완전히 끄는 편임
모든 시스템 프롬프트, 트레이닝 등을 제거하고 내가 직접 쓴 프롬프트만 쓰고 싶음
ChatGPT에게 직접 질문해서 밝혀낸 정보가 신뢰할 만한지, 혹은 생성형 환상(hallucination)일지 의문임
LLM이 자신이 어떻게 동작하는지 알 이유가 없고, 그런 학습자료를 제공받았을 리도 없다고 생각함
- LLM에게 어떻게 동작하는지 묻는 건 별 도움 안 되지만, 사용할 수 있는 함수/도구의 시그니처에 대해서 묻는 건 오히려 잘 맞음
  왜냐하면 이런 툴 정보는 시스템 프롬프트에 굉장히 자세히 적혀 있기 때문임
Claude는 오로지 원본 대화 히스토리만 참조해 기억을 불러온다고 함
AI가 생성한 요약이나 압축된 프로필은 없이 실제 과거 대화만 실시간 검색함
요약, 프로필, 지식 그래프 등이 없는 것은 전문가 기능이 아니라 잘 작동하지 않는다는 의미임
예를 들어 "Chandni Chowk"처럼 구체적인 것은 기억할지 몰라도 "문제가 있었던 내 동료"처럼 모호한 표현은 제대로 찾지 못함
외부 메모리 저장소를 툴 콜링이나 MCP를 통해 사용할 때의 장애물이 무엇인지 질문함
RL로 메모리 사용 패턴을 강화하고 있는지를 궁금해함
데이터 프라이버시 관점에서, 추론 시 LLM이 어차피 정보를 알게 되지만 직접적으로 입력하고 싶지는 않음
예: "관심사: MacOS, bondage, discipline, Baseball"
- 봄에 재미 삼아 SQLite db로 메모리 저장하는 MCP 툴을 만들어봤다고 이야기함
  당시 Claude는 프롬프트로 계속 유도해도 메모리를 자발적으로 활용하지 않으려 했음
  매번 명시적으로 기억 체크나 저장을 지시해야 해서 효용성이 떨어짐
  관련 레포지토리
이 글을 보고 혼란스러웠음
저자가 메모리가 꺼진 상태에서도 프롬프트가 삽입된다고 생각하는 것인지 명확하지 않음
본인의 경우 메모리가 꺼진 상태에선 최근 대화나 선호 정보가 삽입되는 메타데이터가 전혀 없으며, 완전히 독립된 대화로 남아 있음
실험 중에 메모리를 켜고 끄기를 오가던 것이 혼선을 줬던 건지, 아니면 내가 글을 제대로 읽지 않은 것인지 모르겠음

▲

roxie 8달전 [-]

갑자기 모든 온점이 사라졌어요

답변달기