[GN#352] 당신의 지식 저장소, LLM이 관리해드립니다

2026-03-30 ~ 2026-04-05 사이의 주요 뉴스들

개인 지식 저장소는 오랜 시간에 걸쳐 진화해 왔습니다.

인간의 기억은 유한하고 불완전하기 때문에, 우리는 오래전부터 외부에 지식을 기록해 왔죠. 종이에 남기는 방식이 대표적이었고, 1960년대에는 제텔카스텐(Zettelkasten) 같은 방법이 등장하며 지식을 서로 연결하는 구조적 사고가 처음 도입되었습니다. 다만 이 방식을 활용한 건 소수의 연구자와 지식 노동자 정도였습니다.

1990년대 PC의 보급은 개인 지식 관리에 큰 변화를 가져옵니다. 텍스트 파일과 폴더 구조를 통해 누구나 쉽게 기록할 수 있게 되었고, 이 시점부터 지식 관리의 중심은 "어떻게 기록할 것인가"에서 "어떻게 다시 찾을 것인가" 로 이동하게 됩니다. 즉, 기록 중심에서 검색 중심으로의 전환이 이루어졌습니다.

2000년대에 들어서면서 웹과 모바일, 클라우드가 등장하며 또 한 번의 변화가 일어납니다. 특히 Evernote는 클라우드 동기화와 웹 클리핑을 통해 정보 수집을 폭발적으로 증가시켰고, "Second Brain" 이라는 개념이 확산됩니다. 개인의 기억을 보조하는 수준을 넘어, 외부에 또 하나의 사고 시스템을 구축하려는 시도가 시작된 것입니다. 이후 Notion 같은 도구는 이를 더 많은 사람들에게 확산시키며, 지식을 저장하고 구조화하는 방식에 익숙해지게 만들었습니다.

이후 다시 과거의 개념이 부활합니다. Obsidian을 비롯한 도구들이 등장하면서, 단순한 저장을 넘어 양방향 링크 기반의 지식 네트워크가 만들어지기 시작합니다. 이는 제텔카스텐의 디지털화라고 볼 수 있는데요. 개별 정보들이 연결되면서, 단순한 메모의 집합이 아니라 지식 간 관계를 통해 새로운 통찰을 만들어내는 구조로 발전하게 됩니다.

그리고 최근, 이 흐름은 또 한 번 크게 확장됩니다.

LLM이 등장하면서, 개인 지식 저장소를 활용하는 방식 자체가 바뀌고 있습니다. 기존의 RAG 방식이 "필요할 때 검색해서 참고하는 구조"였다면, 이제는 한 단계 더 나아가 LLM이 내용을 이해하고, 요약하고, 재구성하여 지식을 다시 만들어내는 방향으로 발전하고 있습니다. 단순 조회가 아니라, 지식의 재구성이 이루어지기 시작한 것입니다.

이 흐름을 가장 잘 보여주는 사례가, AI 분야에서 큰 영향력을 가진 Andrej Karpathy가 공유한 개인 LLM Wiki입니다. 그는 요즘 코드보다 자신의 개인 지식 저장소를 구축하는 데 더 많은 토큰을 사용하고 있다고 이야기했는데요. 이 방식은 기존 RAG와 근본적으로 다릅니다. RAG가 매번 질문할 때마다 원문에서 정보를 다시 찾아 조합하는 방식이라면, LLM Wiki는 LLM이 문서를 읽고 핵심을 추출해 위키를 점진적으로 구축하고 유지하는 복리형 구조입니다. 교차 참조를 통해 지식이 연결되고, 지속적인 린팅을 통해 모순을 제거하며 공백을 채워나갑니다. 한번 정리된 지식이 사라지지 않고 계속 쌓여가는 것이 핵심입니다.

여기서 중요한 변화는 역할의 전환입니다.

기존에는 사람이 직접 정리하고 유지해야 했던 지식이, 이제는 LLM에 의해 자동으로 관리됩니다. 사용자는 더 이상 문서를 작성하는 사람이 아니라, 지식의 입력자이자 소비자로 바뀌게 됩니다. 위키의 가장 큰 문제였던 "누가 유지보수하는가" 라는 질문에 대해, LLM이 하나의 해답이 되기 시작한 셈입니다.

비슷한 맥락에서, 가족 사진과 디지털 기록들을 LLM으로 개인 백과사전으로 구축한 사례도 최근 화제가 되었습니다. Google Photos, 위치 기록, 금융 거래 데이터까지 통합해 자신만의 위키피디아를 만드는 시도인데요. 개인 지식 저장소가 단순한 메모를 넘어, 삶의 기록 전체를 구조화하는 방향으로 확장되고 있다는 것을 보여줍니다.

이러한 변화는 개인 지식 저장소의 성격 자체를 바꾸고 있습니다.
단순히 기록을 쌓아두는 공간에서, 자동으로 성장하고 정리되는 시스템으로 진화하고 있는 것입니다.

Obsidian 같은 도구가 지식을 잘 저장하고 관리하는 단계였다면, 이제는 그 위에 LLM이 결합되면서 지식을 자동으로 구조화하고 확장하는 단계로 넘어가고 있습니다. 특히 Karpathy가 남긴 문서가 일종의 "지시서" 역할을 하면서, 이를 에이전트에게 그대로 전달하는 것만으로도 나만의 LLM 기반 위키를 만들 수 있다는 점도 흥미롭습니다.

기록은 누구나 합니다. 하지만 그 기록을 살아있는 지식으로 만드는 일은 늘 어려웠습니다.
LLM이 그 유지보수를 맡아주는 지금, 여러분의 기록이 어딘가에 있다면 나만의 위키를 한번 만들어 보시기 바랍니다.


Feedback : 긱뉴스 위클리 어떻게 읽고 계신가요? 의견과 제안 부탁드려요

Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요.


매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.


  • LLM-Wiki - LLM을 활용하여 개인 지식저장소 구축 하기

    Karpathy가 Autoresearch에 이어 계속 뭔가 새로운 아이디어를 내고 있네요. 이 LLM-Wiki는 LLM을 단순 질의 응답기가 아닌 자동화된 위키 관리자로 다루는 새로운 패러다임을 보여줍니다. 문서 하나를 에이전트에 던지는 것만으로 시작할 수 있으니, Obsidian이나 마크다운 메모가 쌓여 있는 분이라면 꼭 한번 시도해보세요. 저는 마크다운으로 되어있는 제 블로그도 같이 포함해서 작업중입니다.

  • Korean Law MCP - 대한민국 법령 검색·조회·분석 도구

    대한민국 법령 체계 전체를 64개 MCP 도구로 만들어, AI 어시스턴트나 터미널에서 바로 법령을 검색하고 조회할 수 있게 한 프로젝트입니다. "화관법"이라고 말하면 "화학물질관리법"으로 알아서 변환해주고, HWP 별표까지 마크다운으로 추출해주는 디테일이 인상적입니다. 7개 체인 도구로 검색→법령→판례→해석까지 한 번에 처리할 수도 있고요. 설치 없이 원격 엔드포인트로 바로 써볼 수 있으니, 법령 관련 업무가 있는 분은 한번 연결해보세요.

  • Claude Code의 숨겨진 강력한 기능들 15가지

    Claude Code 제작자 Boris Cherny가 직접 정리한 숨은 기능 모음입니다. 특히 /loop최대 1주일간 자동 반복 작업을 걸 수 있고, /batch수천 개 워크트리를 병렬 처리할 수 있다는 건 단순 코딩 도우미를 넘어선 수준입니다. --teleport모바일↔데스크탑 간 세션 이동도 되고, Hooks를 통해 에이전트 라이프사이클에 결정론적 로직을 삽입하는 것도 가능합니다. Claude Code를 이미 쓰고 계신 분이라면 워크플로를 한 단계 올릴 수 있는 팁들이 많으니 꼭 확인해보세요.

  • Claude Code의 소스 코드가 NPM 레지스트리의 map 파일을 통해 유출됨

    npm 패키지에 소스맵 파일이 포함되면서 Claude Code의 전체 소스 코드가 노출되었습니다. 이 일로 한 주간 꽤 시끄러웠는데요. 원인은 .npmignore 설정 누락과 bun의 기본 소스맵 생성이라는, 꽤 흔한 실수였습니다. 시스템 프롬프트나 내부 모드까지 드러나면서 커뮤니티에서는 "AI가 스스로를 오픈소스화했다" 며 풍자하기도 했고요. .env를 깃에 올린 실수의 AI 버전이라고 할 만한데, 빌드 설정 하나가 보안의 마지막 방어선이라는 걸 다시 한번 상기시켜 줍니다.

    공개된 코드를 분석하고 배우는 것까지는 자연스럽지만, 이를 기반으로 오픈소스 도구를 만들어 배포하는 것은 선을 넘었다고 봅니다. 이번 위클리에서도 관련 재구현체들은 소개하지 않았습니다. 뉴스로서 사건 자체는 공유드리되, 지킬 것은 지켜야 한다고 생각합니다.

  • Claude Code 소스 유출: 가짜 도구, 욕설 감지 정규식, 은폐 모드 등 내부 구조 드러남

    위 유출 건의 상세 분석 글입니다. 코드 안에는 모델 모방 방지용 가짜 도구 삽입(anti-distillation), AI임을 숨기는 undercover 모드, 사용자 감정을 감지하는 욕설 정규식 등 흥미로운 내부 구조가 담겨 있었습니다. 미완성 상태의 자율 에이전트 모드(KAIROS)Tamagotchi형 동반자 시스템 같은 실험 기능도 확인되었고요. 하루 25만 건의 실패 API 호출이 있다는 내부 주석도 눈에 띕니다. AI 제품이 내부적으로 어떤 구조로 설계되는지 엿볼 수 있는 분석입니다.

  • Claude Code (유출본) 소스 코드 분석서

    유출된 코드를 한국어로 체계적으로 분석한 문서입니다. Claude Code의 내부 아키텍처와 동작 흐름을 구조적으로 정리해두었기 때문에, 코드를 직접 뜯어보기 부담스러운 분들에게는 좋은 참고 자료입니다. 다만 비공개 코드 유출에 기반한 분석이라는 점은 인식하고 읽으시길 바랍니다.

  • Claude Code Unpacked : 비쥬얼 가이드

    유출된 소스를 시각적으로 정리한 비공식 분석 사이트입니다. 804개 파일, 22만 줄 이상의 코드를 인터랙티브하게 탐색할 수 있는 구조로, 에이전트 루프의 11단계 처리 과정이나 50개 이상의 도구 체계를 한눈에 파악할 수 있습니다. 코드를 직접 읽는 것보다 구조를 이해하기 훨씬 수월하고, 에이전트 아키텍처를 설계하는 분이라면 패턴 참고용으로 둘러볼 만합니다.

  • Claude Code 내부 동작 방식 완전 해부 — Agentic Loop부터 컨텍스트 로딩까지

    Claude Code의 Agentic Loop 동작 방식을 6단계로 깔끔하게 정리한 글입니다. "읽고 → 생각하고 → 도구 쓰고 → 결과 보고 → 반복"이라는 구조가 한눈에 들어옵니다. 권한 모델이 allow/ask/deny로 명확하게 나뉘어 있어서 자동화 범위를 코드 레벨에서 제어할 수 있고, 서브에이전트(Task 도구) 로 격리된 환경에서 자체 루프를 도는 구조도 다루고 있습니다. Claude Code를 쓰면서 내부에서 무슨 일이 벌어지는지 궁금했던 분에게 추천합니다.

  • Hermes Agent — 경험으로부터 스킬을 생성·개선하는 자기 학습형 자율 AI 에이전트

    사용하면 할수록 스스로 스킬을 만들고 개선하는 자율형 에이전트 프레임워크입니다. IDE에 묶인 코파일럿이 아니라, $5짜리 VPS에서도 독립적으로 돌아가는 상주형 에이전트라는 점이 특징입니다. Telegram·Slack·Discord 등 다양한 메시징 플랫폼을 단일 게이트웨이로 연결할 수 있고, 세션 간 사용자 기억도 유지됩니다. 위에서 다룬 LLM-Wiki처럼, 에이전트가 시간이 지날수록 똑똑해지는 방향의 또 다른 시도입니다.

  • OpenAI의 Claude Code용 Codex 플러그인

    Claude Code 안에서 OpenAI Codex를 직접 호출할 수 있게 해주는 공식 플러그인입니다. 경쟁 관계인 두 모델을 하나의 워크플로에서 같이 쓸 수 있다는 점이 재미있는데요. 코드 리뷰나 버그 조사처럼 시간이 오래 걸리는 작업을 Codex에 넘기고, Claude Code에서 결과를 받아보는 식으로 활용할 수 있습니다. 모델 간 역할 분담이라는 개념이 점점 자연스러워지고 있는 흐름을 보여주는 사례이기도 하고요. 다만 루프 호출 시 토큰 소모가 빠르게 늘 수 있으니 비용 관리는 챙겨야 합니다.

  • 지금 가장 중요한 AI 아이디어들 (2026년 4월)

    Daniel Miessler가 정리한 2026년 4월 기준 AI 핵심 아이디어 5가지입니다. Karpathy의 Autoresearch에서 출발해, 목표를 정의하고 자동으로 평가·개선하는 사이클이 ML을 넘어 모든 조직 운영으로 확장될 수 있다고 봅니다. 특히 "지식 노동의 75~99%가 부수 작업이었다"는 지적이 뼈아프고요. 코딩보다 원하는 결과를 검증 가능한 기준으로 표현하는 능력이 핵심 스킬이 된다는 주장은, 개발자든 비개발자든 한번 읽어볼 만합니다.

  • 옛날 스타일 날씨

    weather.com이 만든 레트로 스타일 날씨 페이지입니다. 옛날 TV 날씨 방송 느낌의 화면에 좋은 BGM까지 깔려서, 댓글창이 "힐링된다"로 가득하네요. 영상처럼 보이지만 실제로는 웹페이지고, 필터 효과까지 입혀져 있어 디테일이 살아 있습니다. AI 뉴스에 지친 이번 주, 잠깐 들어가서 쉬어가세요.

  • MiniStack — 무료 오픈소스 로컬 AWS 에뮬레이터

    LocalStack이 유료화되면서 아쉬웠던 분들에게 반가운 소식입니다. 34개 AWS 서비스를 로컬에서 에뮬레이션하는 무료 오픈소스 대체재로, 시작 시간 2초, 메모리 30MB로 가볍습니다. AWS SDK, CLI, Terraform, CDK 모두 호환되고, 계정 등록이나 텔레메트리도 없습니다. MIT 라이선스라 팀에 도입하기에도 부담이 없고요.

  • 인지적 암흑의 숲

    류츠신의 삼체 2부 제목인 『암흑의 숲』 이론을 AI 시대의 인터넷에 대입한 에세이입니다. 예전에는 아이디어를 공유할수록 유리했지만, 지금은 공개한 아이디어가 AI의 학습 데이터로 흡수되면서 오히려 공유가 불리해지는 구조로 바뀌고 있다는 주장입니다. 오픈소스와 블로그 문화에 익숙한 개발자라면 한번쯤 생각해볼 만한 관점이고, 댓글에서도 활발한 토론이 이어지고 있습니다.

  • Keploy - 트래픽 기반 자동 API 테스트 생성기

    실제 트래픽을 녹화해서 API 테스트를 자동으로 만들어주는 도구입니다. 코드 수정 없이 eBPF로 네트워크를 캡처하기 때문에 언어에 상관없이 쓸 수 있고, DB 쿼리나 Kafka 이벤트까지 통째로 Mock으로 만들어줍니다. AI가 Swagger/OpenAPI 스키마를 읽어서 누락된 경계값이나 타입 오류까지 탐지해주는 기능도 있고요. 테스트 작성이 늘 밀리는 팀이라면 "일단 트래픽 녹화부터" 시작해볼 수 있어서 도입 허들이 낮은 편입니다.

  • 당신의 엔지니어링 팀이 느린 진짜 이유는 사람이 아니라 코드베이스다

    팀이 느린 이유를 사람 탓으로 돌리기 전에, 코드베이스부터 점검하라는 글입니다. 예측치 부풀리기, 배포 공포, "이 파일은 건드리지 마" 같은 5가지 신호를 0~2점으로 정량화한 진단 루브릭을 제시하는데요. 3일이면 될 기능에 2주 견적을 내는 건 개발자가 게을러서가 아니라, billing 모듈을 고치면 notification까지 깨지는 모듈 결합 문제 때문이라는 분석이 날카롭습니다. 숙련된 엔지니어일수록 위험을 잘 알아서 오히려 더 느려 보이는 역설도 인상적이고요. 4점 이상이면 코드베이스에 직접 투자가 필요하고, 7점 이상이면 즉각 개입이 필요한 수준이라고 합니다. 팀 리드나 매니저라면 한번 자가 진단해보시길 추천합니다.

  • 무엇이든 라우터로 만드는 방법

    이더넷 포트 2개만 있으면 어떤 컴퓨터든 라우터로 만들 수 있다는 가이드입니다. Debian에 hostapd, dnsmasq 몇 개 설치하고 nftables로 방화벽을 잡으면 상용 라우터 수준의 기능이 구현됩니다. 집에 굴러다니는 미니 PC나 노트북도 활용할 수 있고, USB-Ethernet 동글로 포트를 보충할 수도 있고요. 글쓴이는 실제로 패시브 쿨링 미니 PC로 수년간 안정적으로 운용해왔다고 합니다. 네트워크가 실제로 어떻게 동작하는지 이해하는 데도 좋은 실습이고, 셀프 호스팅에 관심 있는 분이라면 인프라의 첫 단추로 시도해볼 만합니다.

  • MiroFish - 다중에이전트 기반 예측 시뮬레이션 엔진

    뉴스나 정책 같은 시드 정보를 넣으면, 수천 개의 독립 에이전트가 기억과 성격을 갖고 상호작용하는 가상 세계를 만들어 미래를 시뮬레이션하는 엔진입니다. 일종의 디지털 샌드박스인데, 시뮬레이션 도중 변수를 주입하거나 끝난 뒤 개별 에이전트와 대화할 수도 있습니다. 정책이나 PR 전략을 실행 전에 제로 리스크로 테스트해볼 수 있다는 컨셉이 흥미롭고, 소설 결말 추론 같은 창작 용도로도 쓸 수 있다고 하니 한번 만져볼 만합니다. Docker로 바로 띄울 수 있습니다.

  • C++26 완성! — C++11 이후 최대 업그레이드, 리플렉션과 메모리 안전성 강화 공식 확정

    C++26이 공식 완성되었습니다. C++11 이후 가장 큰 업그레이드로 평가받고 있는데요. 핵심은 네 가지입니다. 언어가 스스로를 기술하고 코드를 생성할 수 있는 컴파일 타임 리플렉션, 재컴파일만으로 미정의 동작을 제거하는 메모리 안전성 강화, 함수 사전·사후 조건을 언어 레벨에서 지원하는 계약(Contracts), 그리고 비동기 처리를 위한 std::execution입니다. C++26은 언어 자체가 메타프로그래밍 도구가 되는 첫 버전이라고 할 수 있습니다. 특히 메모리 안전성 강화는 Google에서 이미 배포해 segfault 30% 감소라는 실측 결과를 내놨고, 성능 오버헤드는 평균 0.3%에 불과합니다. GCC가 이미 리플렉션과 계약을 trunk에 병합한 상태라, 컴파일러 지원도 빠르게 따라올 것으로 보입니다.

  • apfel - Mac에 이미 내장된 무료 AI를 활용하게 해주는 도구

    macOS에 이미 내장되어 있는 Apple 온디바이스 LLM을 CLI와 HTTP 서버로 열어주는 오픈소스 도구입니다. Apple이 Siri와 시스템 기능에만 묶어뒀던 30억 파라미터 모델을 직접 쓸 수 있게 해주는데요. OpenAI API 호환이라 기존 코드에서 base_url만 바꾸면 되고, 모든 연산이 로컬에서 처리되니 비용 0원에 데이터 유출 걱정도 없습니다. 다만 한국어는 아직 불안정합니다. 가드레일이 이상하게 걸려서 엉뚱한 답변이 나오는 경우가 있는데, 시스템 프롬프트에 한국어 응답을 명시하면 개선되긴 합니다. 컨텍스트도 4096 토큰으로 작고 성능 자체가 가벼운 모델이라 복잡한 작업보다는 간단한 명령어 생성이나 요약 용도로 보는 게 맞겠습니다. Apple Silicon Mac 사용자라면 Homebrew로 바로 설치해볼 수 있습니다.

  • 데이터 사이언티스트의 역습

    LLM API 시대에 데이터 사이언티스트가 불필요해졌다는 시각에 반론을 제기하는 글입니다. 모델 학습은 API로 대체됐지만, 실험 설계, 지표 측정, 확률적 시스템 디버깅 같은 본질적 역량은 오히려 더 중요해졌다는 주장인데요. 현장에서 반복되는 5가지 eval 함정을 짚으면서, 결국 원인이 모두 데이터 사이언스 기본기 부재로 귀결된다고 분석합니다. 특히 "데이터를 직접 보는 것이 가장 ROI가 높은 활동인데 가장 자주 생략된다"는 지적이 뼈아프고요. AI 제품을 만들고 있는 팀이라면 eval을 어떻게 설계하고 있는지 되돌아보게 되는 글입니다.

  • Axios가 NPM에서 침해되어 원격 접근 트로이목마가 배포됨

    주간 다운로드 3억 회가 넘는 axios가 npm 공급망 공격을 당했습니다. 공격자가 유지관리자 계정을 탈취해 악성 버전을 직접 올렸고, 가짜 의존성을 통해 원격 접근 트로이목마(RAT) 를 설치하는 방식이었습니다. 설치 후 흔적까지 지우는 치밀한 구조였는데, npm이 수 시간 만에 제거하긴 했지만 그 사이 얼마나 퍼졌는지는 알 수 없습니다. axios처럼 모두가 당연하게 쓰는 패키지가 뚫릴 수 있다는 점에서, npm 토큰 관리와 lockfile 검증을 다시 한번 점검해볼 계기입니다.

  • 보이저 1호 - 69KB 메모리와 8트랙 테이프 레코더로 운용되는 인류 최장수 탐사선

    1977년에 발사되어 48년째 작동 중인 보이저 1호 이야기입니다. 69KB 메모리와 8트랙 테이프 레코더로 지구에서 150억 마일 넘게 떨어진 곳에서 여전히 데이터를 보내고 있습니다. 올해 초 자세 제어 스러스터가 고장났는데도 또 살려냈고요. 요즘 수백 GB 메모리에 수조 파라미터 모델을 돌리는 시대에, 69KB로 반세기를 버텨온 이 탐사선을 보면 좋은 엔지니어링이란 무엇인가를 다시 생각하게 됩니다.

  • Optio - AI 코딩 에이전트를 위한 워크플로 오케스트레이터

    GitHub/Linear/Jira에서 티켓을 받아 PR 생성부터 CI, 리뷰, 머지까지 전 과정을 에이전트가 자동으로 처리하는 워크플로 오케스트레이터입니다. CI 실패나 리뷰 피드백이 오면 에이전트가 알아서 다시 작업을 이어가는 자율 피드백 루프가 핵심이고요. Claude Code, OpenAI Codex 등 여러 에이전트를 레포별로 다르게 설정할 수 있고, Kubernetes 기반으로 작업을 병렬 처리합니다. 아직 초기 단계이지만, 코딩 에이전트를 단순 보조 도구가 아니라 개발 파이프라인의 일부로 편입시키려는 방향이 흥미롭습니다.

  • 1-bit Bonsai - 상업적으로 실용 가능한 최초의 1비트 LLM

    Caltech에서 출발한 PrismML이 진정한 엔드투엔드 1비트 LLM을 공개했습니다. 임베딩부터 어텐션, MLP까지 예외 없이 전체를 1비트로 구성한 8B 모델인데, 크기가 1.15GB밖에 안 됩니다. 16비트 동급 모델 대비 약 14배 작으면서도 벤치마크에서는 경쟁력 있는 성능을 유지하고, iPhone에서도 44 tok/s로 돌아갑니다. 기존 저비트 모델들이 명령 수행이나 다단계 추론에서 품질이 급격히 떨어졌던 것과 비교하면 의미 있는 진전이고요. 온디바이스 AI가 "데모용"을 넘어 실제 제품에 쓸 수 있는 수준에 가까워지고 있다는 걸 보여주는 사례입니다.

  • Gemma 4 비주얼 가이드

    Google DeepMind의 Gemma 4 아키텍처를 시각적으로 해설한 가이드입니다. 2B부터 31B까지 4가지 모델이 모두 이미지 입력을 지원하는 멀티모달 구조인데요. 로컬·글로벌 어텐션 교차 배치, Keys=Values로 KV 캐시를 절반으로 줄이는 기법, 소형 모델에서 플래시 메모리에 임베딩을 올리는 Per-Layer Embeddings 등 효율화 설계가 촘촘하게 들어가 있습니다. Maarten Grootendorst의 비주얼 가이드 시리즈답게 복잡한 구조를 다이어그램으로 잘 풀어놨으니, LLM 아키텍처에 관심 있는 분이라면 시간 내서 읽어볼 만합니다.

  • Lemonade by AMD: GPU와 NPU를 활용한 빠른 오픈소스 로컬 LLM 서버

    AMD가 지원하는 오픈소스 로컬 AI 서버입니다. GPU와 NPU를 자동으로 잡아주고, 텍스트·이미지·음성을 하나의 API로 통합 제공합니다. 백엔드가 C++ 기반 약 2MB로 가볍고, OpenAI API 호환이라 기존 앱에 바로 연결할 수 있는 점이 매력적입니다. 위에서 소개한 Apple의 apfel이 macOS 전용이라면, 이쪽은 Windows·Linux·macOS를 모두 커버하고요. 내장 GUI로 모델 다운로드와 전환도 간편해서, Ollama 대안을 찾는 분이라면 한번 살펴볼 만합니다.

  • Google, Gmail 계정의 사용자명 변경 기능 공식 출시

    드디어 Gmail 사용자명(@gmail.com)을 변경할 수 있게 되었습니다. 예전 주소는 별칭으로 남아서 메일도 계속 받을 수 있고, 데이터나 계정 히스토리도 그대로 유지됩니다. 1년에 1회, 총 3회까지 변경 가능하고요. 현재는 미국부터 점진 롤아웃 중이고 다른 국가도 곧 지원 예정이라고 합니다. 예전에 대충 만든 Gmail 주소가 마음에 안 들었던 분들에게는 오래 기다린 기능이네요. 네이버도 이거 해주면 좋겠다는 생각이 드는건 저만일까요.

  • Claude, 이제 OpenClaw 같은 써드파티에서 구독 모델 사용 불가

    Anthropic이 Claude 구독 플랜으로 OpenClaw 등 서드파티 도구 사용을 공식 차단했습니다. 한국시간 4월 6일 새벽 4시부터 적용되며, 앞으로는 할인 번들 구매나 API 키로 전환해야 합니다. Claude Code 같은 Anthropic 자체 도구는 기존 구독으로 계속 사용 가능하고요. 이번 주 소스맵 유출과 맞물려 시끄러운 한 주였는데, 결국 Anthropic 입장에서는 자사 도구 생태계를 중심으로 구독 가치를 유지하겠다는 방향으로 읽힙니다. 서드파티 도구를 쓰고 계셨던 분들은 전환 계획을 세워두시길 바랍니다.

  • Claude Code, 깜빡임 없는 NO_FLICKER 모드 공개

    Claude Code 사용 시 화면이 깜빡이고 점프하는 문제를 해결하는 실험적 풀스크린 렌더러가 공개되었습니다. CLAUDE_CODE_NO_FLICKER=1로 활성화하면 입력창이 하단에 고정되고, 대화가 길어져도 메모리·CPU 사용량이 안정적으로 유지됩니다. 터미널에서 마우스 클릭이나 텍스트 드래그까지 되는 건 꽤 신선한데요. 아직 네이티브 검색이나 복사-붙여넣기에 제약이 있는 실험 단계이긴 하지만, Claude Code를 장시간 쓰는 분이라면 체감 차이가 클 겁니다. 바로 써보시길 추천합니다.

  • Google, 오픈 모델 Gemma 4 공개

    Google DeepMind가 Gemma 4를 공개했습니다. Gemini 3 기술 기반의 오픈 모델로, E2B·E4B·26B·31B 네 가지 크기로 제공됩니다. 모바일용 소형 모델(E2B·E4B)은 오디오 입력까지 지원하고, 31B 모델은 AIME 2026 수학 벤치마크에서 89.2%, 코딩에서 80.0% 를 기록하며 Gemma 3 대비 전 영역에서 성능이 올랐습니다. 140개 언어 지원네이티브 함수 호출로 에이전트 구축에도 바로 쓸 수 있고요. Hugging Face, Ollama, LM Studio 등에서 바로 받을 수 있으니, 위에서 소개한 비주얼 가이드와 함께 살펴보시면 좋겠습니다.

  • 라이트하우스 플레이북 - 스타트업을 위한 신뢰 기반 성장 전략

    a16z가 소개하는 초기 스타트업을 위한 성장 전략입니다. 핵심은 자사 브랜드를 직접 키우는 대신, 내부의 뛰어난 인재나 고객을 "등대(Lighthouse)"로 세워 그들의 브랜드를 키워주는 역발상입니다. 인플루언서 마케팅과 달리 후원이나 보증을 요청하지 않고, 진정성 있는 신뢰 전이를 만들어내는 구조인데요. Linear, Stripe, Figma 등 구체적인 사례와 함께 4단계 실행 프레임워크를 제시합니다. AI가 제품 개발 비용은 낮췄지만 채용과 마케팅 비용은 여전하다는 전제에서 출발하는 만큼, 초기 팀을 꾸리고 있는 창업자라면 읽어볼 가치가 있습니다.

  • Qwen3.5-Omni: 텍스트·이미지·오디오·영상을 모두 처리하는 완전 옴니모달 LLM 출시

    Alibaba Qwen 팀이 텍스트·이미지·오디오·영상을 모두 이해하고 생성하는 옴니모달 모델을 공개했습니다. 256k 롱컨텍스트에 10시간 이상의 오디오, 400초 이상의 영상 입력을 처리할 수 있고, 오디오-비주얼 벤치마크 215개 서브태스크에서 SOTA를 달성했습니다. 특히 74개 언어 음성 인식39개 중국어 방언 지원, 보이스 클론, 실시간 대화 중 감정·속도 제어 같은 인터랙티브 기능이 눈에 띕니다. 위에서 소개한 Gemma 4와 함께, 오픈 모델 경쟁이 멀티모달 영역에서 본격적으로 뜨거워지고 있습니다.

  • 구독 앱 경제학: AI 기능의 숨겨진 비용

    구독 앱에 AI 기능을 넣으면 사용자가 많이 쓸수록 비용도 같이 올라가는 구조가 된다는, 당연하지만 간과하기 쉬운 문제를 다룹니다. 기존 SaaS의 "한계 비용 제로" 모델이 AI 도입과 함께 깨지는 건데요. AI 전환율이 0.5%p만 올라도 연간 $210K 추가 매출이 생기지만, 전환에 기여 못하면 $54K만 태우는 구조가 됩니다. 저비용 모델 라우팅, 응답 길이 제한, 크레딧 설계 등 5가지 비용 절감 전략도 구체적이라, AI 기능을 붙이고 있는 앱 개발자라면 한번 점검해볼 만합니다.

  • Qwen3.6-Plus: 현실 세계 에이전트를 향하여

    Alibaba Qwen 팀이 이번 주에 모델을 연달아 내놓고 있습니다. 바로 위의 옴니모달에 이어, 이번에는 에이전트형 코딩과 멀티모달 추론에 초점을 맞춘 Qwen3.6-Plus입니다. 1M 토큰 컨텍스트 윈도우를 지원하고, SWE-bench 같은 코딩 에이전트 벤치마크에서 업계 선도 모델과 경쟁하는 수준입니다. 추론 맥락을 유지하는 preserve_thinking 옵션이 있어서 에이전트 작업의 일관성을 높일 수 있고, OpenClaw·Claude Code 등 다양한 코딩 에이전트와도 바로 연결됩니다. 중국 오픈 모델 생태계의 속도가 점점 빨라지고 있네요.

  • EmDash – 플러그인 보안 문제를 해결한 WordPress의 정신적 후속작

    Cloudflare가 만든 WordPress의 정신적 후속작입니다. WordPress 보안 문제의 96%가 플러그인에서 나온다는 점에 착안해, 각 플러그인을 격리된 샌드박스에서 실행하는 구조를 택했습니다. TypeScript 기반에 Cloudflare Workers 위에서 돌아가는 서버리스 CMS인데요. x402 결제 표준을 내장해 콘텐츠별 과금도 가능하고, AI 에이전트 관리나 Passkey 인증 같은 현대적 기능도 포함되어 있습니다. WordPress에 쌓인 불만이 있는 분들, 특히 저도 워드프레스를 버리고 스태틱으로 옮긴 이유가 이 플러그인 보안 문제였는데요. 지금 Cloudflare Pages 로 옮겨뒀는데, 살짝 관심이 가네요.

  • edgejs - WebAssembly 기반 안전한 JS 런타임

    Wasmer 팀이 만든 WebAssembly 기반 보안 JavaScript 런타임입니다. --safe 모드로 실행하면 Wasm 샌드박스 안에서 격리되어 돌아가는데, Node.js와 완전 호환이라 기존 코드를 그대로 쓸 수 있습니다. edge node, edge npm처럼 기존 명령어를 감싸는 방식이라 도입 허들이 낮고, V8·JavaScriptCore·QuickJS 등 엔진도 교체 가능합니다. 아직 0.x 초기 단계이지만, 위에서 소개한 EmDash의 플러그인 샌드박싱처럼 신뢰할 수 없는 코드를 안전하게 실행해야 하는 수요가 늘고 있는 흐름과 맞닿아 있습니다.

  • Ollama, 이제 애플 실리콘에서 MLX 기반으로 구동

    Ollama가 Apple MLX 프레임워크 기반으로 돌아가는 프리뷰 버전을 공개했습니다. Apple Silicon의 통합 메모리를 제대로 활용하면서 첫 토큰 생성 시간과 디코드 속도 모두 개선되었는데요. M5 시리즈에서 Qwen3.5-35B 모델 기준 134 tok/s 디코드를 기록했습니다. NVIDIA의 NVFP4 양자화도 지원해 정확도를 유지하면서 메모리 사용량을 줄였고, 캐시 재사용 정책도 똑똑해졌습니다. Mac에서 로컬 LLM을 돌리는 분이라면 체감 차이가 클 테니, 32GB 이상 통합 메모리 Mac에서 Ollama 0.19로 업데이트해보세요. 2배 이상 빨라졌다는 후기가 많네요.

  • Physical AI가 지금 주목받는 이유와 과거와의 차이점

    로보틱스에 다시 VC 투자가 몰리고 있는데, 이번에는 왜 다른가를 분석한 글입니다. 과거에는 기술 요소들이 하나씩 순차적으로 발전했다면, 지금은 비전-언어-행동 모델, 시뮬레이션 기반 데이터 수집, 엣지 추론 성숙, 하드웨어 비용 하락이 동시에 복합적으로 작용하고 있다는 게 핵심 논지입니다. Unitree IPO, Amazon의 Fauna Robotics 인수, Figure 휴머노이드의 백악관 등장까지 — Physical AI의 "ChatGPT 모먼트"가 생각보다 가까울 수 있다는 전망이 솔깃합니다. 로보틱스에 관심 있는 분이라면 현재 업계 지형을 파악하기 좋은 글입니다.

  • Cursor 3 공개

    Cursor 3가 공개되었습니다. 단순한 AI 코딩 도우미를 넘어, 여러 에이전트를 한 화면에서 관리하는 통합 워크스페이스로 진화했습니다. 로컬 에이전트와 클라우드 에이전트를 사이드바에서 전환할 수 있고, 노트북을 닫아도 클라우드에서 작업이 계속 돌아갑니다. 커밋부터 PR 병합까지 한 UI에서 끝나고, 내장 브라우저와 플러그인 마켓플레이스도 추가되었습니다. Claude Code가 터미널 중심의 에이전트 경험을 밀고 있다면, Cursor는 IDE 안에서 모든 걸 해결하겠다는 방향인데요. AI 코딩 도구 경쟁이 점점 뜨거워지고 있습니다.

  • 체화된(Embodied) 로봇 지능의 산업화

    위에서 소개한 Physical AI 글과 함께 읽으면 좋은, 로봇 산업화의 현주소를 깊이 있게 다룬 글입니다. 인상적인 데모는 넘쳐나지만 실제 현장 배치는 아직 미미하다는 냉정한 진단에서 출발합니다. 핵심 병목은 데이터인데, 인터넷 비디오가 약 10억 시간인 데 비해 로봇 조작 데이터는 전 세계 합쳐 30만 시간에 불과합니다. 다만 부품 비용 하락과 노동 비용 상승이 교차하면서 자동화의 경제적 임계점에 가까워지고 있고, 데이터 확보·로봇 AI 연구소·수직 솔루션 세 영역에서 가치가 집중될 것이라는 분석이 구체적입니다.


✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Dooray!봇, Discord봇, 구글 챗 봇, Swit 봇
긱뉴스를 트위터에서 구독 하거나 RSS로도 구독 가능 합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.