[GN#353] 스킬이 쏟아지는 시대, 내 하네스는 내가 만든다

2026-04-06 ~ 2026-04-12 사이의 주요 뉴스들

2주 전 "이제는 에이전트가 아니라 에이전트 팀이다"에서 하네스 엔지니어링과 에이전트 팀 구성이라는 흐름을 다뤘습니다. 단일 에이전트를 쓰는 것에서, 역할을 분리한 에이전트 팀을 조직화하는 단계로 넘어가고 있다는 이야기였는데요. 그 사이 2주 동안 변화는 더 가속되었습니다. AI 시대엔 모든 게 너무 빠르네요. 다만 이 변화는 모두가 같은 속도로 겪고 있는 일이라기보다, 일부 앞선 팀에서 먼저 뚜렷하게 드러나고 있는 흐름에 가깝습니다.

마침 이 흐름을 한 편으로 정리한 글이 나왔습니다. "프롬프트에서 하네스까지 - AI 에이전틱 패턴 4년의 기록"은 2022년부터 2026년까지, 프롬프트 엔지니어링 → 컨텍스트 엔지니어링 → 하네스 엔지니어링으로 이어지는 패러다임 전환을 다루고 있는데요. 이 글에서 가장 인상적인 부분은, 각 시대가 이전 시대를 대체하지 않고 포함한다는 점입니다. 프롬프트 엔지니어링이 사라진 것이 아니라 하네스 엔지니어링의 서브모듈이 된 것이고, 이제는 "에이전트가 실수하면 에이전트가 아니라 하네스를 고쳐라" 는 원칙이 점점 더 중요해지고 있습니다.

그런데 이 변화와 맞물려, 긱뉴스에 올라오는 글들에서 또 하나의 흐름이 보입니다.

유명 개발자들과 기업들이 자신들의 에이전트 스킬셋, 서브에이전트 구성, 워크플로를 너도나도 공개하기 시작했습니다. 구글 클라우드 AI 디렉터 Addy Osmani는 시니어 엔지니어 수준의 워크플로를 구조화한 agent-skills 를 공개했고, Google Stitch가 도입한 DESIGN.md 개념을 확장해 60개 이상 서비스의 디자인 시스템을 마크다운으로 패키징한 Awesome Design.MD 도 등장했습니다. YC CEO Garry Tan은 gstack에 이어 Karpathy의 LLM Wiki 방식을 개인 지식 관리에 적용한 GBrain 까지 공개했고요.

근데 공통점이 있습니다. 이것들이 전부 마크다운 기반이라는 겁니다. 코드가 아니라 의도와 구조를 텍스트로 표현하고 있고, 그래서 누구나 읽을 수 있고, 자기 프로젝트에 복사해서 바로 쓸 수 있습니다. 마치 오픈소스 부흥기에 라이브러리가 쏟아지던 때를 떠올리게 합니다. 다만 이번에 공유되는 것은 코드가 아니라 에이전트가 일하는 방식 그 자체입니다.

좋은 시대인 것은 분명합니다. 하지만 여기서 한 가지 질문이 떠오릅니다.

과연 이걸 다 따라가야 할까요?

솔직히 말하면, 다 따라갈 수도 없고 그럴 필요도 없다고 생각합니다. 변화가 빠르다는 것은 맞지만, 남이 만든 하네스를 그대로 복사해 쓰는 것은 남의 옷을 입는 것과 비슷합니다. 도메인이 다르고, 작업 스타일이 다르고, 팀 구조가 다르기 때문에 그대로 작동하지 않습니다. Vercel이 처음에 에이전트에게 모든 도구를 다 줬다가 오히려 성능이 떨어져서 도구를 줄였다는 사례처럼, 더 많은 스킬이 항상 더 좋은 결과를 만들어 주지는 않습니다.

중요한 것은 쏟아지는 스킬과 패턴을 내 에이전트에게 분석시키는 것입니다. 어떤 스킬이 내 작업 흐름에 맞는지, 어떤 구조가 내 도메인에서 효과적인지를 에이전트와 대화하면서 추려내고, 그 과정에서 내 하네스를 강화해 나가는 순환 구조를 만드는 겁니다. 남이 공유한 agent-skills의 19개 스킬 전부를 쓰는 것이 아니라, 그중에서 내 워크플로에 맞는 3~4개를 골라내고, 그것조차 내 프로젝트의 컨벤션에 맞게 수정하는 작업이 진짜 하네스 엔지니어링입니다.

이 관점에서 이번 주에 주목할 만한 글이 두 개 있습니다.

Anthropic이 공개한 "Managed Agents 확장하기: 두뇌와 손을 분리하기"는 하네스 설계의 중요한 원칙을 보여줍니다. 운영체제가 하드웨어를 프로세스와 파일 같은 추상화로 가상화한 것처럼, 에이전트의 구성 요소인 "세션, 하네스, 샌드박스" 를 분리해서 독립적으로 교체할 수 있게 만든다는 이야기입니다. 특히 인상적인 부분은, 하네스가 인코딩하는 가정은 모델이 발전하면 낡아진다는 점을 명시적으로 인정한 것입니다. Claude Sonnet 4.5에서 필요했던 컨텍스트 리셋 로직이 Opus 4.5에서는 불필요해졌다는 사례는, 하네스는 뜯어낼 수 있어야 한다는 원칙의 좋은 예시입니다.

그리고 이 설계가 결국 향하는 방향이 메타 하네스입니다. 어떤 하네스가 와도 수용할 수 있는 구조, 즉 하네스를 관리하는 하네스입니다. 동시에 시장에서는 이 하네스 자체를 서비스로 제공하려는 움직임도 커지고 있고요. 이전에 "장기 실행 애플리케이션 개발을 위한 하네스 설계"에서 다뤄진 Anthropic의 계획, 실행, 평가를 분리하는 3-에이전트 아키텍처도 같은 맥락에 있습니다.

한편 "Claude Managed Agents - 프로덕션 속도를 10배 더 빠르게"는 이런 설계가 실제 제품으로 나온 사례입니다. 보안 샌드박싱, 자격 증명 관리, 권한 제어 같은 프로덕션급 인프라를 자동으로 처리하고, 사용자는 작업 정의에만 집중할 수 있게 해줍니다. 에이전트를 직접 만들어 본 분이라면 아시겠지만, 실제로 프로덕션에서 에이전트를 돌리는 데 가장 많은 시간이 드는 부분이 바로 이 인프라 쪽입니다.

그리고 이 흐름의 끝에 어떤 방향이 있는지를 보여주는 연구가 하나 있습니다. Meta AI가 발표한 "HyperAgents"입니다. 작업을 수행하는 태스크 에이전트와, 그 에이전트를 개선하는 메타 에이전트를 하나의 편집 가능한 프로그램으로 통합한 자기참조적 프레임워크인데요. 코딩, 논문 리뷰, 로보틱스, 수학 채점 등 다양한 도메인에서 자기 개선을 반복한 결과, 에이전트가 영속 메모리, 성능 추적, 다단계 검증 파이프라인 같은 것들을 스스로 구축했습니다. "에이전트가 스스로 자신의 하네스를 설계할 때"라는 해설 글에서 잘 정리하고 있듯이, 이렇게 에이전트가 만들어낸 구성 요소들은 개발자가 수작업으로 만들던 프로덕션 하네스의 핵심 요소와 정확히 일치합니다.

물론 아직 연구 단계이지만, 이것이 시사하는 바는 명확합니다. 개발자의 역할이 "하네스를 직접 짜는 것"에서 "에이전트가 좋은 하네스를 만들 수 있는 초기 조건을 설계하는 것" 으로 이동하고 있다는 점입니다.

돌이켜보면 흐름은 일관적입니다.

프롬프트를 잘 쓰는 것에서, 컨텍스트를 잘 구성하는 것으로, 다시 하네스를 잘 설계하는 것으로, 그리고 앞으로는 메타 하네스, 즉 "에이전트가 스스로 하네스를 생성하고 최적화하는 단계" 까지 확장될 것입니다.

이 모든 변화를 한꺼번에 따라가려고 하면 지칩니다. 그리고 남의 손에 맡기면, 언젠가 내가 뭘 알고 뭘 바꾸는지도 모르게 됩니다.

그래서 지금 해야 할 일은 단순합니다. 쏟아지는 스킬과 패턴을 받아들이되, 그것을 내 에이전트와 대화하면서 체화하는 것입니다. 남이 만든 agent-skills를 그대로 쓰는 것이 아니라, 그걸 내 에이전트에게 읽히고 "이 중에서 우리 프로젝트에 맞는 게 뭐야?"라고 물어보는 것입니다. 그 과정에서 자연스럽게 내 하네스가 강화됩니다.

2주 전에 "에이전트 팀을 구축해볼 때"라고 말씀드렸는데, 이번 주에 덧붙이자면 이렇습니다.

그 팀의 스킬은 남의 것을 복사하기보다, 에이전트와 함께 만들어 가시기 바랍니다. 그리고 동시에, 직접 짤 것과 맡길 것을 구분하는 눈도 점점 더 중요해질 것입니다.


Feedback : 긱뉴스 위클리 어떻게 읽고 계신가요? 의견과 제안 부탁드려요

Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요.


매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.


  • 프롬프트에서 하네스까지 - AI 에이전틱 패턴 4년의 기록

    위에서도 다뤘지만, 이 글의 진짜 가치는 단순한 트렌드 정리가 아니라 각 시대가 왜 실패했는지를 추적하는 부검 보고서에 가깝다는 점입니다. 하네스라는 용어는 2026년 2월 Terraform 창시자 Mitchell Hashimoto가 "에이전트가 실수하면 그 실수가 반복될 수 없도록 환경을 고쳐라"는 원칙에 이름을 붙이면서 퍼지기 시작했습니다. 며칠 후 OpenAI100만 줄 코드베이스를 수동 코드 없이 만든 사례를 공개하며 급속히 확산되었고요. "요즘 뭐가 이렇게 바뀌었나요?"라는 질문을 받을 때 공유하기 좋은 글입니다.

  • agent-skills - AI 코딩 에이전트를 위한 프로덕션급 엔지니어링 스킬 모음

    구글 클라우드 AI 디렉터 Addy Osmani가 만든, 에이전트가 스펙·테스트·보안 리뷰를 건너뛰는 문제를 해결하기 위한 19개 구조화된 스킬 모음입니다. /spec → /plan → /build → /test → /review → /ship까지 개발 생명주기 전체를 커버하며, Hyrum's Law, Beyonce Rule 같은 구글 엔지니어링 원칙이 워크플로우에 직접 내장되어 있습니다. 전부 쓸 필요는 없고, 본인 프로젝트에 맞는 스킬만 골라서 수정해 쓰는 것을 추천합니다. 시니어 엔지니어의 암묵지를 마크다운으로 패키징한 좋은 사례입니다.

  • Awesome Design.MD - 유명 웹사이트 디자인 시스템을 내 사이트에 적용하기

    Google Stitch가 도입한 DESIGN.md 개념을 확장해, Stripe, Notion, Vercel60개 이상 서비스의 디자인 시스템을 마크다운 하나로 패키징한 프로젝트입니다. 프로젝트 루트에 복사하면 AI 에이전트가 즉시 해당 스타일을 인식하고 UI를 생성합니다. Figma도 JSON 스키마도 필요 없고요. 기존 AGENTS.md가 에이전트의 행동 규칙을 정의했다면, DESIGN.md시각적 외형을 정의하는 쌍이라고 보시면 됩니다. 에이전트에게 "이렇게 생긴 페이지 만들어줘" 한마디로 되는 시대가 왔네요.

  • GBrain — 오픈소스 개인 지식 베이스

    YC CEO Garry Tan이 지난 번에 소개한 gstack에 이어, 이번엔 Karpathy의 LLM Wiki 방식을 개인 지식 관리에 적용한 도구입니다. 페이지마다 compiled truth(현재 최선의 이해)와 timeline(증거 추적)을 분리하는 구조가 인상적이고, MCP 서버 20개 툴7개 에이전트 스킬이 내장되어 Claude Code 및 Cursor와 바로 연동됩니다. Obsidian, Notion, Logseq에서 마이그레이션도 지원하니, 지식이 여기저기 흩어져 있는 분들에게 좋은 출발점이 될 것 같습니다.

  • 코드를 읽기 전에 실행하는 Git 명령들

    새로운 코드베이스를 접할 때 파일을 열기 전에 Git 이력만으로 프로젝트 건강 상태를 진단하는 다섯 가지 명령을 소개합니다. 가장 자주 변경된 파일, 기여자 분포, 버그 집중 지점, 월별 커밋 추세, Revert·Hotfix 빈도까지 — 코드 한 줄 안 읽고도 어디가 위험하고 누가 핵심인지 파악할 수 있습니다. 에이전트 시대에도 유효한, 오히려 에이전트에게 코드베이스 컨텍스트를 줄 때 먼저 돌려보면 좋은 명령들입니다.

  • 작은 언어 모델 GuppyLM으로 언어 모델의 작동 원리를 직접 체험하기

    9백만 파라미터짜리 초소형 언어 모델로, Colab 노트북 하나로 5분이면 학습이 끝납니다. 데이터 생성부터 토크나이저, 학습, 추론까지 전 과정이 하나의 환경에서 돌아가기 때문에 LLM의 작동 원리를 직접 손으로 만져보며 이해하기에 좋습니다. GQA, RoPE 같은 복잡한 기법 없이 기본형 Transformer만 사용한 것도 교육 목적에 딱 맞고요. AI 도구를 쓰는 것과 별개로, 내부 원리를 한 번쯤 직접 체험해보고 싶은 분들에게 추천합니다.

  • rtk - LLM 토큰 소비를 60~90% 줄여주는 CLI 프록시

    AI 코딩 도구가 실행하는 CLI 명령어 출력을 LLM에 보내기 전에 필터링·압축해서 토큰을 60~90% 절감해주는 Rust 기반 프록시입니다. git status, cargo test 같은 100개 이상 명령어를 지원하고, 설치하면 기존 명령어가 자동으로 rtk를 거치게 됩니다. 30분 Claude Code 세션 기준 약 80% 토큰 절감이 가능하다고 하니, 토큰 비용이 부담되기 시작한 분들은 한번 시도해볼 만합니다.

  • 코드 에이전트 오케스트라 - 멀티 에이전트 코딩을 제대로 작동시키는 법

    역시 Addy Osmani의 글입니다. 단일 에이전트와 동기적으로 작업하던 컨덕터 모델에서, 여러 에이전트가 각자의 컨텍스트 윈도우를 갖고 비동기로 움직이는 오케스트레이터 모델로의 전환을 다루고 있습니다. 서브에이전트, 에이전트 팀, 계층적 위임이라는 세 가지 패턴을 정리했고, 병목이 코드 생성이 아니라 검증(Verification)으로 이동했다는 지적이 핵심입니다. 위에서 다룬 agent-skills와 함께 읽으면 그의 전체 그림이 보입니다.

  • 바이브 코딩 숭배는 미쳐있다

    BitTorrent 창시자 Bram Cohen이 Claude 소스코드 유출 사건을 계기로 바이브 코딩의 맹신을 비판한 글입니다. 순수한 바이브 코딩은 미신이고, 실제로는 계획 파일·스킬·규칙 같은 인간의 구조 설계가 반드시 수반된다는 점을 짚습니다. AI는 코드 중복이나 기술 부채 정리에 뛰어나지만, 인간이 먼저 문제를 파악하고 방향을 줘야 한다는 주장인데요. 위에서 다룬 "하네스를 고쳐라"는 원칙과 정확히 같은 이야기를 다른 각도에서 하고 있는 글입니다.

  • 코딩 에이전트의 구성 요소

    ML 분야의 베스트셀러 저자 Sebastian Raschka가 코딩 에이전트의 내부 구조를 체계적으로 분해한 글입니다. LLM은 엔진, 추론 모델은 강화된 엔진, 하네스는 그 엔진을 제어하는 시스템이라는 비유가 깔끔하고요. 리포 컨텍스트, 프롬프트 캐시, 도구 접근, 세션 메모리, 서브에이전트 위임까지 여섯 가지 구성 요소로 나눠 설명합니다. 하네스가 대체 뭘 하는 건지 구체적으로 알고 싶은 분에게 좋은 입문 글입니다.

  • Advisor 전략: Opus를 조언자로 활용해 Sonnet의 지능을 끌어올리기

    Anthropic이 공식 도입한 패턴으로, Opus를 조언자, Sonnet/Haiku를 실행자로 조합해 비용은 낮추면서 추론 품질을 끌어올리는 전략입니다. Haiku + Opus 조합이 Haiku 단독 대비 BrowseComp 점수 두 배 이상을 기록하면서 Sonnet 대비 비용은 85% 절감했다는 결과가 눈에 띕니다. API 요청 하나에 advisor_20250301 툴만 선언하면 되니 구현도 간단하고요. 큰 모델이 항상 모든 걸 처리할 필요 없다는, 하네스 설계의 좋은 실전 사례입니다.

  • Claude Code, 2월 업데이트 이후 복잡한 엔지니어링 작업에서 사용 불가 수준으로 품질 저하

    Claude Code가 2월 업데이트 이후 복잡한 작업에서 품질이 크게 떨어졌다는 보고입니다. 흥미로운 점은 이 보고서 자체를 Claude Opus 4.6이 자신의 6,852개 세션 로그를 직접 분석해서 작성했다는 것인데요. Extended Thinking 토큰이 최대 73% 감축되면서 "읽고 나서 편집"이 "바로 편집"으로 바뀌었고, 파일 읽기 횟수가 70% 감소했다는 수치가 구체적입니다. 하네스를 아무리 잘 짜도 모델 자체의 사고 깊이가 줄면 한계가 있다는 점을 보여주는 사례이기도 합니다.

  • Caveman - 원시인 말투로 Claude/Codex 토큰 절약하기

    에이전트 응답을 원시인 말투로 강제해서 출력 토큰을 평균 65~75% 절감하는, 발상이 재미있는 스킬입니다. "Sure, I'd be happy to help" 같은 군더더기를 전부 잘라내고 핵심만 남기는 방식인데, React 리렌더링 설명이 1,180토큰에서 159토큰으로 87% 줄어드는 벤치마크가 인상적입니다. Lite·Full·Ultra 세 단계로 압축 강도 조절도 가능하고요. 위에서 소개한 rtk가 입력 토큰을 줄여준다면, 이건 출력 토큰 쪽 절감입니다.

  • 기계는 괜찮아요. 나는 우리가 걱정됩니다.

    AI 도구의 기술적 한계가 아니라 인간의 학습 과정이 우회되는 구조를 걱정하는 글입니다. 같은 논문을 냈어도, 직접 고민한 Alice와 AI에 맡긴 Bob의 차이를 학계의 평가 시스템은 구별하지 못하는데요. 이 시스템은 고장난 게 아니라 설계된 대로 작동 중이라는 지적이 날카롭고요. 위에서 다룬 하네스 엔지니어링 이야기와도 연결됩니다. 도구가 강해질수록 이해 없이 결과만 뽑는 것도구를 이해하며 쓰는 것 사이의 격차는 더 벌어질 수밖에 없으니까요.

  • strix - 앱의 취약점을 찾아 수정하는 오픈소스 AI 해커

    실제 해커처럼 코드를 실행하고, 취약점을 찾아 PoC(개념 증명)로 직접 검증까지 해주는 오픈소스 AI 보안 테스트 도구입니다. IDOR, SQL 인젝션, SSRF, JWT 취약점 등을 커버하고, GitHub Actions에 연동하면 PR마다 자동으로 보안 스캔이 돌아갑니다. 여러 에이전트가 협력하는 Graph of Agents 구조로 설계되어 있어서, 에이전트가 코드를 짜는 시대에 에이전트가 보안도 잡아주는 흐름이 자연스럽습니다.

  • 8년의 갈망, 3개월의 완성 - AI가 바꾼 사이드 프로젝트의 공식

    8년간 만들고 싶었던 SQLite 개발 도구를 AI로 3개월 만에 완성한 실전 기록입니다. 처음에는 AI에게 설계까지 맡기는 바이브 코딩으로 갔다가 스파게티 코드가 되어 Rust로 전면 재작성한 경험이 솔직하게 담겨 있습니다. 결국 AI를 "자동완성 강화 도구"로 제한하고 설계·검토는 직접 주도하면서 린팅·테스트 자동화 같은 검증용 스캐폴딩을 먼저 깔았을 때 성과가 나왔다고요. 바로 위 Bram Cohen의 글과 함께 읽으면 같은 결론에 다른 경로로 도착하는 게 보입니다.

  • AI 기반 Google Finance, 한국 포함 100개국 이상으로 글로벌 확장

    Google Finance가 AI 기능을 탑재하고 한국 포함 100개국으로 확장했습니다. Gemini 기반으로 자연어 금융 질의가 가능해졌고, 캔들스틱 차트나 이동평균 엔벨로프 같은 기술 지표도 추가되었습니다. 어닝 콜을 라이브 오디오 + AI 인사이트로 실시간 추적하는 기능도 눈에 띄고요. 요즘 투자 관련 도구들 직접 만드시는 분들이 많던데, 가볍게 쓰기에 좋습니다.

  • SQLite로 실제 쇼핑몰을 운영하며 배운 것들

    AI 에이전트가 자율 운영하는 쇼핑몰을 SQLite + Rails 8로 프로덕션에 올리면서 겪은 실전 경험담입니다. 2시간에 11번 배포하다가 블루-그린 배포 겹침으로 Stripe 결제는 됐는데 DB에 주문이 안 남는 사고가 발생한 이야기가 생생합니다. 해결책이 기술적이 아니라 "배포 속도를 늦춰라"라는 절차적 규칙이었고, 이걸 CLAUDE.md에 명시해서 AI 에이전트가 따르게 했다는 점이 재미있습니다. SQLite 프로덕션 도입을 고민하는 분에게 실패 사례까지 포함된 귀한 레퍼런스입니다.

  • Claude Managed Agents - 프로덕션 속도를 10배 더 빠르게

    메인 기사에서 설계 철학은 다뤘으니, 제품 쪽을 짧게 들여다 보면요. 보안 샌드박싱, 자격 증명 관리, 권한 제어 같은 프로덕션 인프라를 API가 알아서 처리해주고, 사용자는 작업 정의에만 집중하는 구조입니다. Notion, Rakuten, Asana, Sentry 등이 이미 활용 중이고, 사용량 기반 과금으로 공개 베타 중입니다. 직접 에이전트 인프라를 짜본 분이라면 이 부분만으로도 써볼 이유가 충분할 것 같습니다.

  • Ruff·uv 만든 Astral이 공개한 오픈소스 보안 전략 전모

    Ruffuv를 만든 Astral이 자사의 오픈소스 보안 전략을 전면 공개한 글입니다. Trivy/LiteLLM 공급망 해킹 사건을 계기로, GitHub Actions의 위험한 트리거 금지, 액션 커밋 해시 고정, 최소 권한 원칙 같은 실천 방식을 구체적으로 설명합니다. 수백만 개발자가 의존하는 도구를 만드는 팀이 어떤 수준으로 CI/CD와 릴리즈 파이프라인을 잠그고 있는지 보여주는 글이라, 오픈소스를 운영하거나 공급망 보안이 신경 쓰이는 분에게 좋은 체크리스트입니다.

  • macOS에 숨어있던 49일짜리 시한폭탄 — TCP 네트워킹이 완전히 멈추는 커널 버그 전말

    macOS를 정확히 49일 17시간 2분 47초 연속 가동하면 TCP 네트워킹이 완전히 멈추는 커널 버그가 발견되었습니다. 원인은 tcp_now 카운터의 32비트 정수 오버플로우로, 커널의 TCP 시계가 멈추면서 TIME_WAIT 연결이 영원히 회수되지 않는 구조입니다. ping은 되는데 새 TCP 연결이 안 되는 증상이라 디버깅이 까다롭고요. Mac 서버를 장기간 재부팅 없이 운영하는 분이라면 꼭 확인해두세요. 현재 유일한 해결책은 재부팅이라고 합니다. 근데 댓글에도 보면 정작 발생하는 사람이 많지는 않기도 한 것 같아요. 제가 최근에 맥북을 서버로 하나 이용중인데.. 49일 후에 말씀드리겠습니다.

  • Google AI Edge Gallery - 완전 오프라인 LLM 갤러리 앱 오픈소스

    Google이 공개한 완전 오프라인 LLM 갤러리 앱입니다. Gemma 4 패밀리를 폰에서 바로 돌릴 수 있고, 인터넷 없이 채팅·이미지 인식·음성 전사까지 됩니다. Thinking Mode로 모델의 추론 과정을 단계별로 시각화할 수 있는 것도 재미있고요. Android 12+, iOS 17+ 지원이고 Play 스토어·App Store에서 바로 설치 가능합니다. 온디바이스 AI가 어디까지 왔는지 직접 느껴보기 좋은 앱입니다.

  • webreel - 브라우저 데모를 MP4 영상으로 자동 녹화하는 CLI 도구

    Vercel Labs에서 만든, JSON 설정 파일로 브라우저 데모를 MP4 영상으로 자동 녹화해주는 CLI 도구입니다. 클릭·타이핑·스크롤 같은 액션을 정의하면 헤드리스 Chrome이 ~60fps로 캡처하고 ffmpeg으로 인코딩합니다. 커서 애니메이션이나 키스트로크 HUD 오버레이까지 합성 가능하고요. README에 넣을 데모 영상이나 프로덕트 소개 영상을 매번 수동으로 녹화하던 분들에게 유용할 것 같습니다.

  • 고용주들이 개인 데이터로 지원자가 수락할 최저 연봉을 계산하는 '감시 임금' 시대

    고용주가 지원자의 급전 대출 이력, 신용카드 잔액, SNS 게시물 같은 개인 데이터로 "이 사람이 수락할 최저 연봉"을 알고리듬으로 계산하는 감시 임금(Surveillance Wages) 현상을 다룬 글입니다. UC 어바인 연구팀이 노동관리 AI 기업 500곳을 감사한 결과, 의료·물류·소매 분야 주요 고용주들이 이미 이런 도구를 쓰고 있다고 합니다. 같은 시설, 같은 업무인데 개인별로 다른 임금이 지급되는 사례도 보고되었고요. AI가 효율화하는 것이 항상 좋은 방향은 아니라는 점을 생각하게 하는 글입니다.

  • Claude Code, 에이전트가 필요할 때 깨워주는 Monitor Tool 기능 도입

    Claude Code에 Monitor Tool이 추가되었습니다. 폴링 대신 백그라운드 프로세스를 띄워서 로그를 계속 추적하다가, 특정 상황이 발생하면 대화창으로 스트리밍하는 방식입니다. 예를 들어 kubectl logs -f | grep error를 걸어두고 충돌 발생 시 자동으로 PR을 제출하게 할 수 있습니다. 에이전트가 계속 깨어있을 필요 없이 필요할 때만 깨우니 토큰 효율도 좋고요. 에이전트가 점점 상시 대기하는 인프라에 가까워지고 있다는 느낌입니다.

  • Sam Altman이 우리의 미래를 통제할지도 모른다 – 그를 신뢰할 수 있을까?

    뉴요커가 Sam Altman과 OpenAI의 내부 권력 구조를 깊이 파헤친 장문의 프로필 기사입니다. 2023년 해임 사건의 발단이 된 Ilya Sutskever의 70페이지 기밀 메모, 전 동료들이 남긴 수백 페이지의 기록, 이사회 멤버가 그를 "진실에 구속받지 않는 사람"으로 묘사한 대목까지 상당히 구체적입니다. 비영리에서 1조 달러 IPO를 준비하는 영리법인으로 전환되는 과정에서 안전 연구팀이 해산되어 가는 흐름도 함께 다루고 있습니다. AI 업계의 현재 권력 구도를 이해하는 데 필수적인 글입니다.

  • LM Studio Headless CLI와 Claude Code로 로컬에서 Google Gemma 4 실행하기

    LM Studio 0.4.0의 새 Headless CLI(llmster)로 Gemma 4를 로컬에 띄우고, Claude Code의 백엔드로 연결해서 완전 오프라인 코드 어시스턴트를 만드는 가이드입니다. Gemma 4의 MoE 구조 덕분에 26B 모델이 4B 파라미터만 활성화되어 M4 Pro MacBook에서 초당 51토큰이 나온다고 합니다. API 비용 없이 빠른 코드 리뷰나 프롬프트 테스트를 돌리고 싶은 분에게 실용적인 셋업 가이드입니다.

  • 닌텐도 Wii에서 Mac OS X 10.0(Cheetah) 구동 성공

    닌텐도 Wii에서 Mac OS X 10.0(Cheetah) 을 GUI까지 부팅시킨 10년짜리 포팅 프로젝트입니다. Wii의 PowerPC 750CL이 G3 iMac 계열과 호환된다는 점을 이용해, XNU 커널 수정부터 부트로더, IOKit 드라이버까지 직접 작성했습니다. 88MB RAM에서 돌아가게 만든 것도 대단하고요. 실용성과는 거리가 있지만, "안 될 것 같은 걸 끝내 해내는" 해커 정신이 돋보이는 프로젝트입니다.

  • S3 Files와 변화하는 S3의 모습

    AWS CTO Werner Vogels가 직접 소개한 S3 Files입니다. S3 버킷을 NFS로 마운트해서 EC2, 컨테이너, Lambda에서 파일 시스템처럼 읽고 쓸 수 있게 해줍니다. 내부적으로 stage-commit 구조로 변경을 S3에 반영하고, 파일과 객체 간 양방향 동기화를 지원합니다. S3 Tables(구조화 데이터), S3 Vectors(벡터 검색)와 함께 S3가 단순 저장소에서 통합 데이터 플랫폼으로 확장되고 있는 흐름인데요. 현대적 클라우드 인프라의 출발점이었던 S3가 20년 만에 다시 정의되는 느낌이네요.

  • Claude Mythos Preview의 사이버보안 능력 평가

    Anthropic이 아직 일반 공개하지 않은 Claude Mythos Preview의 사이버보안 능력 평가 보고서입니다. OpenBSD에서 27년간 미발견된 취약점을 찾아내고, Firefox JS 엔진 익스플로잇을 Opus 4.6이 2회 성공한 데 비해 181회 성공시킨 결과가 충격적입니다. 보안 전용 훈련 없이 코드·추론·자율성의 일반적 역량 향상에서 자연스럽게 나온 능력이라는 점도 주목할 부분이고요. Anthropic은 이 모델을 일반에 공개하지 않고, 핵심 파트너에게만 제한 공개하면서 방어 체계를 먼저 강화하겠다는 입장입니다.

  • 월 100달러 Claude Code 예산을 Zed와 OpenRouter로 재배분하기

    Claude Code 월 $100 구독 대신 Zed($10) + OpenRouter 크레딧($90) 으로 나눠 쓰는 방식을 소개하는 글입니다. OpenRouter를 쓰면 크레딧이 이월되고 여러 모델을 골라 쓸 수 있어서, Claude Code 한도에 자주 걸리는 분에게는 더 유연한 구성이 됩니다. Zed의 Agent Client Protocol(ACP) 로 외부 모델과 직접 연동하는 구조도 흥미롭고요. 꼭 하나의 도구에 묶일 필요 없다는 점에서, 자기 상황에 맞게 하네스를 조합하는 좋은 사례입니다.

  • GLM-5.1: 장기적 과제 수행을 향한 진화

    중국 Z AI의 GLM-5.1장기 실행 에이전틱 작업에 특화된 모델로 공개되었습니다. SWE-Bench Pro, Terminal-Bench 2.0 등에서 최고 수준 성능을 기록했는데, 흥미로운 점은 수백~수천 회 반복 실행하면서 자체 로그를 분석하고 전략을 수정해 성능이 계속 올라간다는 것입니다. 1회성 벤치마크가 아니라 오래 돌릴수록 결과가 좋아지는 구조를 핵심으로 내세우고 있어서, 하네스 엔지니어링 맥락에서도 주목할 만합니다.

  • Shopify AI Toolkit - 클로드 코드/코덱스로 스토어를 관리하세요

    Shopify가 공식 배포한 AI Toolkit으로, Claude Code나 Codex에서 "내 상품들에 SEO 최적화 해줘", "전 상품 15% 할인 걸어줘" 같은 명령으로 스토어를 직접 관리할 수 있게 해줍니다. 플러그인 방식으로 설치하면 자동 업데이트까지 지원되고, Shopify의 문서·API 스키마·코드 검증이 내장되어 에이전트가 추측이 아닌 검증된 방식으로 동작합니다. 커머스 플랫폼이 에이전트 생태계를 공식 지원하기 시작한 의미 있는 사례네요.

  • 나는 여전히 Skills보다 MCP를 선호한다

    Skills와 MCP를 지식 계층 vs 연결 계층으로 구분해야 한다는 주장입니다. Skills는 에이전트에게 절차적 지식을 가르치는 데 좋지만, CLI 의존성·인증·플랫폼 호환성에서 마찰이 크고, MCP는 Zero-Install·OAuth·샌드박싱으로 어떤 환경에서든 동일하게 작동하는 API 추상화라는 것이 핵심입니다. 요즘 Skills가 주목받고 있지만 MCP와 역할이 다르다는 시각이라, 이번 주 메인에서 다룬 스킬 공유 흐름과 함께 읽으면 어디에 뭘 써야 하는지 판단하는 데 도움이 됩니다.

  • Meta의 HyperAgents — 에이전트가 스스로 자신의 하네스를 설계할 때

    Kore.ai AI 에반젤리스트 Cobus Greyling이 HyperAgents 논문의 결과를 하네스 엔지니어링 맥락에서 재해석한 글인데요. 에이전트가 스스로 만들어낸 구성 요소(영속 메모리, 성능 추적, 검증 파이프라인)를 개발자가 수동으로 짜던 하네스의 6가지 핵심 모듈에 하나씩 대응시킨 정리가 깔끔합니다. 논문 원문보다 실무자 관점에서 읽기 좋습니다.


✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Dooray!봇, Discord봇, 구글 챗 봇, Swit 봇
긱뉴스를 트위터에서 구독 하거나 RSS로도 구독 가능 합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.