메인에서 AEO의 큰 그림을 다뤘는데, 실무자 관점에서 한 가지 더 짚을 부분은 "그래서 내 문서에서 뭘 바꿔야 하는가" 입니다. 이 글은 robots.txt → llms.txt → agent-permissions.json → MCP Server Card로 이어지는 AEO 스택을 레이어별로 구체적으로 풀어주기 때문에, 개념보다 실행이 궁금한 분들에게 특히 유용합니다. 참고로 llms.txt는 Anthropic, Cursor, Vercel, Stripe 등이 이미 채택했지만, 구글의 John Mueller는 "AI 서비스 중 이걸 읽는다고 공식화한 곳은 없다" 고 잘라 말한 바 있어서, 아직은 "비용이 낮으니 깔아두는" 정도로 접근하시는 게 맞습니다.
[GN#354] 이제 SEO 다음은 AEO를 고민할 때입니다
SEO는 국내에서 구글의 영향력이 제한적이었던 시기가 길어서, 해외만큼 핵심 지표로 받아들여지지는 않았습니다. 모바일 중심 사용이 커지고 구글 검색 비중도 늘면서 어느 정도 중요해지기는 했지만, 사실 자리를 제대로 잡기도 전에 검색 자체가 흔들리기 시작했죠. 구글 검색 결과 상단에 AI Overviews가 자리잡고, 사람들이 ChatGPT나 Claude, Perplexity에 먼저 질문을 던지기 시작하면서, "검색 순위를 올린다"는 오래된 과제가 점점 희미해지고 있습니다. 국내에서는 이 흐름이 더 급하게 체감되기도 합니다. SEO가 채 여물지 못한 채로, 에이전트 단계로 건너뛰는 듯한 느낌이에요.
그래서 최근에는 에이전트에게 어떻게 우리 사이트를 알릴 것인가에 대한 논의가 활발합니다. AEO(Agentic Engine Optimization), AAO(Assistive Agent Optimization), GEO(Generative Engine Optimization) 등 약어도 계속 늘어나고 있는데요. 문제는 20년 넘게 쌓여온 SEO와 달리, 에이전트 쪽은 스펙 자체가 너무 급하게 쏟아지고 있어서 어디에 맞춰야 할지 기준을 잡기가 쉽지 않다는 점입니다.
먼저 구글 AI 디렉터 Addy Osmani가 에이전틱 엔진 최적화 (AEO) 라는 글을 통해 이 주제를 꽤 체계적으로 정리했습니다. AEO란 AI 에이전트가 사이트의 콘텐츠를 더 잘 발견하고, 이해하고, 활용할 수 있도록 문서 구조와 접근 방식을 정비하는 작업에 가깝습니다. Addy의 글은 특히 개발자 문서와 코딩 에이전트 맥락에서 이 문제를 구체적으로 설명하는데요. 사람 중심 SEO만 계속 붙들고 있으면, 점점 늘어나는 AI 트래픽이 분석 도구에 잡히지도 않은 채 조용히 사라질 수 있다는 문제의식에서 출발합니다.
에이전트가 문서를 소비하는 방식은 사람과 근본적으로 다릅니다. 사람은 문서 홈에 들어와 섹션을 훑고, 코드 샘플을 복사해보고, 내부 링크를 몇 번 타고 들어가며 4~8분을 머뭅니다. 이 모든 행동이 구글 애널리틱스에 찍히죠. 반면 Claude Code, Cursor, Cline, Aider 같은 코딩 에이전트들은 문서를 사람처럼 탐색하기보다, 필요한 페이지를 한두 번의 요청으로 가져와 바로 컨텍스트에 넣고 처리합니다. 스크롤이나 클릭, 체류 시간 같은 신호가 거의 남지 않습니다. 기존 분석 관점에서 보면 "아무도 안 읽은 페이지"가 되는 거죠.
더 까다로운 건 토큰 문제입니다. 에이전트가 다룰 수 있는 컨텍스트가 무한하지 않아서, 문서가 길면 조용히 잘리거나, 아예 건너뛰거나, 최악의 경우 파라메트릭 지식으로 폴백해서 환각을 만들어냅니다. 글에서는 실제 사례로 19만 토큰에 달하는 Cisco 방화벽 문서를 드는데, 이 한 문서만으로도 에이전트의 가용 컨텍스트 대부분을 소모할 수 있는 수준입니다. Addy는 Quick Start는 15K 토큰 미만, API 레퍼런스 페이지는 25K 토큰 미만처럼 토큰을 1급 지표로 관리할 것을 제안합니다.
이어 robots.txt(접근 제어), llms.txt(사이트맵), agent-permissions.json, MCP Server Card까지 이어지는 "AEO 스택" 을 레이어별로 정리합니다. 함께 공개한 agentic-seo라는 감사 도구도 있는데, 솔직히 말씀드리면 아직 체크 항목이 단편적이라 실무에서 바로 쓰기엔 초기 단계로 보입니다. 다만 개념적 지도로는 지금까지 본 것 중 가장 정돈되어 있어서, 한 번 통독해둘 가치는 충분합니다.
비슷한 맥락에서, Cloudflare도 Is Your Site Agent-Ready? 라는 도구 하나를 내놨습니다. 전통적인 CDN 회사에서 출발했지만, 최근 Workers AI, AI Gateway, Agents SDK 등을 잇따라 출시하며 AI 시대의 AWS 경쟁자로 스스로를 포지셔닝하고 있는 Cloudflare가 만든 만큼, 그들이 에이전트 최적화를 어떻게 바라보는지 엿볼 수 있는 참고자료입니다.
URL을 넣으면 네 가지 영역을 점수로 평가해줍니다. Discoverability(robots.txt, sitemap.xml, Link Headers), Content(에이전트용 Markdown 제공 여부), Bot Access Control(AI bot 규칙, Web Bot Auth), Capabilities(Agent Skills, API Catalog, OAuth 서버 디스커버리, MCP Server Card, WebMCP). 실패 항목마다 코딩 에이전트에 그대로 붙여넣을 수 있는 프롬프트를 함께 제공해서, 바로 수정 작업으로 이어지게 만든 점은 꽤 영리합니다.
다만 작성 시점 기준으로는 cloudflare.com 보다도 평가 사이트 자체가 훨씬 높은 점수를 받고 있어, 이 점수 체계가 아직은 실전 성능 측정보다 체크리스트 기반 진단에 가깝고, 제시된 지표들이 실제 에이전트의 선택에 얼마나 영향을 주는지도 아직 충분히 검증되지 않았다는 점을 보여줍니다.
사실 에이전틱 최적화는 아직 연구와 검증이 충분히 쌓이지 않은 분야입니다. llms.txt 같은 스펙도 아직 표준화된 것이 아니고, 주요 에이전트들이 이를 실제로 얼마나 활용하는지도 불투명합니다. 다만 일부 주요 서비스들이 이미 llms.txt 계열 파일을 제공하기 시작한 만큼, 완전히 무시하기보다는 실험적 신호로 보는 편이 맞겠습니다. 점수를 매겨주는 감사 도구들 역시 "이걸 따르면 정말 에이전트에 더 잘 노출되는가"에 대한 실증적 근거를 제시하지는 못합니다. 한동안은 제안된 스펙들이 난립하며 정리되는 과정을 거칠 겁니다.
그렇다고 손을 놓고 있을 수는 없습니다. robots.txt를 열어두고, 문서를 Markdown으로도 제공하고, 토큰 길이를 의식해서 문서를 청킹하는 정도는 당장 손해 볼 게 없는 최소한의 준비 작업에 가깝습니다. 자신의 서비스가 에이전트와 연결될 가능성이 조금이라도 있다면, 점수에 집착하기보다는 이런 기본 기능부터 조금씩 챙겨두시길 권합니다.
저도 가끔 ChatGPT나 Claude와 기술 얘기를 하다 보면, 긱뉴스를 레퍼런스로 끌어와 설명하는 걸 자주 봅니다. 한국어 콘텐츠가 상대적으로 희소해서 그런지, 적어도 일부 주제에서는 자국어로 잘 정리된 글이 에이전트에게 더 자주 선택되는 것 같다는 인상도 받습니다. 검색보다 훨씬 개인화되는 에이전틱 흐름 속에서, 내 서비스가 에이전트에게 잘 꺼내질 수 있도록 조금씩 준비해 두시기 바랍니다.
참고로 같은 흐름을 더 넓게 조망해 보고 싶으시다면, 좀 더 오래된 글이지만 생성형 엔진 최적화(GEO), 검색의 규칙을 어떻게 바꾸는가와 보조 에이전트 최적화(AAO): SEO의 다음 진화 단계도 함께 읽어보시면 맥락을 잡는 데 도움이 될 겁니다.
결국 에이전트 시대의 노출은 예전처럼 클릭을 얼마나 받느냐보다, 필요한 순간에 신뢰할 수 있는 레퍼런스로 얼마나 자주 호출되느냐에 더 가까워지고 있습니다. 검색을 넘어 더 개인화되고, 더 추상화된 인터페이스로 이동하는 흐름 속에서, 자신의 서비스가 “어디에 노출되는가”가 아니라 “어떻게 호출되는가” 를 고민해야 할 시점입니다.
긱뉴스에 GeekBadge 기능이 추가되었습니다. GeekNews 안에서 자신의 활동을 아이콘으로 보여주는 배지 시스템인데요. 직접 고른 대표 배지 5개로 자신을 드러낼 수 있고, 이제 사용자 ID 위에 마우스를 올리면 미리보기로 보여줍니다. 긱뉴스에서의 활동을 통해 자동으로 얻게 되는 어워드 배지, 뉴스를 올려 획득하는 GeekGold로 구매 가능한 긱배지, 특수한 상황에 제공하는 스페셜 배지 등이 있습니다. 자신이 관심 가지는 다양한 기술/도구/취미 등을 배지로 나타낼 수 있으며 계속 추가할 예정입니다.
✓ Feedback : 긱뉴스 위클리 어떻게 읽고 계신가요? 의견과 제안 부탁드려요
✓ Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요.
매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.
- 에이전틱 엔진 최적화 (AEO)
- Is Your Site Agent-Ready? - 당신의 사이트는 에이전트에 대응하나요?
이 도구의 진짜 가치는 점수 자체보다 실패 항목마다 에이전트에게 바로 붙여넣을 수 있는 수정 프롬프트를 제공한다는 점입니다. "뭘 고쳐야 하는지는 알겠는데 어디서부터 시작하지?" 싶을 때 출발점으로 쓰기 좋습니다. 다만 정작 cloudflare.com이 25점이고 평가 사이트 자신만 83점인 상황이니, 점수를 성적표로 받아들이기보다는 체크리스트 생성기 정도로 가볍게 활용하시길 권합니다.
- 월 $20 스택으로 월매출 $10K 회사를 여러 개 운영하는 법
VPS 한 대, Go 단일 바이너리, SQLite, 로컬 GPU라는 극한의 린 스택으로 MRR $10K 사업을 여러 개 돌리는 부트스트래퍼의 운영기입니다. AWS에 월 300달러 쓰기 전에 5달러짜리 VPS로 시작하라는 메시지인데, 특히 RTX 3090에서 VLLM을 돌려 AI 배치 처리 비용을 제로로 만드는 부분이 요즘 로컬 AI 흐름과 맞물려 실용적입니다. VC 없이 런웨이를 무한히 늘리는 전략이 궁금한 1인 개발자, 사이드 프로젝트 운영자라면 꼭 읽어보시길 권합니다.
- Thoughtworks Technology Radar, Volume 34 공개
6개월마다 발행되는 ThoughtWorks의 기술 트렌드 보고서 34호입니다. 이번 핵심 테마는 에이전트 시대의 기술 평가, 코딩 에이전트의 보안, 소프트웨어 크래프트맨십 원칙의 재조명, 코딩 에이전트 하네스 네 가지인데요. 특히 AI 생성 코드가 쌓이면서 작동 원리에 대한 이해 없이 솔루션을 채택하게 되는 "코드베이스 인지 부채(Codebase Cognitive Debt)" 개념과, 유용한 에이전트일수록 모든 것에 접근 권한을 요구하게 되는 "Permission Hungry" 딜레마가 인상적입니다. 100개가 넘는 기술 항목을 4단계로 분류해둔 만큼, 전체를 훑어보며 지금 팀에서 쓰고 있는 기술의 위치를 확인해보는 용도로도 좋습니다.
- 홈랩 2026 현황: 셀프호스팅 취미의 진화
GMKTec NUC 한 대와 Hetzner VM을 조합해 미디어, AI, 사진, 모니터링까지 월 7유로로 돌리는 셀프호스팅 사례입니다. Docker + Ansible IaC + Cloudflare Tunnel(무료이고 인바운드 포트 개방이 필요없어서 NAT 환경에서 최적입니다. 강력 추천)이라는 조합이 깔끔하고, "완벽보다 학습과 즐거움"이라는 운영 철학도 셀프호스팅 입문자에게 부담을 낮춰줍니다. 바로 위의 "$20 스택" 글과 함께 읽으면, 요즘 개인 인프라의 실용적 하한선이 어디쯤인지 감이 잡힐 겁니다.
- Gemma 4를 Codex CLI에서 로컬 모델로 실행하기
Google의 Gemma 4를 로컬에서 OpenAI Codex CLI의 대체 모델로 돌려본 실전 기록입니다. 이전 세대에서 도구 호출 성공률이 6.6%에 불과했던 게 Gemma 4에서 86.4% 로 뛴 것이 실험의 출발점인데, Mac M4 Pro와 NVIDIA GB10 두 환경에서 llama.cpp, Ollama, vLLM을 오가며 겪은 삽질이 아주 구체적입니다. 로컬 코딩 에이전트에 관심 있는 분이라면 어떤 설정 조합이 실제로 작동하고, 어디서 막히는지를 미리 파악할 수 있어 시행착오를 크게 줄여줄 글입니다.
- BOJ 서비스 종료
국내 개발자라면 한 번쯤은 거쳐갔을 알고리듬 문제풀이 사이트 백준 온라인 저지(BOJ) 가 16년 만에 서비스를 종료합니다. 4월 28일이 마지막이고, 문제 데이터는 다시 볼 수 있는 형태로 남기는 방안을 검토 중이라고 합니다. 사실상 1인 운영으로 이 규모의 서비스를 16년간 유지해온 것 자체가 놀라운 일인데요. 코딩 테스트 준비의 사실상 표준이었던 만큼, 댓글에서도 충격과 아쉬움의 반응이 쏟아지고 있습니다.
- Claude Code(~100시간) vs. Codex(~20시간) 비교
14년차 시니어 엔지니어가 8만 줄 규모 실제 프로젝트에서 Claude Code(Opus 4.6)와 OpenAI Codex(GPT-5.4)를 나란히 쓰며 비교한 글입니다. Claude Code는 빠르지만 지시 무시와 반쪽짜리 완료가 잦아 적극적인 감시가 필요하고, Codex는 3~4배 느리지만 자발적으로 리팩토링하며 지시 파일을 충실히 따르는 차이가 인상적입니다. 두 도구 모두 "소프트웨어 엔지니어링 역량 없이는 좋은 결과를 내기 어렵다"는 결론이 가장 핵심인데, 코딩 에이전트 도입을 고민하는 팀이라면 기대치 설정에 큰 도움이 될 글입니다.
- damn-my-slow-kt - KT 인터넷 SLA 미달 자동 측정 & 요금 감면 신청 도구
KT 인터넷이 계약 속도의 50% 미달일 때 매일 자동 측정하고 이의신청까지 대행해주는 오픈소스 도구입니다. KT의 SLA 제도가 "매일 측정해야 매일 감면"이라는 번거로운 구조인 점을 정확히 겨냥했고,
npx한 줄로 셋업이 끝나는 설계가 깔끔합니다. 댓글에서는 "KT가 규정을 바꿀 것 같다"는 반응부터 "의도적 불편함으로 막아두던 것을 자동화로 뚫은 것"이라는 반응까지 나오고 있는데, 개발자가 자기 권리를 코드로 행사하는 재미있는 사례입니다. - Happy - Codex 및 Claude Code용 모바일/웹 클라이언트
Claude Code와 Codex를 휴대폰에서 원격으로 모니터링하고 조작할 수 있는 오픈소스 클라이언트입니다. 코딩 에이전트가 장시간 작업을 돌리는 워크플로우가 늘면서, 데스크톱 앞에 붙어 있지 않아도 권한 요청이나 에러를 푸시 알림으로 받고 바로 응답할 수 있다는 게 핵심입니다. E2E 암호화 적용에 셀프호스팅도 가능하고,
npm install -g happy한 줄이면 셋업이 끝나니 코딩 에이전트를 본격적으로 쓰는 분이라면 한번 시도해볼 만합니다. - VoxCPM2 - 실제 음성과 비슷한 음성 복제 가능한 다국어 음성 합성 오픈소스
한국어 포함 30개 언어를 지원하는 오픈소스 음성 합성 모델인데, 언어 태그 없이 텍스트만 넣으면 합성되고,
(Young female voice, warm and gentle)같은 자연어 설명만으로 음성 캐릭터를 생성할 수 있는 점이 눈에 띕니다. VRAM 8GB면 구동 가능하고 Apache-2.0 라이선스라 상용 제한도 없습니다. 5~10분 분량의 오디오만 있으면 LoRA 파인튜닝으로 특정 화자 적응도 가능하니, 팟캐스트나 사내 콘텐츠 제작에 로컬 TTS를 고민하던 분들은 한번 살펴보시길 권합니다. - pgmicro - SQLite 기반으로 만든 인-프로세스 PostgreSQL
PostgreSQL SQL을 SQLite 바이트코드로 직접 컴파일해서 실행하는 인메모리 임베디드 DB입니다. PostgreSQL을 통째로 Wasm에 올리는 PGlite 같은 접근과 달리, PostgreSQL의 파서(
libpg_query)만 가져오고 엔진은 Turso(Rust로 재구현한 SQLite)를 쓰는 구조가 흥미롭습니다. AI 에이전트 환경에서 일시적으로 뜨고 사라지는 소규모 DB 수요를 정조준한 프로젝트인데, 출력 파일이 표준 SQLite.db형식이라 기존 도구와 바로 호환되는 점도 실용적입니다. - SuperGemma4 - 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델
Gemma 4 26B를 애플 실리콘 MLX에 맞게 4비트 양자화하고 비검열 처리한 커뮤니티 모델입니다. 13GB 크기로 원본 대비 퀵벤치 점수가 91.4→95.8로 올라갔고, 코드 생성(98.6점), 한국어 프롬프트(95.0점) 모두 원본보다 안정적이라는 점이 눈에 띕니다. Ollama용 GGUF 버전도 있고,
mlx_lm.server한 줄로 OpenAI 호환 서버가 뜨니 로컬 에이전트 파이프라인에 바로 투입하기 좋습니다. - 데이터베이스가 정말 필요한가
"모든 DB는 결국 파일 시스템 위의 파일"이라는 전제에서 출발해, Go/Bun/Rust로 파일 스캔·인메모리 맵·디스크 이진 탐색·SQLite 네 가지 방식을 직접 벤치마크한 글입니다. 댓글이 20개 넘게 달릴 만큼 의견이 분분한데, 핵심 메시지는 의외로 단순합니다. 초기 제품이라면 SQLite 하나로도 충분히 멀리 갈 수 있고, 조인·동시 쓰기·트랜잭션이 본격적으로 필요해지는 시점에 DB를 도입해도 늦지 않다는 것입니다. 위의 "$20 스택" 글과도 통하는 린한 시작에 관한 좋은 참고자료입니다.
- AI 코딩 시대, 성장이 멈추는 개발자의 뇌에서 일어나는 일
AI가 코드를 대신 써주면 왜 개발자의 성장이 멈추는지를, 인지과학 연구를 근거로 풀어낸 국내 개발자의 글입니다. 핵심은 "뇌는 편하면 기억하지 않는다" 는 것인데, Bjork의 '바람직한 어려움' 이론과 인출 연습 실험 결과를 코딩 학습에 대입한 논증이 꽤 설득력 있습니다. 특히 숙련자일수록 신경 효율성 때문에 AI 출력을 읽는 것만으로는 뇌에 부하가 거의 걸리지 않는다는 지적이 인상적입니다. 위의 ThoughtWorks Radar에서 언급한 "코드베이스 인지 부채" 와도 정확히 맞닿는 글이니 함께 읽어보시길 권합니다.
- 로컬 LLM 생태계에는 Ollama가 필요하지 않다
로컬 LLM 입문의 사실상 표준이었던 Ollama에 대한 꽤 신랄한 비판글입니다. 핵심 엔진인 llama.cpp의 크레딧을 오랫동안 누락한 점, 자체 ggml 백엔드로 전환하면서 성능이 오히려 떨어진 점, DeepSeek-R1 축소 모델을 원본과 같은 이름으로 표기해 사용자를 오도한 점 등을 구체적으로 지적합니다. 위에서 소개한 Gemma 4 로컬 실행기에서도 Ollama의 스트리밍 버그 때문에 llama.cpp로 전환한 사례가 나왔는데, 로컬 LLM을 본격적으로 쓰신다면 llama.cpp 직접 사용이나 LM Studio 같은 대안도 함께 검토해보시길 권합니다.
- openai-oauth - ChatGPT 계정으로 OpenAI API를 무료로 사용하기
ChatGPT 계정의 OAuth 토큰을 활용해 별도 API 크레딧 없이 OpenAI API를 쓸 수 있게 해주는 비공식 오픈소스입니다.
npx openai-oauth한 줄로 로컬 프록시가 뜨고, Codex CLI가 내부적으로 사용하는 특수 엔드포인트를 그대로 활용하는 구조입니다. OpenAI가 OpenClaw를 인수한 만큼 개인 용도까지 막지는 않을 거라는 기대가 있지만, 비공식 프로젝트인 만큼 계정 정지 가능성은 감안하셔야 합니다. 호기심에 한번 살펴볼 만하되, 사용은 본인 책임하에. - Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All
알리바바 Qwen 팀이 공개한 MoE 모델로, 총 파라미터 350억 개 중 활성 파라미터는 30억 개뿐인데 SWE-bench Verified 73.4점 등 에이전틱 코딩 벤치마크에서 27B Dense 모델을 능가합니다. 멀티모달까지 지원하면서 Claude Code, OpenClaw 등과 바로 연동되고 Anthropic API 프로토콜도 호환하는 점이 실용적입니다. 위에서 소개한 Gemma 4 로컬 실행이나 SuperGemma4와 함께 놓고 보면, 로컬에서 돌릴 수 있는 에이전틱 코딩 모델의 선택지가 빠르게 넓어지고 있다는 걸 체감하게 됩니다.
- pi-autoresearch: Karpathy의 "AI 자율 실험" 아이디어를 범용화한 오픈소스
Karpathy의 Autoresearch가 "AI에게 LLM 훈련 코드를 주고 밤새 실험을 반복시킨다"는 아이디어였다면, 이 프로젝트는 그 컨셉을 테스트 속도, 번들 사이즈, Lighthouse 점수 등 측정 가능한 모든 최적화 문제로 일반화한 것입니다. 특히 실험 로그와 요약을 파일로 보존해서 컨텍스트가 리셋되어도 새 에이전트가 바로 이어받는 구조, 그리고 MAD 기반으로 노이즈와 진짜 개선을 구분하는 설계가 실용적입니다. "아이디어 시도 → 측정 → 개선되면 유지, 아니면 폐기"를 무한 반복하는 패턴에 관심 있다면 한번 살펴보시길 권합니다.
- 애자일에 작별을 고하며
댓글이 20개가 넘게 달릴 만큼 의견이 갈리는 글입니다. 애자일이 혁신이라 주장해온 반복적 개발, 고객 참여 같은 개념이 사실은 1970년대 논문에 이미 다 있었다는 점을 짚으면서, LLM 시대에는 오히려 "포괄적 문서가 작동하는 소프트웨어를 만든다" 는 방향으로 전환되고 있다고 주장합니다. 애자일에 대한 동의 여부와 별개로, 코딩 에이전트에게 일을 시키려면 결국 명확한 스펙 문서가 필요해진다는 관찰은 실무적으로 꽤 와닿습니다.
- pip install torch 한 줄로 끝낸다 — Python 패키징의 오랜 숙제, 드디어 풀리나
pip install torch가 왜 그렇게 복잡하고 거대한지, 그 근본 원인을 파고든 이야기입니다. 현재 Python 휠은 2009년 수준의 CPU 명령어만 기준으로 빌드되어 최신 하드웨어 성능을 전혀 활용하지 못하는데, NVIDIA·Astral(uv개발사)·Quansight(NumPy/SciPy 메인테이너)가 연합해 Wheel Next라는 차세대 패키징 표준을 추진 중입니다. 패키지가 필요한 하드웨어를 선언하고 인스톨러가 자동으로 맞는 빌드를 골라주는 구조인데, 실현되면 PyTorch 900MB 휠 같은 악몽이 끝날 수 있습니다. Python으로 ML/데이터 작업을 하는 분이라면 관심 가져볼 만한 흐름입니다. - OpenHarness - 개인 에이전트 Ohmo를 내장한 오픈 에이전트 하네스
LLM을 감싸서 실제 에이전트로 만드는 오픈소스 하네스입니다. 43개 내장 도구, claude-code 플러그인 호환, anthropics/skills 호환 스킬 시스템까지 갖춰서 기존 Claude Code나 Codex 구독 그대로 쓰면서 Slack·Discord·Telegram에서 대화하며 PR까지 올리는 워크플로우를 만들 수 있습니다. 지난 위클리에 이어, 이번 ThoughtWorks Radar에서도 핵심 테마로 꼽은 "코딩 에이전트 하네스" 가 구체적으로 어떤 모습인지 궁금하신 분들에게 좋은 참고 사례입니다.
- 구글, "백버튼 하이재킹"을 스팸으로 지정
뒤로 가기 버튼을 누르면 광고나 엉뚱한 페이지로 보내버리는 "백버튼 하이재킹" 을 구글이 공식 스팸 정책 위반으로 지정했습니다. 6월 15일부터 시행되며, 위반 시 수동 조치나 자동 순위 강등이 적용됩니다. 직접 구현하지 않았더라도 외부 광고 스크립트나 서드파티 라이브러리에서 발생할 수 있으니, 사이트를 운영하고 계신 분들은 미리 점검해두시길 권합니다.
- Anthropic, Claude Design 공개
Anthropic이 공개한 시각 디자인 도구로, 텍스트 설명만으로 프로토타입, 슬라이드, 마케팅 자료 등을 생성하고 Claude와 함께 다듬을 수 있습니다. 특히 온보딩 시 팀의 코드베이스와 디자인 파일을 읽어 디자인 시스템을 자동 구축하고 이후 모든 프로젝트에 일관 적용하는 점, 그리고 완성된 결과물을 Claude Code 핸드오프 번들로 바로 넘겨 구현까지 연결하는 워크플로우가 눈에 띕니다. 디자이너가 아닌 창업자, PM, 마케터에게 특히 유용할 것으로 보이는데요. 역시나 Figma 주가가 가장 먼저 반응하네요.
- 바이브 코딩으로 만든 환자 관리 앱의 보안 참사
의료기관 직원이 AI 코딩 에이전트로 환자 관리 시스템을 직접 만들었는데, 결과물이 접근 제어 없는 단일 HTML 파일이라 환자 데이터가 암호화 없이 인터넷에 그대로 노출된 사례입니다. 진료 대화 녹음까지 미국 AI 서비스로 전송되고 있었고, 작성자가 30분 만에 전체 데이터에 읽기·쓰기 권한을 확보했다고 합니다. 실제로 비일비재하게 일어나고 있어서, 주의가 필요합니다.
- Zerobox - OpenAI Codex 런타임 기반의 경량 크로스 플랫폼 프로세스 샌드박싱 도구
OpenAI Codex의 샌드박스 런타임을 독립 도구로 뽑아낸 프로젝트입니다. deny-by-default 정책으로 파일 쓰기·네트워크·환경변수 접근을 모두 차단한 뒤 필요한 것만 화이트리스트로 여는 구조라, AI가 생성한 코드를 돌려도
~/.ssh나~/.aws가 털릴 걱정이 없습니다. Docker 없이 단일 바이너리로 약 10ms 오버헤드면 실용적이라고 생각되네요. - 거의 모든 것을 위한 Codex
OpenAI Codex 앱이 대규모 업데이트되면서, 코딩 에이전트를 넘어 소프트웨어 개발 전 과정을 하나의 워크스페이스에서 처리하는 방향으로 확장되었습니다. 특히 사용자 컴퓨터를 직접 클릭·입력·탐색하는 백그라운드 컴퓨터 제어, 90개 이상의 플러그인(JIRA, GitLab, CircleCI 등), 그리고 스스로 향후 작업을 스케줄링해 수일~수주간 장기 작업을 이어가는 자동화 기능이 눈에 띕니다. 위에서 소개한 Claude Code vs Codex 비교 글과 함께 읽으면, Codex가 어떤 방향으로 차별화하려는지가 더 선명해집니다. 전 요즘 메인도구가 Codex라 대환영 업데이트 입니다.
- Claude Code Routines 공개
Claude Code에 클라우드 기반 자동화 기능이 추가되었습니다. 스케줄, API 호출, GitHub 이벤트를 트리거로 걸어두면 노트북이 꺼져 있어도 Anthropic 인프라에서 자동 실행됩니다. 매일 밤 이슈 트래커 정리, PR 생성 시 자동 코드 리뷰, 배포 후 스모크 테스트 같은 반복 워크플로우를 에이전트에게 통째로 위임할 수 있는 구조인데요. 바로 위의 Codex 업데이트와 함께 보면, 코딩 에이전트 경쟁이 "한 번 쓰는 도구"에서 "항시 돌아가는 자동화 인프라" 로 이동하고 있다는 걸 느끼게 됩니다.
- Gemma Gem - 브라우저에서 Google Gemma 4 모델을 완전 온디바이스로 실행하는 Chrome 확장
Gemma 4를 WebGPU로 브라우저 안에서 완전히 로컬 실행하는 Chrome 확장입니다. API 키도, 클라우드 전송도 없이 페이지 읽기, 클릭, 폼 입력, JavaScript 실행까지 하는 온디바이스 에이전트를 500MB~1.5GB 모델 하나로 구현한 점이 인상적입니다. 이번 주에 소개한 Gemma 4 로컬 실행, SuperGemma4, Qwen3.6까지 이어지는 흐름을 보면, "내 기기 안에서 돌아가는 AI 에이전트" 가 실험 단계를 넘어 실사용 가능한 영역에 빠르게 진입하고 있습니다.
- 우리가 좋아하는 모든 것은 심리전(psyop)인가?
인디 밴드 Geese의 폭발적 인기가 사실은 마케팅 회사가 수천 개의 가짜 계정으로 만들어낸 인위적 트렌드였다는 보도에서 출발하는 글입니다. TikTok에서 영상이 단독으로 소비되는 구조 탓에 조직적 프로모션을 알아차리기 어렵고, 이제 댓글 조작과 서사 캠페인까지 자동화되면서 "내가 좋아하는 것이 정말 내 선택인가" 라는 질문을 던집니다. 기술 글은 아니지만, AI와 자동화가 여론 형성에 어떻게 쓰이는지에 관심 있는 분이라면 읽어볼 만합니다.
- Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나
커뮤니티에서 양자화한 Qwen3.5 MLX 모델들이 왜 도구 호출 오류와 환각을 보이는지, Unsloth가 150개 이상의 벤치마크로 원인을 규명한 글입니다. 핵심은 모든 레이어에 같은 비트 수를 적용하는 균일 양자화가 문제인데, 특정 선형 어텐션 레이어의 정보 손실 민감도가 출력 레이어 대비 약 120배에 달하기 때문입니다. 위에서 소개한 SuperGemma4나 Gemma 4 로컬 실행처럼 양자화 모델을 실무에 쓰려는 분이라면, 배포자의 양자화 방식과 보정 데이터를 반드시 확인해야 한다는 실용적 교훈을 얻을 수 있습니다.
- Current — 읽지 않은 글의 죄책감 없이 흘러가는 RSS 리더
RSS 리더의 고질적인 "읽지 않은 글 999+" 죄책감을 구조적으로 없앤 앱입니다. 각 소스에 반감기(half-life) 를 설정해 속보는 3시간, 에세이는 1주일간 머무르다 자연스럽게 사라지게 한 설계가 핵심인데, 다작 피드가 나머지를 매몰시키는 문제를 깔끔하게 해결합니다. "읽음 처리" 대신 카드를 "놓아주기(Release)" 하는 물리 기반 인터랙션과 온디바이스 AI 주제 분석까지, 정보 과잉 시대에 RSS를 다시 쓰고 싶게 만드는 설계 철학이 돋보입니다.
- 프런티어의 종말
Anthropic의 Mythos 발표를 계기로, 프런티어 AI 모델에 대한 접근 독점이 인터넷 초기의 개방성을 종식시키고 있다는 비판적 에세이입니다. 인류 전체의 데이터로 학습된 모델을 소수 기업이 독점하는 구조를 "식민지적 가치 추출" 에 비유하면서도, 오픈소스 모델이 이미 3~12개월 격차로 따라잡고 있다는 점에서 개인용 컴퓨팅 시대로의 전환 가능성도 함께 제시합니다. 이번 주에 소개한 Gemma 4, Qwen3.6, SuperGemma4 같은 오픈소스 모델들의 약진을 보면, 이 글의 희망적 전망이 단순한 낙관만은 아니라는 걸 느끼게 됩니다.
- claude opus 4.7을 소개합니다
Anthropic이 Claude Opus 4.7을 출시했습니다. Mythos와는 별개로, 기존 Opus 라인의 점진적 개선 모델인데요. 주목할 점은 사이버 보안 기능을 단계적으로 낮춰가며 테스트한 첫 번째 모델이라는 것입니다. 위험도 높은 사이버 보안 요청을 자동 감지·차단하는 보안 기능이 탑재되었고, 합법적 보안 연구 목적이라면 사이버 검증 프로그램을 통해 별도 접근이 가능합니다. 가격은 Opus 4.6과 동일하며, 이번 주 함께 소개한 Claude Design과 Claude Code Routines도 이 모델 기반으로 동작합니다.
- Agents SDK의 차세대 진화
OpenAI가 Agents SDK를 대폭 업데이트했습니다. MCP, skills, AGENTS.md, shell, apply patch 같은 에이전트 시스템의 핵심 프리미티브를 하나의 하니스로 통합하고, Cloudflare·E2B·Vercel 등 다양한 샌드박스 제공업체를 네이티브로 지원합니다. 특히 하니스와 컴퓨팅 환경을 분리해서 프롬프트 인젝션 방어와 자격 증명 격리를 구조적으로 해결한 점이 눈에 띕니다. 위에서 소개한 Zerobox(Codex 샌드박스 추출), OpenHarness, 바이브 코딩 보안 참사까지 이번 주 글들을 관통하는 키워드가 결국 "에이전트에게 얼마나, 어떻게 권한을 줄 것인가" 임을 다시 한번 확인하게 됩니다.
- IPv6 트래픽이 50%를 돌파
Google 서비스 접속 기준으로 전 세계 IPv6 트래픽이 처음으로 50%를 넘었습니다. 프랑스 86%, 인도 75% 같은 선두 국가가 있는 반면, 한국은 약 21% 수준으로 아직 갈 길이 멉니다. 긱뉴스 자체 로그를 분석해봐도 IPv6 사용자가 18~20%로 구글 통계와 거의 일치하네요. 30년 가까이 "곧 전환된다"고 했던 IPv6가 드디어 과반을 넘긴 상징적 이정표입니다.
- 몇 달 동안 손으로 코딩하는 중이에요
AI 에이전트를 만들던 개발자가 오히려 LLM 없이 손으로만 코딩하는 3개월 리트릿에 참여한 이야기입니다. 코딩 에이전트를 쓰면 원하는 것을 빠르게 얻지만, 직접 코드를 쓸 때는 "작성하면서 동시에 학습하는" 두 가지가 함께 일어난다는 관찰이 핵심입니다. 위에서 소개한 "AI 코딩 시대, 성장이 멈추는 개발자의 뇌" 글이 인지과학으로 같은 문제를 분석했다면, 이 글은 현장 개발자의 체감으로 같은 결론에 도달합니다. AI를 가장 잘 활용하는 사람이 결국 깊은 기초 역량을 갖춘 사람이라는 점이 인상적입니다.
✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Dooray!봇, Discord봇, 구글 챗 봇, Swit 봇
✓ 긱뉴스를 트위터에서 구독 하거나 RSS로도 구독 가능 합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.