14P by GN⁺ 2일전 | ★ favorite | 댓글 1개
  • 여러 무료 웹 AI 모델을 병행해 문제 해결과 코드 생성을 분리하고, 모델별 강점을 살리는 하이브리드 전략 활용
  • AI Code Prep GUI로 필요한 코드만 선별·정리해 불필요한 맥락으로 인한 성능 저하 방지, 핵심 컨텍스트만 AI에 제공
  • 기획·디버깅은 고성능/무료 모델(Gemini 2.5 Pro, o3, o4-mini, Claude 4 등)로, 실행·코드 작성GPT-4.1·Claude 3.5로 수행
  • OpenAI 데이터 공유, GitHub Copilot, Poe.com, OpenRouter 등으로 무료·저렴한 토큰 확보해 비용 최소화
  • Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE 등 다양한 에이전트·CLI 도구를 상황별로 조합해 작업 효율 향상

My Browser Setup: The Free AI Buffet

  • 브라우저에 다양한 강력한 AI 모델의 무료 버전을 여러 탭으로 열어 두고 사용함
  • 한 가지 모델에만 의존하지 않고, 여러 관점에서 답변을 얻는 방식임. 대표적으로 사용하는 무료 모델 조합은 다음과 같음.
  • GLM 4.5: 웹에서 무료로 사용 가능하며, 체감상 Claude 4 수준 또는 그 이상으로 성능이 좋음. 항상 2~3개의 탭을 열어둠
  • Kimi K2: Claude 또는 Opus 계열과 유사한 모델로, 웹에서 무료로 이용 가능. 보통 1~2개 탭을 열며, GLM 4.5 등장 전에는 하루에도 여러 번 까다로운 버그를 해결해줌
  • Qwen3 Coder 및 신형 모델들: 다양한 코딩 특화 모델 테스트용으로 사용
  • OpenAI Playground: GPT-4.5, o3 등 다양한 모델을 무료로 활용 가능. 계정 데이터 설정에서 "OpenAI가 데이터를 모델 학습에 사용"하도록 허용하면 무료 토큰이 지급됨
  • Google Gemini AI Studio: Gemini 2.5 Pro/Flash 모델을 무료·무제한에 가깝게 사용 가능. 보통 1~3개의 탭을 열어둠
  • Google Gemini 2.5 Pro: AI Studio와는 별개 서비스로, 이미지 생성과 심층 연구 기능이 더 뛰어남. AI Studio와 함께 탭을 병행 사용
  • Poe.com: Claude 4나 o4-mini 등 프리미엄 모델에 대해 일일 무료 크레딧 제공
  • OpenRouter: 무료 및 유료 모델 혼합 사용 가능. 여러 모델을 각각 다른 탭에 세팅해둠
  • ChatGPT: 무료 버전도 여전히 유용해 최소 1개 탭 유지
  • Perplexity AI: 리서치 중심 질문에 강점
  • Deepseek: v3와 r1 모델 무료 제공. 단, 컨텍스트 제한 주의
  • Grok.com: 일반적 사용과 심층 연구, 이미지 편집에 무제한 무료 제공. 특히 심층 연구 기능이 Perplexity와 유사해 유용
  • Phind: 답변 시 플로우차트나 다이어그램을 함께 제공하려는 시도를 함
  • lmarena.ai: Claude Opus 4와 Sonnet 4를 무료로 제공. Opus 4 무료 사용은 상당히 가치가 높음

Claude.ai 자체도 무료지만, 사용 제한이 잦아 불편할 수 있어 Cody 확장이나 Copilot 등을 통해 다른 접근 방식을 사용함.

주의 사항 – Grok 사용 시
Grok은 무료 연산과 검열되지 않은 이미지 생성을 제공하여 다른 모델의 안전 시스템이 방해될 때 유용할 수 있음. 그러나 운영자가 나치 연관 사상이나 허위정보를 홍보하려는 의도를 가질 가능성이 있다는 보고가 있음. 특히 아프리카 집단 학살 등 역사적 사건에 대해 거짓 정보를 제공하도록 지시받았다는 주장도 있음. 이러한 왜곡은 주로 X 플랫폼에서 나타나지만, 코딩 같은 안전한 용도에만 제한적으로 활용하거나, 잠재적 편향을 염두에 두고 사용하는 것이 권장됨.

A smarter, cheaper workflow: Focused Context

  • 웹 기반 AI 채팅 인터페이스(AI Studio, ChatGPT, OpenRouter 등)를 사용할 때, IDE나 에이전트 프레임워크(Cline, Trae, Copilot 등)보다 문제 해결이나 솔루션 제안이 더 뛰어난 경우가 많음
  • Cursor, Cline, Roo Code와 같은 도구로 모든 작업을 처리하면, MCP 서버 사용법이나 파일 편집 절차 등 문제와 직접 관련 없는 대량의 텍스트를 AI에 전송하게 되어, AI가 혼란스러워지고 성능이 떨어짐
  • 이로 인해 최고가 모델을 사용하더라도 불필요한 정보로 인한 ‘둔화 효과’를 극복하지 못함
  • 그래서, 문제 해결에 필요한 정확한 컨텍스트를 직접 생성해 웹 기반 AI 채팅에 붙여넣고 질문하거나 코드 리뷰를 요청하는 방식으로 접근함
  • 해결책이 나오면, 해당 내용을 Cline 등의 에이전트용 프롬프트로 작성해 파일 편집만 맡김
  • 이렇게 하면 GPT-4.1(무제한 사용 가능)을 활용해 저렴하게 문제 해결과 기획이 가능하며, 굳이 Claude 크레딧을 소모할 필요가 없음
  • 어려운 문제 해결에는 Claude를, 실행에는 웹 채팅 AI를 병행해 효율성을 높임
  • How AI Code Prep Helps (Example Prompt Structure)

    예시 프롬프트:

    Can you help me figure out why my program does x instead of y?  
    
    • AI Code Prep GUI 는 프로젝트 폴더를 재귀적으로 스캔하여 하위 폴더·파일까지 모두 탐색 후, AI가 보기 좋은 형식으로 코드와 질문을 정리함
    • 생성된 컨텍스트 예시:
    Can you help me figure out why my program does x instead of y?  
    
    fileName.js: <code>  
    ... 파일 내용 ... </code>  
    
    nextFile.py: <code>  
    import example  
    ... 기타 내용 ... </code>  
    
    Can you help me figure out why my program does x instead of y?  
    
    • 질문을 두 번 반복(상단/하단/양쪽 선택 가능)해 AI가 포커스를 유지하도록 함
    • Windows에서는 프로젝트 폴더 내부에서 마우스 우클릭 → "AI Code Prep GUI" 실행 → 자동으로 코드 파일을 선택하며, node_modules, .git 등 불필요한 디렉토리는 자동 제외
    • 선택이 완벽하지 않아도 체크박스를 통해 쉽게 조정 가능
    • 대규모 프로젝트로 AI 컨텍스트 한도를 초과할 때, 꼭 필요한 파일만 선별해 제공 가능
  • 왜 이 방식이 중요한가?

    • Cline, GitHub Copilot, Cursor, Windsurf 등 많은 코드 에이전트는 컨텍스트를 너무 많이 보내거나 너무 적게 보내서 비효율적
    • 직접 파일을 선별하면, 불필요한 데이터 없이 필요한 정보만 AI에 제공 가능
    • GUI 기반이라 CLI나 공개 GitHub 링크를 요구하는 다른 컨텍스트 생성 도구보다 개인 코드 보안 유지편리성이 뛰어남
    • 최신 기능 업데이트는 wuu73.org/aicp 참고

Model Strategy: Picking the Right Brain for the Job

  • 많은 강력한 AI 모델들이 웹 인터페이스를 통해 무료로 제공되므로(Gemini in AI Studio, Grok, Deepseek 등), 이를 우선적으로 활용함
  • Poe.com은 Claude 및 새로운 o4 시리즈 같은 최상위 모델에 대해 무료 일일 크레딧을 제공
  • Gemini 2.5 Pro (AI Studio 제공)는 디버깅, 기획, 전반적인 작업에서 매우 뛰어나 현재 가장 다재다능한 모델로 평가됨
  • 까다로운 문제에는 o4-mini(OpenRouter 또는 Poe에서 사용 가능)를 시도
    • 이전 최상위 모델(Claude 3.5/3.7/4)보다 API 사용 시 비용이 훨씬 저렴
    • 해결이 어려웠던 버그를 즉시 해결한 경험이 있음
  • Claude 3.7 또는 4Poe, API(OpenRouter), GitHub Copilot Chat 등을 통해 접근 가능
    • 무료 사용량이 일부 제공되지만, 잦은 사용에는 비용 부담이 큼
    • 3.7/4는 창의적이고 폭발적인 출력(‘Hunter S. Thompson’ 스타일)을 제공하지만, 실제 코딩은 차분한 Claude 3.5에 맡기는 것이 효율적일 수 있음
  • OpenAI Playground 무료 토큰 활용법

    • OpenAI 계정의 데이터 공유 설정을 활성화하면 매일 대량의 무료 토큰을 사용 가능
    • OpenAI Playground → 우측 상단 설정 아이콘 → 왼쪽 메뉴 Data ControlsSharing에서 "Share inputs and outputs with OpenAI" 를 활성화하면 다음 혜택 제공:
    • 하루 최대 25만 토큰: gpt-5, gpt-4.1, gpt-4o, o1, o3
    • 하루 최대 250만 토큰: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
    • 이 설정을 활용하면 o3GPT-4.5 같은 최상위 모델을 무료로 다량 사용 가능
    • OpenAI Playground에서 o3o4-mini를 나란히 실행해 비교하면서 각 모델의 강점과 용도를 파악할 수 있음.
  • 추천 모델별 사용 전략

    • Gemini 2.5 Pro: 디버깅, 기획, 전반적인 코딩 작업에서 최우선
    • o4-mini: 까다로운 버그 해결, 비용 효율 우수
    • Claude 4 / 3.7: 긴급하고 어려운 문제 해결에 최적, 다만 접근성·비용이 제한적
    • Claude 3.5: 3.7/4의 창의적 산출물을 정제하거나 실제 코드 작성에 적합
    • o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: 복잡한 문제 해결 능력이 매우 뛰어나며, 무료 토큰 설정 활용 시 대량 사용 가능

The Hybrid Approach: Premium Planning + Budget Execution

  • 다양한 모델을 테스트한 결과, 품질과 비용 효율을 모두 극대화할 수 있는 하이브리드 전략을 개발함
  • 핵심 인사이트는 모델마다 개발 과정의 특정 단계에서 강점이 다르다는 점

"스마트 주스(Smart Juice)" 이론 – AI가 멍청해지는 이유
모델이 받을 수 있는 ‘지능 에너지’는 한정돼 있음.
간결하고 집중된 프롬프트를 보내면 그 에너지의 거의 100%가 문제 해결에 사용됨.
하지만 불필요하게 복잡한 입력(툴 사용법 장문 설명, 문제와 무관한 맥락, 수 페이지의 코드 등)을 보내면 상당 부분이 이를 처리하는 데 소모돼, 실제 문제 해결에 쓸 ‘지능’이 줄어듦.

예: Cursor, Cline 같은 IDE 연동형 에이전트는 질문 전에 수많은 지시문과 컨텍스트를 보내므로 모델의 집중도가 떨어짐.
따라서 불필요한 맥락을 줄이고, 문제 해결에 필요한 핵심만 보내는 것이 최적의 결과를 내는 방법임.

  • 새 프로젝트 시작 시 워크플로우

    • 1. Plan & Brainstorm
      • 스마트하고 무료인 웹 모델(Gemini 2.5, o4-mini, Claude 3.7/4, o3 등)로 접근 방식 설계, 단계별 계획 수립, 필요한 라이브러리 식별.
    • 2. Generate Agent Prompt
      • 위 모델 중 하나에 요청:
        "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [작업 설명]"
      • 생성된 프롬프트를 ChatGPT 같은 재작성에 능한 무료 AI로 한 번 더 다듬음.
    • 3. Execute with Cline
      • 다듬은 프롬프트를 Cline에 붙여넣고, GPT 4.1 또는 Claude 3.5(복잡한 작업일 경우 Claude 4)로 실행.
      • GPT 4.1 계열은 지시사항 준수 훈련이 잘 돼 있음.
    • 4. Fallback
      • GPT 4.1이 실패하면 API를 통해 Claude 3.5로 전환.
      • Deepseek v3 또는 R1도 지시사항 수행에 매우 강함.
  • 핵심 전략

    • 비싸고 스마트한 모델(또는 무료로 사용 가능한 Gemini 2.5 Pro)로 전략과 설계 단계 진행.
    • 계획을 2~3개의 다른 무료 모델(Deepseek R1, Poe의 Claude 등)에 붙여넣어 검증:
      "Is this good? Can you improve it or find flaws?"
    • 코딩·실행 단계는 안정적이고 효율적인 모델(GPT 4.1, Claude 3.5)을 Cline에서 사용.
  • 모델별 활용 팁

    • o4-mini
      • 복잡한 코드 로직 해석, 프레임워크·라이브러리 선택 등 고레벨 구현 전략에 강함.
    • 아이디어 브레인스토밍
      • Gemini 2.5, o4-mini, GPT 4.1, ChatGPT, o3-mini(duck.ai에서 종종 무료), Phind 등을 활용.
    • 해결 불가 시
      • 무료/저가 모델에서 해결 실패하면 API로 고급·유료 모델로 escalatation.

Alternative Agents & Setups

  • Trae.ai (Bytedance, TikTok 제작사)
    • VS Code 호환 IDE, 무료 AI 사용 제공: Claude 4, Claude 3.7, Claude 3.5, GPT 4.1 포함.
    • 내장 에이전트 성능은 Cline보다 떨어짐(솔직히 Cline이 최강).
    • VS Code 클론 형태라 Cline 확장 설치 가능할 것으로 보임.
    • 하지만 서버 과부하로 속도 느림 → 무료 사용 실효성 낮음.
    • 그래도 무료 모델 접근성이 있어 언급.
  • 추천 세팅 2가지

    • 1. VS Code + Cline + Copilot
      • Copilot 월 $10 구독 → Cline에서 저렴하게 강력 모델 API 사용 가능.
      • 무료 티어도 일부 기본 기능 가능.
    • 2. Trae.ai + Cline
      • Trae의 무료 모델 접근 + Cline API 키 사용 병행 가능 여부 테스트.

    : Copilot 기본 에이전트가 Cline이 잘 못하는 문제를 해결하는 경우도 있고, 반대도 있음.
    Cline이 과도하게 긴 프롬프트를 보내 성능이 떨어질 수 있음 → Copilot이 유리한 경우 존재.

  • Roo Code: Cline의 클론

    • Roo Code는 Cline과 거의 동일하지만 일부 다른 기능 제공.
    • 프로젝트나 코딩 스타일에 따라 Roo Code가 더 나을 수 있음.
    • Cline 자체는 무료지만 API 호출 요금 발생.
    • 가장 경제적인 방법: VS Code LM API 설정 + Copilot 월 $10 구독 → 거의 무제한 강력 모델 사용.
  • 신규 CLI 툴: Claude Code, Qwen Code, Gemini CLI

    • 최근 CLI 기반 코딩 툴 관심 급증.
    • Claude Code: 서브에이전트(subagent) 지원 → 하나의 작업만 수행, 추가 도구 사용 안 함.
      • 이 가이드에서 설명한 ‘스마트 주스’ 집중형 워크플로우를 재현 가능.
      • 불필요한 에이전트 지시문(bloat) 제거, 효율성 유지.
    • Qwen Code, Gemini CLI도 각각 장점 존재.
    • Claude Code를 GLM 4.5로 사용하는 설정 가이드가 z.ai 사이트에 있음.
    • 각 CLI 툴은 서로 다른 강점이 있어, 가이드·커뮤니티 팁 참고해 실험 추천.

TL;DR: Quickstart Guide

  • Models & Roles
    • Planning & Brainstorming
      GLM 4.5, Kimi K2, 최신 Qwen3 Coder & 2507 시리즈, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), OpenAI Playground에서 하루 25만 무료 토큰(o3, GPT-5) 사용 추천
    • Problem Solving & Debugging
      GPT-5(Playground 무료 토큰), GLM-4.5(Claude 4 수준의 성능), Claude 4(Poe 무료 일일 토큰)
    • Actual Coding
      GPT-4.1(Cline), 실패 시 Claude 3.5 대체, 또는 Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2 사용
  • Key Tools
    • VS Code
    • AI Code Prep GUI – 로컬에서 필요한 파일만 스캔·선별, AI 컨텍스트 최적화
    • Cline (VS Code 에이전트) – 단계별 코드 실행
    • 무료 웹 챗 – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai
  • Quick Workflow
    1. AI Code Prep GUI로 프로젝트 관련 파일 번들링
    2. 해당 컨텍스트를 선호하는 웹 챗 모델에 붙여넣어 계획·디버깅
    3. 한 모델에 "이 작업을 위한 상세 Cline 프롬프트 작성" 요청 후 ChatGPT 등에서 재정제
    4. 완성된 프롬프트를 GPT-4.1로 설정한 Cline에 붙여넣어 코드 생성·수정
      → 실패 시 Claude 3.5로 전환
  • Cost-Saving Hacks
    • OpenAI Playground “데이터 공유” 활성화 → 하루 25만 무료 토큰(GPT-4.5, o3) + 하루 250만 무료 토큰(o4-mini, o3-mini)
    • GitHub Copilot 월 $10 구독 → Cline에서 Claude 모델 제한적 사용 가능
    • OpenRouter 종량제 → o4-mini, Claude 3.7 등 최신 모델 저렴하게 사용

Some Thoughts

  • AI는 놀라운 생산성 증폭기이지만, 마법 지팡이는 아닙니다.
  • 진정한 마법은 여러분의 호기심, 끈기, 그리고 실험하려는 의지가 이 강력한 도구들과 결합될 때 일어납니다.
  • 버그나 문제로 좌절하지 마세요 — 모든 도전은 새로운 것을 배울 기회입니다.
  • 모델을 섞어 쓰고, 대담한 아이디어를 시도하며, 부수고 다시 만드는 것을 두려워하지 마세요.
  • 최고의 개발자는 결코 막히지 않는 사람이 아니라, 막혀도 계속 앞으로 나아가며 모든 도구와 기술을 활용하는 사람입니다.
  • 혼돈을 받아들이고, 과정을 즐기며, 여러분의 창의성이 길을 이끌도록 하세요!

Latest Model Updates (Aug 2025)

💰 Budget-Conscious: Getting Max Value

  • GPT 4.5

    • Status: Discontinued
  • o3

    • 능력: Claude 4에 필적하는 성능, 어려운 문제 해결에 탁월, 천재급
    • 활용 팁: AI Code Prep GUI로 전체 코드베이스를 넣어 분석 가능
    • Free Tokens: Data Controls/Sharing settings에서 데이터 공유 활성화 시 250k 토큰/일
  • o4-mini

    • 능력: o3보다는 약간 떨어지지만 매우 뛰어난 성능, 마치 o3의 동생 같은 모델
    • Free Tokens: 데이터 공유 활성화 시 2.5M 토큰/일
  • Gemini 2.5 Pro

    • 이용: AI Studio에서 무료
    • 특화: 복잡한 디버깅, 아키텍처 설계 및 계획
  • Deepseek R1 0528

    • 능력: 향상된 추론 성능을 갖춘 매우 똑똑한 모델
    • 이용: Deepseek 웹 인터페이스에서 무료 사용 가능

🚀 Premium: Fix Problems NOW

  • Claude 4 Sonnet

    • 능력: 충분한 컨텍스트를 제공하면 대부분의 문제를 한 번에 해결
    • 특화: 글쓰기, 문제 해결 등 전반적으로 최고의 성능
    • 활용: 꼭 첫 시도에서 완벽히 해결해야 할 때
  • Claude 4 Opus

    • 가격: $75 / 1M 토큰
    • 성능: Sonnet보다 더 뛰어나다고 알려진 “매직 소스”급 성능
    • 활용: 궁극의 문제 해결이 필요할 때

Solid Worker Models

다음 모델들은 지시를 잘 따르고 안정적으로 작업을 수행함:

  • GPT 4.1

    • 상위 스마트 모델로 설계·문제 해결 후, 실제 코드 수정에 사용
    • 어디서든 받은 출력물을 그대로 Cline에 붙여서 실행 가능
  • Claude Sonnet 3.5

    • 코딩과 편집에 강점
    • 4.1보다 약간 느리지만 매우 안정적
  • Deepseek v3

    • 코드 작성·수정·에이전트 작업에 적합
    • 가격 대비 성능이 뛰어남
  • OpenRouter Free Models

    • OpenRouter에서 가격 필터를 $0로 설정해 무료 모델 탐색
    • 새로운 모델이 등장하면 실험할 가치 있음

Free Claude 4: lmarena.ai, and More

Claude Opus 4 and Sonnet 4
  • lmarena.ai에서 Claude Opus 4, Sonnet 4 등 무료 제공
  • 팁: Anthropic 계열 모델의 무료 사용 기회는 반드시 저장·기억·활용
  • 활용: 모든 것이 실패하거나, 즉시 완벽하게 작업을 완료해야 할 때 Claude 4 Sonnet 또는 Opus 선택

NEW!! Bad ass new Chinese models + GPT 5

  • GLM 4.5

    • 성능: Claude 4 Opus 또는 Sonnet과 유사
    • 특징: 에이전트 규칙 및 도구 사용을 거의 완벽하게 수행
    • 활용: 매우 어려운 버그 수정, 많은 컨텍스트를 요구하는 복잡한 작업 처리에 강함
  • Qwen3 Coder 480B

    • 평가: 강력하고 저렴해 선호도가 높은 모델
    • 활용: 고성능·저비용 환경에서의 코딩 작업
  • Qwen3 Instruct & Thinking 2507

    • 성능: Qwen3 Coder와 유사한 안정성과 강력함
    • 장점: 신뢰할 수 있고 비용 효율적
  • Kimi K2 (Moonshot)

    • 특징: Anthropic 기반 또는 Claude 유사 합성 데이터로 학습된 듯한 성격
    • 평가: 매우 뛰어난 성능, 자주 사용되는 모델
  • GPT 5

    • 제한점: 커스텀 툴 사용(MCP, Cline 등)에서는 강점이 적음
    • 추천 사용법:
      1. GPT 5, GLM 4.5 등 최고의 모델로 계획 수립·문제 해결
      2. 이후 간단한 에이전트 모델이 실제 편집과 툴 사용을 수행하도록 프롬프트 작성
    • 비교:
      • GPT 4.1은 여전히 비용 대비 가치가 뛰어남
      • 새로운 중국계 모델들은 커스텀 툴/Cline 사용에 강점
    • 총평: 아직 충분히 실험하진 않았지만, 모델마다 잘하는 분야가 다르며, 현재는 가격과 안정성 면에서 중국 모델들이 매우 매력적임

Current Coding Workflow (2025)

  • For New Projects:

    • 1. Planning Phase:
      • 모든 프로젝트 세부사항(언어, 라이브러리, 서버 등)을 노트패드에 기록
    • 2. Multi-Model Consultation:
      • 동일 내용을 여러 모델에 붙여넣어 ‘다중 의사 의견’ 얻기:
    • 3. Refinement:
      • 모델과의 반복 대화를 통해 세부사항 미세 조정
    • 4. Task Generation:
      • 모델에게 Cline AI 코딩 에이전트용 단계별 작업 리스트 작성 요청
    • 5. Execution:
      • Cline(또는 Roo Code)에서 GPT 4.1을 ‘act’ 모드로 설정해 작업 실행
  • For Problem Solving:

    • 복잡한 코드베이스 분석: GPT 4.5 + AI Code Prep 활용
    • GPT 4.5에 “Cline이 이 작업을 완료하도록 프롬프트를 작성해줘” 요청
    • 문제 복잡도에 따라 모델 선택
    • 다양한 모델을 활용해 다각적 해결 방안 모색
  • Task List & Test Driven Development (Coming Soon)

    Test Driven Development & Task Lists:
    • AI에게 Cline, Roo Code, Trae agent 실행용 상세 작업 리스트 작성 요청
    • Cline 또는 Roo Code가 마크다운 파일에 작업 진행 상황을 기록하고 완료 시 체크하도록 지시 가능
    • 이를 통해 진행 상황을 쉽게 추적하고 누락 방지 가능
    • 현재는 모델에게 마크다운 체크리스트를 생성하게 하고, Cline이나 Roo Code에 해당 파일을 업데이트하게 하는 방식으로 실험 가능
  • Money-Saving Hacks

    • GPT 4.5 & o3: 모델 학습 데이터 공유를 활성화하면 매일 25만 토큰 무료 제공
    • 저렴한 모델: o4-mini, 4.1-mini/nano에서 매일 250만 토큰 사용 가능
    • GitHub Copilot: 월 $10로 새로운 Claude 모델(속도 제한 있음) 사용 가능
    • Trae IDE: 현재 무료로 Claude 4와 GPT 4.1 사용 가능(구독 불필요, 제한 없음으로 보임)
    • Poe.com: 모든 모델에 대해 무료 일일 크레딧 제공
    • Web Interfaces: 무료 웹 채팅 인터페이스를 활용해 계획 수립 및 컨설팅
  • Coming Soon: Live Reddit Data & Insights

    Live Reddit Data Scraping & Daily Insights:
    • Reddit 데이터를 실시간 스크래핑해 매일 업데이트된 AI 모델 사용 사례 제공 예정
    • 세부 사용 분석, 데이터 시각화, 실제 코딩 워크플로우 및 트렌드에 대한 새로운 인사이트 포함
Hacker News 의견
  • 혹시 헷갈린 분들을 위해 말하자면, 본문에 2, 3페이지가 더 있고, 하단에 있는 화살표 아이콘을 통해 접근 가능함

  • 본문 작성자인데, 글꼴 문제는 미안함. 내용이 약간 오래된 편인데 AI 쪽은 워낙 빠르게 바뀌어서 최신 모델을 포함해 업데이트 예정임. 요즘 새 모델이 엄청 자주 나오고, 개인적으로 최근 가장 좋아하는 건 GLM-4.5임. Kimi K2도 괜찮고, Qwen3-Coder 480b나 2507 instruct도 상당히 좋음. 이런 모델들은 어떤 agentic 환경이나 agent tool에서 매우 잘 동작함 나만의 context helper 앱(https://wuu73.org/aicp)도 만들었는데, 이 링크에서 접근 가능함. 내가 주로 사용하는 수많은 AI 챗탭들과 IDE 사이를 왕복할 때 아주 편리함(거의 항상 무료고, 최고의 결과도 얻음). 웹 챗 인터페이스 사용할 때 모든 번거로움과 불편함을 최대한 없애려 노력함. 무료이고 피드백이 아주 좋게 들어왔음, 비판적인 의견도 환영함 IDE <----> 웹 챗탭 간의 이동이 엄청 편리해짐. 원래 내 시간 아끼려고 만든 거고 PySide6 UI라서 웹뷰보다 훨씬 가볍게 동작함. 자주 쓰는 텍스트는 프리셋 버튼으로 바로 추가할 수 있고, 프로젝트별로 창 크기와 사용한 파일 등 컨텍스트 상태도 기억함. 다음에 실행하면 그 상태 그대로 열림 코드 파일 자동 스캔해서 쓸만한 파일을 추론함. 프롬프트 박스에서 코드 위아래로 텍스트를 넣을 수도 있음(이렇게 하면 출력이 더 좋아지는 경향이 있음). 개인적으로 자주 사용하는 버튼 하나는 "Cline(코딩 에이전트)용 프롬프트 작성, 전체 프롬프트를 하나의 코드 태그로 감싸서 복사/붙여넣기를 쉽게 해달라, 전체 작업을 잘게 쪼개고 상세 설명과 이유까지 제공해서 Cline이 따라할 수 있게 해달라, plain language로 search and replace 블록을 추가해 편집 위치를 지정해달라"로 세팅함 내가 문제 해결이나 버그 찾기 위해 하는 방식은, VS Code에서 보통 터미널에 aicp 입력해서 앱을 열고 파일 fine-tuning, 내가 원하는 설명이나 고칠 점을 입력, Cline 버튼과 Generate Context! 클릭 후 GLM-4.5에 붙여넣음. 어려운 문제면 o3, o4-mini, GPT-5, Gemini 2.5 Pro 까지 2~3개 모델에 시도함. 가장 합리적인 답을 골라서 Cline(VS Code, GPT 4.1 무제한/프리 버전)에 붙여넣음. 4.1은 엄청 똑똑하진 않지만 명령 수행이 정확함. 큰 모델 특유의 사소한 실수도 스스로 고침. 큰 모델들은 세부 설명, 작업 리스트를 멋지게 써주고, 4.1이 이를 agent mode에서 실행함 이렇게 하면 무제한 무료로 아주 똑똑한 AI와 코딩할 수 있음. MCP(tool 등)를 모델에 붙이면 성능이 오히려 떨어지고, Claude 4 같은 API 쓰면 돈만 많이 들게 됨

    • 웹사이트 스크롤 속도가 느리고(Firefox Android에서 sub1-fps), grok 관련 call-out은 스크롤 불가함. 상단에는 CSS loaded라는 수상하게 큰 녹색 버튼도 보임

    • [https://wuu73.org/aicp]의 다이어그램이 유용한데, 클릭해도 전체 해상도로 표시되지 않아 흐림. Firefox, Chrome 둘 다 같음. GitHub 레포에선 선명하게 보이니 JS 렌더링 라이브러리 쪽 이슈일 듯함

    • 글 잘 읽었고 업데이트에 감사함. 혹시 Roo Code와 Cline 사용 경험 차이점에 대해 더 깊이 다뤄줄 수 있다면 매우 관심이 있음. 나는 지금까진 Roo Code만 써봤는데, 흥미롭지만 결과가 다소 들쭉날쭉했음

    • Microsoft copilot 써봤는지 궁금함. 사실상 free openai 모델임

    • 무료로 코딩할 수 있다고 했는데, OpenAI 데이터 설정에서 내 데이터가 모델 훈련에 활용되도록 허용하면 그 때만 무료임. 즉, 진짜 "무료"는 아님

  • 내 경험도 본문 내용과 일치함. agentic 기능은 진짜 큰 모델에서만 제대로 동작함 ("동작"이라는 게... 예를 들어 OpenAI Codex가 o4-mini로 3줄 고치는데 200번 요청 보내야 했음) 단순 수정에는 오히려 작은 모델이 훨씬 빠르니까 더 나음. 그래서 "최고"의 모델이 아니라 "쓸 수 있는 한 가장 멍청한 것"으로 집중 중임 이걸 더 밀어붙여서 agentic 방식을 포기하면 엄청 작은 모델로도 아주 정밀한 작업이 가능함. 원하는 걸 정확하게 알려주면 바로 diff 결과를 줌 파일 시스템을 뒤지는 방식은 내 스케일엔 비효율적임. 코드베이스 거의 다 컨텍스트에 넣을 수 있어서 src/ 전체를 프롬프트에 던져버림. 다른 사람 프로젝트는 보일러플레이트가 많아서 gpt-oss-20b 같은 초저가 모델로 코드 검색 실험 중인데 그런 용도엔 더 작은 모델도 쓸만함. Patent pending임

    • 나도 같은 생각임. Haiku도 충분히 대화 흐름 관리가 가능하고, 더 복잡한 작업은 Gemini 2.5 Pro나 GPT-5 등 큰 모델에 요청함. 최근엔 Gemini CLI에서 MCP(${codex mcp})로 Codex를 쓰는 실험 중인데 아주 잘 됨. Gemini CLI는 주로 Flash 기반이지만 문제 정의, 답 재평가엔 충분함. Claude Code MCP로 Gemini 2.5 Pro 활용하는 것도 동일함. Claude Code를 MCP 자체로 쓰는 건 잘 안 됨. 이런 방식의 기본 아이디어는 물론 Aider에서 왔고, 메인·보조·에디터 모델을 동시에 쓰는 컨셉임

    • Aider는 agentic이 아닌 코딩 툴로서 효율성과 효과성 둘 다 적절하게 잡아줌. tree-sitter로 repo 맵핑을 만드니 파일 시스템 뒤질 필요가 훨씬 적어짐. MCP는 없지만 셸 커맨드라 내가 잘 아는 유틸도 쓸 수 있음. Cerebras 같은 공급자와 조합하면 프롬프트 처리 속도가 즉각적임. 여러 번 도구 호출 기다리지 않고 계속 개입 가능함. 작은 프로젝트에선 완전 베스트임

    • 나도 점점 비슷한 생각임. 빠르고 신뢰할 수 있는 도구를 원함. flow state 들어가는 게 내겐 중요한데 agentic 코딩 도구 기다리면서 그 흐름이 다 끊김. 그래서 작은 모델, 혹은 Cerebras 같은 프로바이더에 관심이 커짐. 문제 범위를 좁히면 신뢰도도 높아짐. 개인적으로 네가 사용하는 "surgical" 툴에 대한 얘기도 더 듣고 싶음. 이 주제로 최근 내 블로그 글에서도 덕분에 여러 가지 생각을 정리함

    • Codex CLI에서 더 이상 GPT-5 이하 모델 교체가 안 됨(API키 없으면), 권장하지 않기 때문이라고 함. thinking=high 옵션으로 돌리면 o4-mini보다 훨씬 성능이 좋고, o4-mini는 사실상 gpt-5-thinking-mini 느낌임. codex에서는 그 설정이 안 되고, gpt-5-thinking-high는 o1이나 o3-pro와 비슷함

    • "(사실상 작동)"... OpenAI Codex가 o4-mini로 3줄의 코드 바꾸는 데 200번 요청한 것에 대해 이야기 했는데, 참고로 내 경험상 실제로 3줄짜리 작업에 며칠을 써본 적도 여럿 있음

  • 완전히 local, Cursor 같은 클라우드 필요 없는 스택에 huge potential이 있다고 생각함. 예시로는: • agentic/dev 작업용 Cursor CLI(https://x.com/cursor_ai/status/1953559384531050724) • CLI와 호환되는 로컬 메모리 계층 - LEANN(97% 작은 인덱스, 클라우드 비용 0, 완전 프라이버시, https://github.com/yichuan-w/LEANN)이나 Milvus(근데 이건 종종 클라우드/토큰 기반으로 쓰게 됨) • inference engine 예시로는 Ollama가 있는데, 로컬에서 OSS GPT 모델을 돌리기에 아주 훌륭함 이런 방식이면 완전히 오프라인이고, 프라이빗하며, 매우 빠른 개인 dev+AI 환경을 만들 수 있음. LEANN 프로젝트는 바로 이런 용도로 설계되어 tiny footprint, 온전한 local 환경 전체 세맨틱 검색, Claude Code/Cursor–호환 out-of-the-box, generation은 ollama로 해결 가능함. 돈 한 푼 안 들고, API도 전혀 필요 없음. 물론 세팅엔 약간 노력 필요함. 하지만 누가 완전히 오픈소스로 쉽게 만들어주면 좋겠다는 바람임

    • 이게 진짜 local AI stack의 궁극적 형태에 가까운 요약이라고 느낌. Cursor나 aider 같은 도구에선 강력하고 프라이빗한 memory layer가 늘 부족했다고 느낌. LEANN 처럼 tiny private index + Ollama 로컬 inference 조합은 정말 강력하다는 생각임. 프로그래밍에 이런 조합 쓰는 아이디어가 맘에 들고, 진정 프라이빗한 "Cursor-like" 경험이 실현되면 AI Workflow가 완전히 달라질 것 같음
  • 무료 API를 찾고 있다면 Google Gemini에서는 무료로 Gemini, 특히 gemini-2.5-pro에 thinking 기능 켜고 쓸 수 있음. 제한이 꽤 높아서 벤치마크 중인데 아직 리미트에 도달 못했음. 오픈 가중치 모델인 DeepSeek R1, GPT-OSS도 여러 inference provider나 하드웨어 업체에서 무료 API access를 제공함

  • 본문 내용에 생각보다 새로운 정보가 많아서 놀람. 평소엔 옵션을 그리 깊게 파지 않았는데, 이번엔 기사까지 다 읽어보길 잘했다고 느낌. 그리고 HN 댓글들도 실용적인 정보가 많아 모두에게 감사함

  • OP에게 추천하고 싶은데, Continue.dev, ollama/lmstudio, 로컬에서 모델 돌리는 방법을 꼭 알아보길 바람. 몇몇 모델들은 자동완성에 정말 강하고, 또 gpt-oss 같은 모델은 추론이나 툴 활용도 잘함. 나는 이게 my goto copilot임

    • 나도 마찬가지임! VSCode에서 Continue 쓰고 있는데, Qwen 대형 모델들이나 gpt-oss-120b가 agentic 모드에서 꽤 괜찮게 동작함

    • continue.dev보다 Zed가 한 단계 더 업그레이드라고 느낌. 거기서는 원하는 모델 직접 사용할 수도 있음

  • 포스트 내용대로, 코딩 에이전트의 문제는 각 요청마다 자기 데이터 + 거의 전체 코드베이스를 다 전송해서 비용이 비쌈. 대신 AI 챗에서는 비용이 사실상 무시해도 될 수준임. 나는 오로지 OpenRouter만 쓰는데, 거의 모든 모델에 접근 가능함. Sonnet이 원래 최애였지만 Gemini 2.5 Pro를 써보니 거의 항상 더 나음(단점은 느림). 간단한 질문이나 문법 기억 안 날 때는 Gemini Flash가 초고속이라서 딱임

  • 누군가는 무료 티어 때문에 이렇게까지 자기 데이터를 내주는 게 놀랍다고 생각하겠지만, 사실 좋은 LLM을 집에서 직접 돌릴 자원이 너무 많이 들어서 그냥 내 코드를 내주고 무료로 쓰는 쪽이 낫다고 봄. 어차피 그 코드는 결국 오픈소스 될 예정임

    • 내가 일하는 곳에서 코딩에 모델 쓰는 걸 괜찮게 본다면 내 입장에선 신경 쓸 부분이 아님
  • "웹 챗에서 AI 사용할 때(즉 ChatGPT, Openrouter 같은 웹 인터페이스)는 IDE나 에이전트 프레임워크보다 문제 해결이나 솔루션 제안에서 거의 항상 더 좋은 결과를 보여줌"이라는 주장에 정말 동의함. IDE에서 코드를 복사해서 웹챗에 붙여넣는 게 다소 불편해 보여도, 내 경험상 Github copilot이나 cursor보다 훨씬 더 낫다는 결과를 얻음

    • 완전 정반대 경험임. agentic이든 아니든 가장 중요한 건 context임. agentic으로 프로젝트 전체에 접근하거나, GitHub에 바로 붙이거나, fine-tune, RAG 등 컨텍스트 전체에 접근 가능한 게 환각을 엄청 줄여줌. "x를 써줘"와 "내 스타일, y 의존성, 주변 z 코드까지 반영해서 x를 써줘"는 엄청난 차이가 있음. 솔직히 복붙 AI 코딩을 옹호하는 이유를 이해하지 못함. 그래서 에이전트 방식이 지금 이렇게 폭발적으로 인기라고 생각함