AI를 무료 또는 저렴하게 활용하여 개발하는 방법

(wuu73.org)

여러 무료 웹 AI 모델을 병행해 문제 해결과 코드 생성을 분리하고, 모델별 강점을 살리는 하이브리드 전략 활용
AI Code Prep GUI로 필요한 코드만 선별·정리해 불필요한 맥락으로 인한 성능 저하 방지, 핵심 컨텍스트만 AI에 제공
기획·디버깅은 고성능/무료 모델(Gemini 2.5 Pro, o3, o4-mini, Claude 4 등)로, 실행·코드 작성은 GPT-4.1·Claude 3.5로 수행
OpenAI 데이터 공유, GitHub Copilot, Poe.com, OpenRouter 등으로 무료·저렴한 토큰 확보해 비용 최소화
Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE 등 다양한 에이전트·CLI 도구를 상황별로 조합해 작업 효율 향상

My Browser Setup: The Free AI Buffet

브라우저에 다양한 강력한 AI 모델의 무료 버전을 여러 탭으로 열어 두고 사용함
한 가지 모델에만 의존하지 않고, 여러 관점에서 답변을 얻는 방식임. 대표적으로 사용하는 무료 모델 조합은 다음과 같음.

GLM 4.5: 웹에서 무료로 사용 가능하며, 체감상 Claude 4 수준 또는 그 이상으로 성능이 좋음. 항상 2~3개의 탭을 열어둠
Kimi K2: Claude 또는 Opus 계열과 유사한 모델로, 웹에서 무료로 이용 가능. 보통 1~2개 탭을 열며, GLM 4.5 등장 전에는 하루에도 여러 번 까다로운 버그를 해결해줌
Qwen3 Coder 및 신형 모델들: 다양한 코딩 특화 모델 테스트용으로 사용
OpenAI Playground: GPT-4.5, o3 등 다양한 모델을 무료로 활용 가능. 계정 데이터 설정에서 "OpenAI가 데이터를 모델 학습에 사용"하도록 허용하면 무료 토큰이 지급됨
Google Gemini AI Studio: Gemini 2.5 Pro/Flash 모델을 무료·무제한에 가깝게 사용 가능. 보통 1~3개의 탭을 열어둠
Google Gemini 2.5 Pro: AI Studio와는 별개 서비스로, 이미지 생성과 심층 연구 기능이 더 뛰어남. AI Studio와 함께 탭을 병행 사용
Poe.com: Claude 4나 o4-mini 등 프리미엄 모델에 대해 일일 무료 크레딧 제공
OpenRouter: 무료 및 유료 모델 혼합 사용 가능. 여러 모델을 각각 다른 탭에 세팅해둠
ChatGPT: 무료 버전도 여전히 유용해 최소 1개 탭 유지
Perplexity AI: 리서치 중심 질문에 강점
Deepseek: v3와 r1 모델 무료 제공. 단, 컨텍스트 제한 주의
Grok.com: 일반적 사용과 심층 연구, 이미지 편집에 무제한 무료 제공. 특히 심층 연구 기능이 Perplexity와 유사해 유용
Phind: 답변 시 플로우차트나 다이어그램을 함께 제공하려는 시도를 함
lmarena.ai: Claude Opus 4와 Sonnet 4를 무료로 제공. Opus 4 무료 사용은 상당히 가치가 높음

Claude.ai 자체도 무료지만, 사용 제한이 잦아 불편할 수 있어 Cody 확장이나 Copilot 등을 통해 다른 접근 방식을 사용함.

주의 사항 – Grok 사용 시
Grok은 무료 연산과 검열되지 않은 이미지 생성을 제공하여 다른 모델의 안전 시스템이 방해될 때 유용할 수 있음. 그러나 운영자가 나치 연관 사상이나 허위정보를 홍보하려는 의도를 가질 가능성이 있다는 보고가 있음. 특히 아프리카 집단 학살 등 역사적 사건에 대해 거짓 정보를 제공하도록 지시받았다는 주장도 있음. 이러한 왜곡은 주로 X 플랫폼에서 나타나지만, 코딩 같은 안전한 용도에만 제한적으로 활용하거나, 잠재적 편향을 염두에 두고 사용하는 것이 권장됨.

A smarter, cheaper workflow: Focused Context

웹 기반 AI 채팅 인터페이스(AI Studio, ChatGPT, OpenRouter 등)를 사용할 때, IDE나 에이전트 프레임워크(Cline, Trae, Copilot 등)보다 문제 해결이나 솔루션 제안이 더 뛰어난 경우가 많음
Cursor, Cline, Roo Code와 같은 도구로 모든 작업을 처리하면, MCP 서버 사용법이나 파일 편집 절차 등 문제와 직접 관련 없는 대량의 텍스트를 AI에 전송하게 되어, AI가 혼란스러워지고 성능이 떨어짐
이로 인해 최고가 모델을 사용하더라도 불필요한 정보로 인한 ‘둔화 효과’를 극복하지 못함

그래서, 문제 해결에 필요한 정확한 컨텍스트를 직접 생성해 웹 기반 AI 채팅에 붙여넣고 질문하거나 코드 리뷰를 요청하는 방식으로 접근함
해결책이 나오면, 해당 내용을 Cline 등의 에이전트용 프롬프트로 작성해 파일 편집만 맡김
이렇게 하면 GPT-4.1(무제한 사용 가능)을 활용해 저렴하게 문제 해결과 기획이 가능하며, 굳이 Claude 크레딧을 소모할 필요가 없음
어려운 문제 해결에는 Claude를, 실행에는 웹 채팅 AI를 병행해 효율성을 높임

How AI Code Prep Helps (Example Prompt Structure)

예시 프롬프트:
```
Can you help me figure out why my program does x instead of y?  
```
- AI Code Prep GUI 는 프로젝트 폴더를 재귀적으로 스캔하여 하위 폴더·파일까지 모두 탐색 후, AI가 보기 좋은 형식으로 코드와 질문을 정리함
- 생성된 컨텍스트 예시:
```
Can you help me figure out why my program does x instead of y?  

fileName.js: <code>  
... 파일 내용 ... </code>  

nextFile.py: <code>  
import example  
... 기타 내용 ... </code>  

Can you help me figure out why my program does x instead of y?  
```
- 질문을 두 번 반복(상단/하단/양쪽 선택 가능)해 AI가 포커스를 유지하도록 함
- Windows에서는 프로젝트 폴더 내부에서 마우스 우클릭 → "AI Code Prep GUI" 실행 → 자동으로 코드 파일을 선택하며, node_modules, .git 등 불필요한 디렉토리는 자동 제외
- 선택이 완벽하지 않아도 체크박스를 통해 쉽게 조정 가능
- 대규모 프로젝트로 AI 컨텍스트 한도를 초과할 때, 꼭 필요한 파일만 선별해 제공 가능
왜 이 방식이 중요한가?
- Cline, GitHub Copilot, Cursor, Windsurf 등 많은 코드 에이전트는 컨텍스트를 너무 많이 보내거나 너무 적게 보내서 비효율적
- 직접 파일을 선별하면, 불필요한 데이터 없이 필요한 정보만 AI에 제공 가능
- GUI 기반이라 CLI나 공개 GitHub 링크를 요구하는 다른 컨텍스트 생성 도구보다 개인 코드 보안 유지와 편리성이 뛰어남
- 최신 기능 업데이트는 wuu73.org/aicp 참고

Model Strategy: Picking the Right Brain for the Job

많은 강력한 AI 모델들이 웹 인터페이스를 통해 무료로 제공되므로(Gemini in AI Studio, Grok, Deepseek 등), 이를 우선적으로 활용함
Poe.com은 Claude 및 새로운 o4 시리즈 같은 최상위 모델에 대해 무료 일일 크레딧을 제공

Gemini 2.5 Pro (AI Studio 제공)는 디버깅, 기획, 전반적인 작업에서 매우 뛰어나 현재 가장 다재다능한 모델로 평가됨
까다로운 문제에는 o4-mini(OpenRouter 또는 Poe에서 사용 가능)를 시도
- 이전 최상위 모델(Claude 3.5/3.7/4)보다 API 사용 시 비용이 훨씬 저렴
- 해결이 어려웠던 버그를 즉시 해결한 경험이 있음
Claude 3.7 또는 4는 Poe, API(OpenRouter), GitHub Copilot Chat 등을 통해 접근 가능
- 무료 사용량이 일부 제공되지만, 잦은 사용에는 비용 부담이 큼
- 3.7/4는 창의적이고 폭발적인 출력(‘Hunter S. Thompson’ 스타일)을 제공하지만, 실제 코딩은 차분한 Claude 3.5에 맡기는 것이 효율적일 수 있음

OpenAI Playground 무료 토큰 활용법
- OpenAI 계정의 데이터 공유 설정을 활성화하면 매일 대량의 무료 토큰을 사용 가능
- OpenAI Playground → 우측 상단 설정 아이콘 → 왼쪽 메뉴 Data Controls → Sharing에서 "Share inputs and outputs with OpenAI" 를 활성화하면 다음 혜택 제공:
- 하루 최대 25만 토큰: gpt-5, gpt-4.1, gpt-4o, o1, o3
- 하루 최대 250만 토큰: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
- 이 설정을 활용하면 o3와 GPT-4.5 같은 최상위 모델을 무료로 다량 사용 가능
- OpenAI Playground에서 o3와 o4-mini를 나란히 실행해 비교하면서 각 모델의 강점과 용도를 파악할 수 있음.
추천 모델별 사용 전략
- Gemini 2.5 Pro: 디버깅, 기획, 전반적인 코딩 작업에서 최우선
- o4-mini: 까다로운 버그 해결, 비용 효율 우수
- Claude 4 / 3.7: 긴급하고 어려운 문제 해결에 최적, 다만 접근성·비용이 제한적
- Claude 3.5: 3.7/4의 창의적 산출물을 정제하거나 실제 코드 작성에 적합
- o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: 복잡한 문제 해결 능력이 매우 뛰어나며, 무료 토큰 설정 활용 시 대량 사용 가능

The Hybrid Approach: Premium Planning + Budget Execution

다양한 모델을 테스트한 결과, 품질과 비용 효율을 모두 극대화할 수 있는 하이브리드 전략을 개발함
핵심 인사이트는 모델마다 개발 과정의 특정 단계에서 강점이 다르다는 점

"스마트 주스(Smart Juice)" 이론 – AI가 멍청해지는 이유
모델이 받을 수 있는 ‘지능 에너지’는 한정돼 있음.
간결하고 집중된 프롬프트를 보내면 그 에너지의 거의 100%가 문제 해결에 사용됨.
하지만 불필요하게 복잡한 입력(툴 사용법 장문 설명, 문제와 무관한 맥락, 수 페이지의 코드 등)을 보내면 상당 부분이 이를 처리하는 데 소모돼, 실제 문제 해결에 쓸 ‘지능’이 줄어듦.

예: Cursor, Cline 같은 IDE 연동형 에이전트는 질문 전에 수많은 지시문과 컨텍스트를 보내므로 모델의 집중도가 떨어짐.
따라서 불필요한 맥락을 줄이고, 문제 해결에 필요한 핵심만 보내는 것이 최적의 결과를 내는 방법임.

새 프로젝트 시작 시 워크플로우
- 1. Plan & Brainstorm
  - 스마트하고 무료인 웹 모델(Gemini 2.5, o4-mini, Claude 3.7/4, o3 등)로 접근 방식 설계, 단계별 계획 수립, 필요한 라이브러리 식별.
- 2. Generate Agent Prompt
  - 위 모델 중 하나에 요청:
    "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [작업 설명]"
  - 생성된 프롬프트를 ChatGPT 같은 재작성에 능한 무료 AI로 한 번 더 다듬음.
- 3. Execute with Cline
  - 다듬은 프롬프트를 Cline에 붙여넣고, GPT 4.1 또는 Claude 3.5(복잡한 작업일 경우 Claude 4)로 실행.
  - GPT 4.1 계열은 지시사항 준수 훈련이 잘 돼 있음.
- 4. Fallback
  - GPT 4.1이 실패하면 API를 통해 Claude 3.5로 전환.
  - Deepseek v3 또는 R1도 지시사항 수행에 매우 강함.
핵심 전략
- 비싸고 스마트한 모델(또는 무료로 사용 가능한 Gemini 2.5 Pro)로 전략과 설계 단계 진행.
- 계획을 2~3개의 다른 무료 모델(Deepseek R1, Poe의 Claude 등)에 붙여넣어 검증:
  "Is this good? Can you improve it or find flaws?"
- 코딩·실행 단계는 안정적이고 효율적인 모델(GPT 4.1, Claude 3.5)을 Cline에서 사용.
모델별 활용 팁
- o4-mini
  - 복잡한 코드 로직 해석, 프레임워크·라이브러리 선택 등 고레벨 구현 전략에 강함.
- 아이디어 브레인스토밍
  - Gemini 2.5, o4-mini, GPT 4.1, ChatGPT, o3-mini(duck.ai에서 종종 무료), Phind 등을 활용.
- 해결 불가 시
  - 무료/저가 모델에서 해결 실패하면 API로 고급·유료 모델로 escalatation.

Alternative Agents & Setups

Trae.ai (Bytedance, TikTok 제작사)
- VS Code 호환 IDE, 무료 AI 사용 제공: Claude 4, Claude 3.7, Claude 3.5, GPT 4.1 포함.
- 내장 에이전트 성능은 Cline보다 떨어짐(솔직히 Cline이 최강).
- VS Code 클론 형태라 Cline 확장 설치 가능할 것으로 보임.
- 하지만 서버 과부하로 속도 느림 → 무료 사용 실효성 낮음.
- 그래도 무료 모델 접근성이 있어 언급.
추천 세팅 2가지
- 1. VS Code + Cline + Copilot
  - Copilot 월 $10 구독 → Cline에서 저렴하게 강력 모델 API 사용 가능.
  - 무료 티어도 일부 기본 기능 가능.
- 2. Trae.ai + Cline
  - Trae의 무료 모델 접근 + Cline API 키 사용 병행 가능 여부 테스트.
팁: Copilot 기본 에이전트가 Cline이 잘 못하는 문제를 해결하는 경우도 있고, 반대도 있음.
Cline이 과도하게 긴 프롬프트를 보내 성능이 떨어질 수 있음 → Copilot이 유리한 경우 존재.
Roo Code: Cline의 클론
- Roo Code는 Cline과 거의 동일하지만 일부 다른 기능 제공.
- 프로젝트나 코딩 스타일에 따라 Roo Code가 더 나을 수 있음.
- Cline 자체는 무료지만 API 호출 요금 발생.
- 가장 경제적인 방법: VS Code LM API 설정 + Copilot 월 $10 구독 → 거의 무제한 강력 모델 사용.
신규 CLI 툴: Claude Code, Qwen Code, Gemini CLI
- 최근 CLI 기반 코딩 툴 관심 급증.
- Claude Code: 서브에이전트(subagent) 지원 → 하나의 작업만 수행, 추가 도구 사용 안 함.
  - 이 가이드에서 설명한 ‘스마트 주스’ 집중형 워크플로우를 재현 가능.
  - 불필요한 에이전트 지시문(bloat) 제거, 효율성 유지.
- Qwen Code, Gemini CLI도 각각 장점 존재.
- Claude Code를 GLM 4.5로 사용하는 설정 가이드가 z.ai 사이트에 있음.
- 각 CLI 툴은 서로 다른 강점이 있어, 가이드·커뮤니티 팁 참고해 실험 추천.

TL;DR: Quickstart Guide

Models & Roles
- Planning & Brainstorming
  GLM 4.5, Kimi K2, 최신 Qwen3 Coder & 2507 시리즈, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), OpenAI Playground에서 하루 25만 무료 토큰(o3, GPT-5) 사용 추천
- Problem Solving & Debugging
  GPT-5(Playground 무료 토큰), GLM-4.5(Claude 4 수준의 성능), Claude 4(Poe 무료 일일 토큰)
- Actual Coding
  GPT-4.1(Cline), 실패 시 Claude 3.5 대체, 또는 Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2 사용
Key Tools
- VS Code
- AI Code Prep GUI – 로컬에서 필요한 파일만 스캔·선별, AI 컨텍스트 최적화
- Cline (VS Code 에이전트) – 단계별 코드 실행
- 무료 웹 챗 – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai
Quick Workflow
1. AI Code Prep GUI로 프로젝트 관련 파일 번들링
2. 해당 컨텍스트를 선호하는 웹 챗 모델에 붙여넣어 계획·디버깅
3. 한 모델에 "이 작업을 위한 상세 Cline 프롬프트 작성" 요청 후 ChatGPT 등에서 재정제
4. 완성된 프롬프트를 GPT-4.1로 설정한 Cline에 붙여넣어 코드 생성·수정
  → 실패 시 Claude 3.5로 전환
Cost-Saving Hacks
- OpenAI Playground “데이터 공유” 활성화 → 하루 25만 무료 토큰(GPT-4.5, o3) + 하루 250만 무료 토큰(o4-mini, o3-mini)
- GitHub Copilot 월 $10 구독 → Cline에서 Claude 모델 제한적 사용 가능
- OpenRouter 종량제 → o4-mini, Claude 3.7 등 최신 모델 저렴하게 사용

Some Thoughts

AI는 놀라운 생산성 증폭기이지만, 마법 지팡이는 아닙니다.
진정한 마법은 여러분의 호기심, 끈기, 그리고 실험하려는 의지가 이 강력한 도구들과 결합될 때 일어납니다.
버그나 문제로 좌절하지 마세요 — 모든 도전은 새로운 것을 배울 기회입니다.

모델을 섞어 쓰고, 대담한 아이디어를 시도하며, 부수고 다시 만드는 것을 두려워하지 마세요.
최고의 개발자는 결코 막히지 않는 사람이 아니라, 막혀도 계속 앞으로 나아가며 모든 도구와 기술을 활용하는 사람입니다.

혼돈을 받아들이고, 과정을 즐기며, 여러분의 창의성이 길을 이끌도록 하세요!

Latest Model Updates (Aug 2025)

💰 Budget-Conscious: Getting Max Value

GPT 4.5
- Status: Discontinued
o3
- 능력: Claude 4에 필적하는 성능, 어려운 문제 해결에 탁월, 천재급
- 활용 팁: AI Code Prep GUI로 전체 코드베이스를 넣어 분석 가능
- Free Tokens: Data Controls/Sharing settings에서 데이터 공유 활성화 시 250k 토큰/일
o4-mini
- 능력: o3보다는 약간 떨어지지만 매우 뛰어난 성능, 마치 o3의 동생 같은 모델
- Free Tokens: 데이터 공유 활성화 시 2.5M 토큰/일
Gemini 2.5 Pro
- 이용: AI Studio에서 무료
- 특화: 복잡한 디버깅, 아키텍처 설계 및 계획
Deepseek R1 0528
- 능력: 향상된 추론 성능을 갖춘 매우 똑똑한 모델
- 이용: Deepseek 웹 인터페이스에서 무료 사용 가능

🚀 Premium: Fix Problems NOW

Claude 4 Sonnet
- 능력: 충분한 컨텍스트를 제공하면 대부분의 문제를 한 번에 해결
- 특화: 글쓰기, 문제 해결 등 전반적으로 최고의 성능
- 활용: 꼭 첫 시도에서 완벽히 해결해야 할 때
Claude 4 Opus
- 가격: $75 / 1M 토큰
- 성능: Sonnet보다 더 뛰어나다고 알려진 “매직 소스”급 성능
- 활용: 궁극의 문제 해결이 필요할 때

Solid Worker Models

다음 모델들은 지시를 잘 따르고 안정적으로 작업을 수행함:

GPT 4.1
- 상위 스마트 모델로 설계·문제 해결 후, 실제 코드 수정에 사용
- 어디서든 받은 출력물을 그대로 Cline에 붙여서 실행 가능
Claude Sonnet 3.5
- 코딩과 편집에 강점
- 4.1보다 약간 느리지만 매우 안정적
Deepseek v3
- 코드 작성·수정·에이전트 작업에 적합
- 가격 대비 성능이 뛰어남
OpenRouter Free Models
- OpenRouter에서 가격 필터를 $0로 설정해 무료 모델 탐색
- 새로운 모델이 등장하면 실험할 가치 있음

Free Claude 4: lmarena.ai, and More

Claude Opus 4 and Sonnet 4

lmarena.ai에서 Claude Opus 4, Sonnet 4 등 무료 제공
팁: Anthropic 계열 모델의 무료 사용 기회는 반드시 저장·기억·활용
활용: 모든 것이 실패하거나, 즉시 완벽하게 작업을 완료해야 할 때 Claude 4 Sonnet 또는 Opus 선택

NEW!! Bad ass new Chinese models + GPT 5

GLM 4.5
- 성능: Claude 4 Opus 또는 Sonnet과 유사
- 특징: 에이전트 규칙 및 도구 사용을 거의 완벽하게 수행
- 활용: 매우 어려운 버그 수정, 많은 컨텍스트를 요구하는 복잡한 작업 처리에 강함
Qwen3 Coder 480B
- 평가: 강력하고 저렴해 선호도가 높은 모델
- 활용: 고성능·저비용 환경에서의 코딩 작업
Qwen3 Instruct & Thinking 2507
- 성능: Qwen3 Coder와 유사한 안정성과 강력함
- 장점: 신뢰할 수 있고 비용 효율적
Kimi K2 (Moonshot)
- 특징: Anthropic 기반 또는 Claude 유사 합성 데이터로 학습된 듯한 성격
- 평가: 매우 뛰어난 성능, 자주 사용되는 모델
GPT 5
- 제한점: 커스텀 툴 사용(MCP, Cline 등)에서는 강점이 적음
- 추천 사용법:
  1. GPT 5, GLM 4.5 등 최고의 모델로 계획 수립·문제 해결
  2. 이후 간단한 에이전트 모델이 실제 편집과 툴 사용을 수행하도록 프롬프트 작성
- 비교:
  - GPT 4.1은 여전히 비용 대비 가치가 뛰어남
  - 새로운 중국계 모델들은 커스텀 툴/Cline 사용에 강점
- 총평: 아직 충분히 실험하진 않았지만, 모델마다 잘하는 분야가 다르며, 현재는 가격과 안정성 면에서 중국 모델들이 매우 매력적임

Current Coding Workflow (2025)

For New Projects:
- 1. Planning Phase:
  - 모든 프로젝트 세부사항(언어, 라이브러리, 서버 등)을 노트패드에 기록
- 2. Multi-Model Consultation:
  - 동일 내용을 여러 모델에 붙여넣어 ‘다중 의사 의견’ 얻기:
    - Gemini 2.5 Pro (무료)
    - GPT 4.1
    - o4-mini
    - Claude 4 (Poe의 무료 일일 크레딧 활용)
- 3. Refinement:
  - 모델과의 반복 대화를 통해 세부사항 미세 조정
- 4. Task Generation:
  - 모델에게 Cline AI 코딩 에이전트용 단계별 작업 리스트 작성 요청
- 5. Execution:
  - Cline(또는 Roo Code)에서 GPT 4.1을 ‘act’ 모드로 설정해 작업 실행
For Problem Solving:
- 복잡한 코드베이스 분석: GPT 4.5 + AI Code Prep 활용
- GPT 4.5에 “Cline이 이 작업을 완료하도록 프롬프트를 작성해줘” 요청
- 문제 복잡도에 따라 모델 선택
- 다양한 모델을 활용해 다각적 해결 방안 모색
Task List & Test Driven Development (Coming Soon)
Test Driven Development & Task Lists:
- AI에게 Cline, Roo Code, Trae agent 실행용 상세 작업 리스트 작성 요청
- Cline 또는 Roo Code가 마크다운 파일에 작업 진행 상황을 기록하고 완료 시 체크하도록 지시 가능
- 이를 통해 진행 상황을 쉽게 추적하고 누락 방지 가능
- 현재는 모델에게 마크다운 체크리스트를 생성하게 하고, Cline이나 Roo Code에 해당 파일을 업데이트하게 하는 방식으로 실험 가능
Money-Saving Hacks
- GPT 4.5 & o3: 모델 학습 데이터 공유를 활성화하면 매일 25만 토큰 무료 제공
- 저렴한 모델: o4-mini, 4.1-mini/nano에서 매일 250만 토큰 사용 가능
- GitHub Copilot: 월 $10로 새로운 Claude 모델(속도 제한 있음) 사용 가능
- Trae IDE: 현재 무료로 Claude 4와 GPT 4.1 사용 가능(구독 불필요, 제한 없음으로 보임)
- Poe.com: 모든 모델에 대해 무료 일일 크레딧 제공
- Web Interfaces: 무료 웹 채팅 인터페이스를 활용해 계획 수립 및 컨설팅
Coming Soon: Live Reddit Data & Insights
Live Reddit Data Scraping & Daily Insights:
- Reddit 데이터를 실시간 스크래핑해 매일 업데이트된 AI 모델 사용 사례 제공 예정
- 세부 사용 분석, 데이터 시각화, 실제 코딩 워크플로우 및 트렌드에 대한 새로운 인사이트 포함

▲

GN⁺ 5달전 [-]

Hacker News 의견

혹시 헷갈린 분들을 위해 말하자면, 본문에 2, 3페이지가 더 있고, 하단에 있는 화살표 아이콘을 통해 접근 가능함
본문 작성자인데, 글꼴 문제는 미안함. 내용이 약간 오래된 편인데 AI 쪽은 워낙 빠르게 바뀌어서 최신 모델을 포함해 업데이트 예정임. 요즘 새 모델이 엄청 자주 나오고, 개인적으로 최근 가장 좋아하는 건 GLM-4.5임. Kimi K2도 괜찮고, Qwen3-Coder 480b나 2507 instruct도 상당히 좋음. 이런 모델들은 어떤 agentic 환경이나 agent tool에서 매우 잘 동작함 나만의 context helper 앱(https://wuu73.org/aicp)도 만들었는데, 이 링크에서 접근 가능함. 내가 주로 사용하는 수많은 AI 챗탭들과 IDE 사이를 왕복할 때 아주 편리함(거의 항상 무료고, 최고의 결과도 얻음). 웹 챗 인터페이스 사용할 때 모든 번거로움과 불편함을 최대한 없애려 노력함. 무료이고 피드백이 아주 좋게 들어왔음, 비판적인 의견도 환영함 IDE <----> 웹 챗탭 간의 이동이 엄청 편리해짐. 원래 내 시간 아끼려고 만든 거고 PySide6 UI라서 웹뷰보다 훨씬 가볍게 동작함. 자주 쓰는 텍스트는 프리셋 버튼으로 바로 추가할 수 있고, 프로젝트별로 창 크기와 사용한 파일 등 컨텍스트 상태도 기억함. 다음에 실행하면 그 상태 그대로 열림 코드 파일 자동 스캔해서 쓸만한 파일을 추론함. 프롬프트 박스에서 코드 위아래로 텍스트를 넣을 수도 있음(이렇게 하면 출력이 더 좋아지는 경향이 있음). 개인적으로 자주 사용하는 버튼 하나는 "Cline(코딩 에이전트)용 프롬프트 작성, 전체 프롬프트를 하나의 코드 태그로 감싸서 복사/붙여넣기를 쉽게 해달라, 전체 작업을 잘게 쪼개고 상세 설명과 이유까지 제공해서 Cline이 따라할 수 있게 해달라, plain language로 search and replace 블록을 추가해 편집 위치를 지정해달라"로 세팅함 내가 문제 해결이나 버그 찾기 위해 하는 방식은, VS Code에서 보통 터미널에 aicp 입력해서 앱을 열고 파일 fine-tuning, 내가 원하는 설명이나 고칠 점을 입력, Cline 버튼과 Generate Context! 클릭 후 GLM-4.5에 붙여넣음. 어려운 문제면 o3, o4-mini, GPT-5, Gemini 2.5 Pro 까지 2~3개 모델에 시도함. 가장 합리적인 답을 골라서 Cline(VS Code, GPT 4.1 무제한/프리 버전)에 붙여넣음. 4.1은 엄청 똑똑하진 않지만 명령 수행이 정확함. 큰 모델 특유의 사소한 실수도 스스로 고침. 큰 모델들은 세부 설명, 작업 리스트를 멋지게 써주고, 4.1이 이를 agent mode에서 실행함 이렇게 하면 무제한 무료로 아주 똑똑한 AI와 코딩할 수 있음. MCP(tool 등)를 모델에 붙이면 성능이 오히려 떨어지고, Claude 4 같은 API 쓰면 돈만 많이 들게 됨
- 웹사이트 스크롤 속도가 느리고(Firefox Android에서 sub1-fps), grok 관련 call-out은 스크롤 불가함. 상단에는 CSS loaded라는 수상하게 큰 녹색 버튼도 보임
- [https://wuu73.org/aicp]의 다이어그램이 유용한데, 클릭해도 전체 해상도로 표시되지 않아 흐림. Firefox, Chrome 둘 다 같음. GitHub 레포에선 선명하게 보이니 JS 렌더링 라이브러리 쪽 이슈일 듯함
- 글 잘 읽었고 업데이트에 감사함. 혹시 Roo Code와 Cline 사용 경험 차이점에 대해 더 깊이 다뤄줄 수 있다면 매우 관심이 있음. 나는 지금까진 Roo Code만 써봤는데, 흥미롭지만 결과가 다소 들쭉날쭉했음
- Microsoft copilot 써봤는지 궁금함. 사실상 free openai 모델임
- 무료로 코딩할 수 있다고 했는데, OpenAI 데이터 설정에서 내 데이터가 모델 훈련에 활용되도록 허용하면 그 때만 무료임. 즉, 진짜 "무료"는 아님
내 경험도 본문 내용과 일치함. agentic 기능은 진짜 큰 모델에서만 제대로 동작함 ("동작"이라는 게... 예를 들어 OpenAI Codex가 o4-mini로 3줄 고치는데 200번 요청 보내야 했음) 단순 수정에는 오히려 작은 모델이 훨씬 빠르니까 더 나음. 그래서 "최고"의 모델이 아니라 "쓸 수 있는 한 가장 멍청한 것"으로 집중 중임 이걸 더 밀어붙여서 agentic 방식을 포기하면 엄청 작은 모델로도 아주 정밀한 작업이 가능함. 원하는 걸 정확하게 알려주면 바로 diff 결과를 줌 파일 시스템을 뒤지는 방식은 내 스케일엔 비효율적임. 코드베이스 거의 다 컨텍스트에 넣을 수 있어서 src/ 전체를 프롬프트에 던져버림. 다른 사람 프로젝트는 보일러플레이트가 많아서 gpt-oss-20b 같은 초저가 모델로 코드 검색 실험 중인데 그런 용도엔 더 작은 모델도 쓸만함. Patent pending임
- 나도 같은 생각임. Haiku도 충분히 대화 흐름 관리가 가능하고, 더 복잡한 작업은 Gemini 2.5 Pro나 GPT-5 등 큰 모델에 요청함. 최근엔 Gemini CLI에서 MCP(${codex mcp})로 Codex를 쓰는 실험 중인데 아주 잘 됨. Gemini CLI는 주로 Flash 기반이지만 문제 정의, 답 재평가엔 충분함. Claude Code MCP로 Gemini 2.5 Pro 활용하는 것도 동일함. Claude Code를 MCP 자체로 쓰는 건 잘 안 됨. 이런 방식의 기본 아이디어는 물론 Aider에서 왔고, 메인·보조·에디터 모델을 동시에 쓰는 컨셉임
- Aider는 agentic이 아닌 코딩 툴로서 효율성과 효과성 둘 다 적절하게 잡아줌. tree-sitter로 repo 맵핑을 만드니 파일 시스템 뒤질 필요가 훨씬 적어짐. MCP는 없지만 셸 커맨드라 내가 잘 아는 유틸도 쓸 수 있음. Cerebras 같은 공급자와 조합하면 프롬프트 처리 속도가 즉각적임. 여러 번 도구 호출 기다리지 않고 계속 개입 가능함. 작은 프로젝트에선 완전 베스트임
- 나도 점점 비슷한 생각임. 빠르고 신뢰할 수 있는 도구를 원함. flow state 들어가는 게 내겐 중요한데 agentic 코딩 도구 기다리면서 그 흐름이 다 끊김. 그래서 작은 모델, 혹은 Cerebras 같은 프로바이더에 관심이 커짐. 문제 범위를 좁히면 신뢰도도 높아짐. 개인적으로 네가 사용하는 "surgical" 툴에 대한 얘기도 더 듣고 싶음. 이 주제로 최근 내 블로그 글에서도 덕분에 여러 가지 생각을 정리함
- Codex CLI에서 더 이상 GPT-5 이하 모델 교체가 안 됨(API키 없으면), 권장하지 않기 때문이라고 함. thinking=high 옵션으로 돌리면 o4-mini보다 훨씬 성능이 좋고, o4-mini는 사실상 gpt-5-thinking-mini 느낌임. codex에서는 그 설정이 안 되고, gpt-5-thinking-high는 o1이나 o3-pro와 비슷함
- "(사실상 작동)"... OpenAI Codex가 o4-mini로 3줄의 코드 바꾸는 데 200번 요청한 것에 대해 이야기 했는데, 참고로 내 경험상 실제로 3줄짜리 작업에 며칠을 써본 적도 여럿 있음
완전히 local, Cursor 같은 클라우드 필요 없는 스택에 huge potential이 있다고 생각함. 예시로는: • agentic/dev 작업용 Cursor CLI(https://x.com/cursor_ai/status/1953559384531050724) • CLI와 호환되는 로컬 메모리 계층 - LEANN(97% 작은 인덱스, 클라우드 비용 0, 완전 프라이버시, https://github.com/yichuan-w/LEANN)이나 Milvus(근데 이건 종종 클라우드/토큰 기반으로 쓰게 됨) • inference engine 예시로는 Ollama가 있는데, 로컬에서 OSS GPT 모델을 돌리기에 아주 훌륭함 이런 방식이면 완전히 오프라인이고, 프라이빗하며, 매우 빠른 개인 dev+AI 환경을 만들 수 있음. LEANN 프로젝트는 바로 이런 용도로 설계되어 tiny footprint, 온전한 local 환경 전체 세맨틱 검색, Claude Code/Cursor–호환 out-of-the-box, generation은 ollama로 해결 가능함. 돈 한 푼 안 들고, API도 전혀 필요 없음. 물론 세팅엔 약간 노력 필요함. 하지만 누가 완전히 오픈소스로 쉽게 만들어주면 좋겠다는 바람임
- 이게 진짜 local AI stack의 궁극적 형태에 가까운 요약이라고 느낌. Cursor나 aider 같은 도구에선 강력하고 프라이빗한 memory layer가 늘 부족했다고 느낌. LEANN 처럼 tiny private index + Ollama 로컬 inference 조합은 정말 강력하다는 생각임. 프로그래밍에 이런 조합 쓰는 아이디어가 맘에 들고, 진정 프라이빗한 "Cursor-like" 경험이 실현되면 AI Workflow가 완전히 달라질 것 같음
무료 API를 찾고 있다면 Google Gemini에서는 무료로 Gemini, 특히 gemini-2.5-pro에 thinking 기능 켜고 쓸 수 있음. 제한이 꽤 높아서 벤치마크 중인데 아직 리미트에 도달 못했음. 오픈 가중치 모델인 DeepSeek R1, GPT-OSS도 여러 inference provider나 하드웨어 업체에서 무료 API access를 제공함
- Gemini 2.5 pro 무료 한도는 하루 100건임
  https://ai.google.dev/gemini-api/docs/rate-limits
- 참고로, 이 기능이 민감하지 않은 용도라면 괜찮겠지만 구글은 이런 interaction을 학습에 사용함(유료면 제외)
본문 내용에 생각보다 새로운 정보가 많아서 놀람. 평소엔 옵션을 그리 깊게 파지 않았는데, 이번엔 기사까지 다 읽어보길 잘했다고 느낌. 그리고 HN 댓글들도 실용적인 정보가 많아 모두에게 감사함
OP에게 추천하고 싶은데, Continue.dev, ollama/lmstudio, 로컬에서 모델 돌리는 방법을 꼭 알아보길 바람. 몇몇 모델들은 자동완성에 정말 강하고, 또 gpt-oss 같은 모델은 추론이나 툴 활용도 잘함. 나는 이게 my goto copilot임
- 나도 마찬가지임! VSCode에서 Continue 쓰고 있는데, Qwen 대형 모델들이나 gpt-oss-120b가 agentic 모드에서 꽤 괜찮게 동작함
- continue.dev보다 Zed가 한 단계 더 업그레이드라고 느낌. 거기서는 원하는 모델 직접 사용할 수도 있음
포스트 내용대로, 코딩 에이전트의 문제는 각 요청마다 자기 데이터 + 거의 전체 코드베이스를 다 전송해서 비용이 비쌈. 대신 AI 챗에서는 비용이 사실상 무시해도 될 수준임. 나는 오로지 OpenRouter만 쓰는데, 거의 모든 모델에 접근 가능함. Sonnet이 원래 최애였지만 Gemini 2.5 Pro를 써보니 거의 항상 더 나음(단점은 느림). 간단한 질문이나 문법 기억 안 날 때는 Gemini Flash가 초고속이라서 딱임
누군가는 무료 티어 때문에 이렇게까지 자기 데이터를 내주는 게 놀랍다고 생각하겠지만, 사실 좋은 LLM을 집에서 직접 돌릴 자원이 너무 많이 들어서 그냥 내 코드를 내주고 무료로 쓰는 쪽이 낫다고 봄. 어차피 그 코드는 결국 오픈소스 될 예정임
- 내가 일하는 곳에서 코딩에 모델 쓰는 걸 괜찮게 본다면 내 입장에선 신경 쓸 부분이 아님
"웹 챗에서 AI 사용할 때(즉 ChatGPT, Openrouter 같은 웹 인터페이스)는 IDE나 에이전트 프레임워크보다 문제 해결이나 솔루션 제안에서 거의 항상 더 좋은 결과를 보여줌"이라는 주장에 정말 동의함. IDE에서 코드를 복사해서 웹챗에 붙여넣는 게 다소 불편해 보여도, 내 경험상 Github copilot이나 cursor보다 훨씬 더 낫다는 결과를 얻음
- 완전 정반대 경험임. agentic이든 아니든 가장 중요한 건 context임. agentic으로 프로젝트 전체에 접근하거나, GitHub에 바로 붙이거나, fine-tune, RAG 등 컨텍스트 전체에 접근 가능한 게 환각을 엄청 줄여줌. "x를 써줘"와 "내 스타일, y 의존성, 주변 z 코드까지 반영해서 x를 써줘"는 엄청난 차이가 있음. 솔직히 복붙 AI 코딩을 옹호하는 이유를 이해하지 못함. 그래서 에이전트 방식이 지금 이렇게 폭발적으로 인기라고 생각함

답변달기

AI를 무료 또는 저렴하게 활용하여 개발하는 방법

My Browser Setup: The Free AI Buffet

A smarter, cheaper workflow: Focused Context

How AI Code Prep Helps (Example Prompt Structure)

왜 이 방식이 중요한가?

Model Strategy: Picking the Right Brain for the Job

OpenAI Playground 무료 토큰 활용법

추천 모델별 사용 전략

The Hybrid Approach: Premium Planning + Budget Execution

새 프로젝트 시작 시 워크플로우

핵심 전략

모델별 활용 팁

Alternative Agents & Setups

추천 세팅 2가지

Roo Code: Cline의 클론

신규 CLI 툴: Claude Code, Qwen Code, Gemini CLI

TL;DR: Quickstart Guide

Some Thoughts

Latest Model Updates (Aug 2025)

GPT 4.5

o3

o4-mini

Gemini 2.5 Pro

Deepseek R1 0528

Claude 4 Sonnet

Claude 4 Opus

Solid Worker Models

GPT 4.1

Claude Sonnet 3.5

Deepseek v3

OpenRouter Free Models

Free Claude 4: lmarena.ai, and More

Claude Opus 4 and Sonnet 4

NEW!! Bad ass new Chinese models + GPT 5

GLM 4.5

Qwen3 Coder 480B

Qwen3 Instruct & Thinking 2507

Kimi K2 (Moonshot)

GPT 5

Current Coding Workflow (2025)

For New Projects:

For Problem Solving:

Task List & Test Driven Development (Coming Soon)

Money-Saving Hacks

Coming Soon: Live Reddit Data & Insights

Hacker News 의견