# AI를 무료 또는 저렴하게 활용하여 개발하는 방법

> Clean Markdown view of GeekNews topic #22437. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=22437](https://news.hada.io/topic?id=22437)
- GeekNews Markdown: [https://news.hada.io/topic/22437.md](https://news.hada.io/topic/22437.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2025-08-10T17:33:35+09:00
- Updated: 2025-08-10T17:33:35+09:00
- Original source: [wuu73.org](https://wuu73.org/blog/aiguide1.html)
- Points: 34
- Comments: 1

## Summary

여러 **고성능 AI 모델**을 무료 또는 저렴하게 혼합해 개발 효율을 극대화하는 **하이브리드 전략**이 주목받고 있습니다. 모델별 **강점에 따라 문제 해결, 기획, 코드 작성 단계를 분리**해 업무의 정확성과 비용 효율성을 높이며, **AI Code Prep GUI** 등 도구를 활용해 불필요한 컨텍스트를 줄여 AI의 집중도를 강화합니다. 또한 **OpenAI 데이터 공유**, **무료 웹 챗 플랫폼**, **저가형 API** 등을 적절히 조합하면, **최신·고성능 언어모델**을 대량으로 저비용 활용할 수 있어 스타트업·개발자에게 실질적인 비용 절감과 생산성 향상을 제공합니다. 모델 선택과 워크플로우 설계의 최적화를 통해, 복잡한 프로젝트도 빠르고 안전하게 수행할 수 있다는 점이 핵심입니다.

## Topic Body

- 여러 **무료 웹 AI 모델**을 병행해 문제 해결과 코드 생성을 분리하고, 모델별 강점을 살리는 **하이브리드 전략** 활용  
- **AI Code Prep GUI**로 필요한 코드만 선별·정리해 불필요한 맥락으로 인한 성능 저하 방지, **핵심 컨텍스트만 AI에 제공**  
- 기획·디버깅은 **고성능/무료 모델**(Gemini 2.5 Pro, o3, o4-mini, Claude 4 등)로, **실행·코드 작성**은 **GPT-4.1·Claude 3.5**로 수행  
- **OpenAI 데이터 공유**, **GitHub Copilot**, **Poe.com**, **OpenRouter** 등으로 **무료·저렴한 토큰** 확보해 **비용 최소화**  
- Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE 등 다양한 **에이전트·CLI 도구**를 상황별로 조합해 **작업 효율** 향상  
  
  
---  
### My Browser Setup: The Free AI Buffet  
  
* 브라우저에 다양한 강력한 AI 모델의 무료 버전을 여러 탭으로 열어 두고 사용함  
* 한 가지 모델에만 의존하지 않고, 여러 관점에서 답변을 얻는 방식임. 대표적으로 사용하는 무료 모델 조합은 다음과 같음.  
  
- **[GLM 4.5](https://chat.z.ai/)**: 웹에서 무료로 사용 가능하며, 체감상 Claude 4 수준 또는 그 이상으로 성능이 좋음. 항상 2~3개의 탭을 열어둠  
- **[Kimi K2](https://kimi.com/)**: Claude 또는 Opus 계열과 유사한 모델로, 웹에서 무료로 이용 가능. 보통 1~2개 탭을 열며, GLM 4.5 등장 전에는 하루에도 여러 번 까다로운 버그를 해결해줌  
- **[Qwen3 Coder 및 신형 모델들](https://chat.qwen.ai/)**: 다양한 코딩 특화 모델 테스트용으로 사용  
- **[OpenAI Playground](https://platform.openai.com/playground/prompts?models=o3)**: GPT-4.5, o3 등 다양한 모델을 무료로 활용 가능. 계정 데이터 설정에서 "OpenAI가 데이터를 모델 학습에 사용"하도록 허용하면 무료 토큰이 지급됨  
- **[Google Gemini AI Studio](https://aistudio.google.com/)**: Gemini 2.5 Pro/Flash 모델을 무료·무제한에 가깝게 사용 가능. 보통 1~3개의 탭을 열어둠  
- **[Google Gemini 2.5 Pro](https://gemini.google.com/app)**: AI Studio와는 별개 서비스로, 이미지 생성과 심층 연구 기능이 더 뛰어남. AI Studio와 함께 탭을 병행 사용  
- **[Poe.com](https://poe.com/)**: Claude 4나 o4-mini 등 프리미엄 모델에 대해 일일 무료 크레딧 제공  
- **[OpenRouter](https://openrouter.ai/)**: 무료 및 유료 모델 혼합 사용 가능. 여러 모델을 각각 다른 탭에 세팅해둠  
- **[ChatGPT](https://chatgpt.com/)**: 무료 버전도 여전히 유용해 최소 1개 탭 유지  
- **[Perplexity AI](https://www.perplexity.ai/)**: 리서치 중심 질문에 강점  
- **[Deepseek](https://chat.deepseek.com/)**: v3와 r1 모델 무료 제공. 단, 컨텍스트 제한 주의  
- **[Grok.com](https://grok.com/)**: 일반적 사용과 심층 연구, 이미지 편집에 무제한 무료 제공. 특히 심층 연구 기능이 Perplexity와 유사해 유용  
- **[Phind](https://phind.com/)**: 답변 시 플로우차트나 다이어그램을 함께 제공하려는 시도를 함  
- **[lmarena.ai](https://lmarena.ai/)**: Claude Opus 4와 Sonnet 4를 무료로 제공. Opus 4 무료 사용은 상당히 가치가 높음  
  
[Claude.ai](https://claude.ai/new) 자체도 무료지만, 사용 제한이 잦아 불편할 수 있어 Cody 확장이나 Copilot 등을 통해 다른 접근 방식을 사용함.  
  
> **주의 사항 – Grok 사용 시**  
> [Grok](https://grok.com/)은 무료 연산과 검열되지 않은 이미지 생성을 제공하여 다른 모델의 안전 시스템이 방해될 때 유용할 수 있음. 그러나 운영자가 나치 연관 사상이나 허위정보를 홍보하려는 의도를 가질 가능성이 있다는 보고가 있음. 특히 아프리카 집단 학살 등 역사적 사건에 대해 거짓 정보를 제공하도록 지시받았다는 주장도 있음. 이러한 왜곡은 주로 X 플랫폼에서 나타나지만, 코딩 같은 안전한 용도에만 제한적으로 활용하거나, 잠재적 편향을 염두에 두고 사용하는 것이 권장됨.  
  
### A smarter, cheaper workflow: Focused Context  
  
- 웹 기반 AI 채팅 인터페이스(AI Studio, ChatGPT, OpenRouter 등)를 사용할 때, IDE나 에이전트 프레임워크(Cline, Trae, Copilot 등)보다 문제 해결이나 솔루션 제안이 더 뛰어난 경우가 많음  
- Cursor, Cline, Roo Code와 같은 도구로 모든 작업을 처리하면, MCP 서버 사용법이나 파일 편집 절차 등 문제와 직접 관련 없는 대량의 텍스트를 AI에 전송하게 되어, AI가 혼란스러워지고 성능이 떨어짐  
- 이로 인해 최고가 모델을 사용하더라도 불필요한 정보로 인한 ‘둔화 효과’를 극복하지 못함  
  
* 그래서, 문제 해결에 필요한 정확한 컨텍스트를 직접 생성해 웹 기반 AI 채팅에 붙여넣고 질문하거나 코드 리뷰를 요청하는 방식으로 접근함  
* 해결책이 나오면, 해당 내용을 Cline 등의 에이전트용 프롬프트로 작성해 파일 편집만 맡김  
* 이렇게 하면 GPT-4.1(무제한 사용 가능)을 활용해 저렴하게 문제 해결과 기획이 가능하며, 굳이 Claude 크레딧을 소모할 필요가 없음  
* 어려운 문제 해결에는 Claude를, 실행에는 웹 채팅 AI를 병행해 효율성을 높임  
  
- ## How AI Code Prep Helps (Example Prompt Structure)  
  예시 프롬프트:  
  ```  
  Can you help me figure out why my program does x instead of y?  
  ```  
  
  - **[AI Code Prep GUI](https://wuu73.org/aicp)** 는 프로젝트 폴더를 재귀적으로 스캔하여 하위 폴더·파일까지 모두 탐색 후, AI가 보기 좋은 형식으로 코드와 질문을 정리함  
  - 생성된 컨텍스트 예시:  
  ```  
  Can you help me figure out why my program does x instead of y?  
  
  fileName.js: &lt;code&gt;  
  ... 파일 내용 ... &lt;/code&gt;  
  
  nextFile.py: &lt;code&gt;  
  import example  
  ... 기타 내용 ... &lt;/code&gt;  
  
  Can you help me figure out why my program does x instead of y?  
  ```  
  - 질문을 두 번 반복(상단/하단/양쪽 선택 가능)해 AI가 포커스를 유지하도록 함  
  - Windows에서는 프로젝트 폴더 내부에서 마우스 우클릭 → "AI Code Prep GUI" 실행 → 자동으로 코드 파일을 선택하며, `node_modules`, `.git` 등 불필요한 디렉토리는 자동 제외  
  - 선택이 완벽하지 않아도 체크박스를 통해 쉽게 조정 가능  
  - 대규모 프로젝트로 AI 컨텍스트 한도를 초과할 때, 꼭 필요한 파일만 선별해 제공 가능  
- ## 왜 이 방식이 중요한가?  
  - Cline, GitHub Copilot, Cursor, Windsurf 등 많은 코드 에이전트는 컨텍스트를 **너무 많이** 보내거나 **너무 적게** 보내서 비효율적  
  - 직접 파일을 선별하면, 불필요한 데이터 없이 필요한 정보만 AI에 제공 가능  
  - GUI 기반이라 CLI나 공개 GitHub 링크를 요구하는 다른 컨텍스트 생성 도구보다 **개인 코드 보안 유지**와 **편리성**이 뛰어남  
  - 최신 기능 업데이트는 [wuu73.org/aicp](https://wuu73.org/aicp) 참고  
  
### Model Strategy: Picking the Right Brain for the Job  
- 많은 강력한 AI 모델들이 웹 인터페이스를 통해 무료로 제공되므로([Gemini in AI Studio](https://aistudio.google.com/), [Grok](https://grok.com/), [Deepseek](https://chat.deepseek.com/) 등), 이를 우선적으로 활용함  
- [Poe.com](https://poe.com/)은 Claude 및 새로운 o4 시리즈 같은 최상위 모델에 대해 무료 일일 크레딧을 제공  
  
* **Gemini 2.5 Pro** ([AI Studio](https://aistudio.google.com/) 제공)는 디버깅, 기획, 전반적인 작업에서 매우 뛰어나 현재 가장 다재다능한 모델로 평가됨  
* 까다로운 문제에는 **o4-mini**([OpenRouter](https://openrouter.ai/) 또는 [Poe](https://poe.com/)에서 사용 가능)를 시도  
  - 이전 최상위 모델(Claude 3.5/3.7/4)보다 API 사용 시 비용이 훨씬 저렴  
  - 해결이 어려웠던 버그를 즉시 해결한 경험이 있음  
* **Claude 3.7 또는 4**는 [Poe](https://poe.com/), API([OpenRouter](https://openrouter.ai/)), GitHub Copilot Chat 등을 통해 접근 가능  
  - 무료 사용량이 일부 제공되지만, 잦은 사용에는 비용 부담이 큼  
  - 3.7/4는 창의적이고 폭발적인 출력(‘Hunter S. Thompson’ 스타일)을 제공하지만, 실제 코딩은 차분한 **Claude 3.5**에 맡기는 것이 효율적일 수 있음  
- ## OpenAI Playground 무료 토큰 활용법  
  - OpenAI 계정의 데이터 공유 설정을 활성화하면 매일 대량의 무료 토큰을 사용 가능  
  - [OpenAI Playground](https://platform.openai.com/playground/prompts?models=o3) → 우측 상단 설정 아이콘 → 왼쪽 메뉴 **Data Controls** → **Sharing**에서 **"Share inputs and outputs with OpenAI"** 를 활성화하면 다음 혜택 제공:  
  - **하루 최대 25만 토큰**: gpt-5, gpt-4.1, gpt-4o, o1, o3  
  - **하루 최대 250만 토큰**: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest  
  - 이 설정을 활용하면 **o3**와 **GPT-4.5** 같은 최상위 모델을 무료로 다량 사용 가능  
  - OpenAI Playground에서 **o3**와 **o4-mini**를 나란히 실행해 비교하면서 각 모델의 강점과 용도를 파악할 수 있음.  
- ## 추천 모델별 사용 전략  
  - **Gemini 2.5 Pro**: 디버깅, 기획, 전반적인 코딩 작업에서 최우선  
  - **o4-mini**: 까다로운 버그 해결, 비용 효율 우수  
  - **Claude 4 / 3.7**: 긴급하고 어려운 문제 해결에 최적, 다만 접근성·비용이 제한적  
  - **Claude 3.5**: 3.7/4의 창의적 산출물을 정제하거나 실제 코드 작성에 적합  
  - **o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5**: 복잡한 문제 해결 능력이 매우 뛰어나며, 무료 토큰 설정 활용 시 대량 사용 가능  
  
### The Hybrid Approach: Premium Planning + Budget Execution  
  
- 다양한 모델을 테스트한 결과, 품질과 비용 효율을 모두 극대화할 수 있는 하이브리드 전략을 개발함  
- 핵심 인사이트는 **모델마다 개발 과정의 특정 단계에서 강점이 다르다**는 점  
  
> **"스마트 주스(Smart Juice)" 이론 – AI가 멍청해지는 이유**  
> 모델이 받을 수 있는 ‘지능 에너지’는 한정돼 있음.  
> 간결하고 집중된 프롬프트를 보내면 그 에너지의 거의 100%가 문제 해결에 사용됨.  
> 하지만 불필요하게 복잡한 입력(툴 사용법 장문 설명, 문제와 무관한 맥락, 수 페이지의 코드 등)을 보내면 상당 부분이 이를 처리하는 데 소모돼, 실제 문제 해결에 쓸 ‘지능’이 줄어듦.  
>  
> 예: Cursor, Cline 같은 IDE 연동형 에이전트는 질문 전에 수많은 지시문과 컨텍스트를 보내므로 모델의 집중도가 떨어짐.  
> 따라서 **불필요한 맥락을 줄이고, 문제 해결에 필요한 핵심만 보내는 것**이 최적의 결과를 내는 방법임.  
  
- ## **새 프로젝트 시작 시 워크플로우**  
  - 1\. **Plan & Brainstorm**  
    - 스마트하고 무료인 웹 모델(Gemini 2.5, o4-mini, Claude 3.7/4, o3 등)로 접근 방식 설계, 단계별 계획 수립, 필요한 라이브러리 식별.  
  - 2\. **Generate Agent Prompt**  
    - 위 모델 중 하나에 요청:  
      `"Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [작업 설명]"`  
    - 생성된 프롬프트를 [ChatGPT](https://chatgpt.com/) 같은 재작성에 능한 무료 AI로 한 번 더 다듬음.  
  - 3\. **Execute with Cline**  
    - 다듬은 프롬프트를 [Cline](https://cline.bot/)에 붙여넣고, **GPT 4.1** 또는 **Claude 3.5**(복잡한 작업일 경우 Claude 4)로 실행.  
    - GPT 4.1 계열은 지시사항 준수 훈련이 잘 돼 있음.  
  - 4\. **Fallback**  
    - GPT 4.1이 실패하면 API를 통해 Claude 3.5로 전환.  
    - [Deepseek v3 또는 R1](https://chat.deepseek.com/)도 지시사항 수행에 매우 강함.  
- ## **핵심 전략**  
  - **비싸고 스마트한 모델**(또는 무료로 사용 가능한 **Gemini 2.5 Pro**)로 전략과 설계 단계 진행.  
  - 계획을 2~3개의 다른 무료 모델([Deepseek R1](https://chat.deepseek.com/), [Poe](https://poe.com/)의 Claude 등)에 붙여넣어 검증:  
    `"Is this good? Can you improve it or find flaws?"`  
  - **코딩·실행 단계**는 안정적이고 효율적인 모델(GPT 4.1, Claude 3.5)을 [Cline](https://cline.bot/)에서 사용.  
- ## **모델별 활용 팁**  
  - **o4-mini**  
    - 복잡한 코드 로직 해석, 프레임워크·라이브러리 선택 등 **고레벨 구현 전략**에 강함.  
  - **아이디어 브레인스토밍**  
    - Gemini 2.5, o4-mini, GPT 4.1, [ChatGPT](https://chatgpt.com/), o3-mini([duck.ai](https://duckduckgo.com/chat)에서 종종 무료), [Phind](https://phind.com/) 등을 활용.  
  - **해결 불가 시**  
    - 무료/저가 모델에서 해결 실패하면 API로 고급·유료 모델로 escalatation.  
  
### Alternative Agents & Setups  
  
- [Trae.ai](https://trae.ai/) (Bytedance, TikTok 제작사)  
  - VS Code 호환 IDE, **무료 AI 사용** 제공: Claude 4, Claude 3.7, Claude 3.5, GPT 4.1 포함.  
  - 내장 에이전트 성능은 [Cline](https://cline.bot/)보다 떨어짐(솔직히 Cline이 최강).  
  - VS Code 클론 형태라 [Cline](https://cline.bot/) 확장 설치 가능할 것으로 보임.  
  - 하지만 **서버 과부하로 속도 느림** → 무료 사용 실효성 낮음.  
  - 그래도 무료 모델 접근성이 있어 언급.  
- ## **추천 세팅 2가지**  
  - 1\. **VS Code + [Cline](https://cline.bot/) + [Copilot](https://github.com/features/copilot)**  
    - Copilot 월 $10 구독 → Cline에서 저렴하게 강력 모델 API 사용 가능.  
    - 무료 티어도 일부 기본 기능 가능.  
  - 2\. **[Trae.ai](https://trae.ai/) + [Cline](https://cline.bot/)**  
    - Trae의 무료 모델 접근 + Cline API 키 사용 병행 가능 여부 테스트.  
  > **팁**: Copilot 기본 에이전트가 Cline이 잘 못하는 문제를 해결하는 경우도 있고, 반대도 있음.  
  > Cline이 과도하게 긴 프롬프트를 보내 성능이 떨어질 수 있음 → Copilot이 유리한 경우 존재.  
- ## **Roo Code: Cline의 클론**  
  - **Roo Code**는 Cline과 거의 동일하지만 일부 다른 기능 제공.  
  - 프로젝트나 코딩 스타일에 따라 Roo Code가 더 나을 수 있음.  
  - [Cline](https://cline.bot/) 자체는 무료지만 API 호출 요금 발생.  
  - 가장 경제적인 방법: VS Code LM API 설정 + Copilot 월 $10 구독 → 거의 무제한 강력 모델 사용.  
- ## **신규 CLI 툴: Claude Code, Qwen Code, Gemini CLI**  
  - 최근 CLI 기반 코딩 툴 관심 급증.  
  - **Claude Code**: 서브에이전트(subagent) 지원 → 하나의 작업만 수행, 추가 도구 사용 안 함.  
    - 이 가이드에서 설명한 **‘스마트 주스’ 집중형 워크플로우**를 재현 가능.  
    - 불필요한 에이전트 지시문(bloat) 제거, 효율성 유지.  
  - **Qwen Code**, **Gemini CLI**도 각각 장점 존재.  
  - Claude Code를 **GLM 4.5**로 사용하는 설정 가이드가 [z.ai](https://chat.z.ai/) 사이트에 있음.  
  - 각 CLI 툴은 서로 다른 강점이 있어, 가이드·커뮤니티 팁 참고해 실험 추천.  
  
### TL;DR: Quickstart Guide  
  
- **Models & Roles**  
  - **Planning & Brainstorming**  
    GLM 4.5, Kimi K2, 최신 Qwen3 Coder & 2507 시리즈, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), OpenAI Playground에서 하루 25만 무료 토큰(o3, GPT-5) 사용 추천  
  - **Problem Solving & Debugging**  
    GPT-5(Playground 무료 토큰), GLM-4.5(Claude 4 수준의 성능), Claude 4(Poe 무료 일일 토큰)  
  - **Actual Coding**  
    GPT-4.1(Cline), 실패 시 Claude 3.5 대체, 또는 Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2 사용  
- **Key Tools**  
  - VS Code  
  - **AI Code Prep GUI** – 로컬에서 필요한 파일만 스캔·선별, AI 컨텍스트 최적화  
  - **Cline** (VS Code 에이전트) – 단계별 코드 실행  
  - **무료 웹 챗** – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai  
- **Quick Workflow**  
  1. **AI Code Prep GUI**로 프로젝트 관련 파일 번들링  
  2. 해당 컨텍스트를 선호하는 웹 챗 모델에 붙여넣어 계획·디버깅  
  3. 한 모델에 `"이 작업을 위한 상세 Cline 프롬프트 작성"` 요청 후 ChatGPT 등에서 재정제  
  4. 완성된 프롬프트를 GPT-4.1로 설정한 Cline에 붙여넣어 코드 생성·수정  
     → 실패 시 Claude 3.5로 전환  
- **Cost-Saving Hacks**  
  - **OpenAI Playground “데이터 공유” 활성화** → 하루 25만 무료 토큰(GPT-4.5, o3) + 하루 250만 무료 토큰(o4-mini, o3-mini)  
  - **GitHub Copilot 월 $10 구독** → Cline에서 Claude 모델 제한적 사용 가능  
  - **OpenRouter 종량제** → o4-mini, Claude 3.7 등 최신 모델 저렴하게 사용  
  
### Some Thoughts  
  
- AI는 놀라운 생산성 증폭기이지만, 마법 지팡이는 아닙니다.  
- 진정한 마법은 여러분의 **호기심**, **끈기**, 그리고 **실험하려는 의지**가 이 강력한 도구들과 결합될 때 일어납니다.  
- 버그나 문제로 좌절하지 마세요 — 모든 도전은 새로운 것을 배울 기회입니다.  
  
* 모델을 섞어 쓰고, 대담한 아이디어를 시도하며, 부수고 다시 만드는 것을 두려워하지 마세요.  
* 최고의 개발자는 결코 막히지 않는 사람이 아니라, 막혀도 계속 앞으로 나아가며 모든 도구와 기술을 활용하는 사람입니다.  
  
- 혼돈을 받아들이고, 과정을 즐기며, **여러분의 창의성**이 길을 이끌도록 하세요!  
  
---  
  
### Latest Model Updates (Aug 2025)  
  
💰 **Budget-Conscious: Getting Max Value**  
  
- ## GPT 4.5  
  - **Status:** Discontinued  
- ## o3  
  - **능력:** Claude 4에 필적하는 성능, 어려운 문제 해결에 탁월, 천재급  
  - **활용 팁:** [AI Code Prep GUI](https://wuu73.org/aicp)로 전체 코드베이스를 넣어 분석 가능  
  - **Free Tokens:** [Data Controls/Sharing settings](https://platform.openai.com/settings/organization/data-controls/sharing)에서 데이터 공유 활성화 시 **250k 토큰/일**  
- ## o4-mini  
  - **능력:** o3보다는 약간 떨어지지만 매우 뛰어난 성능, 마치 o3의 동생 같은 모델  
  - **Free Tokens:** 데이터 공유 활성화 시 **2.5M 토큰/일**  
- ## Gemini 2.5 Pro  
  - **이용:** [AI Studio](https://aistudio.google.com/)에서 무료  
  - **특화:** 복잡한 디버깅, 아키텍처 설계 및 계획  
- ## Deepseek R1 0528  
  - **능력:** 향상된 추론 성능을 갖춘 매우 똑똑한 모델  
  - **이용:** Deepseek 웹 인터페이스에서 무료 사용 가능  
  
🚀 **Premium: Fix Problems NOW**  
- ## Claude 4 Sonnet  
  - **능력:** 충분한 컨텍스트를 제공하면 대부분의 문제를 한 번에 해결  
  - **특화:** 글쓰기, 문제 해결 등 전반적으로 최고의 성능  
  - **활용:** 꼭 첫 시도에서 완벽히 해결해야 할 때  
- ## Claude 4 Opus  
  - **가격:** $75 / 1M 토큰  
  - **성능:** Sonnet보다 더 뛰어나다고 알려진 “매직 소스”급 성능  
  - **활용:** 궁극의 문제 해결이 필요할 때  
  
### Solid Worker Models  
  
다음 모델들은 지시를 잘 따르고 안정적으로 작업을 수행함:  
- ## GPT 4.1  
  - 상위 스마트 모델로 설계·문제 해결 후, 실제 코드 수정에 사용  
  - 어디서든 받은 출력물을 그대로 Cline에 붙여서 실행 가능  
- ## Claude Sonnet 3.5  
  - 코딩과 편집에 강점  
  - 4.1보다 약간 느리지만 매우 안정적  
- ## Deepseek v3  
  - 코드 작성·수정·에이전트 작업에 적합  
  - 가격 대비 성능이 뛰어남  
- ## OpenRouter Free Models  
  - [OpenRouter](https://openrouter.ai/)에서 가격 필터를 `$0`로 설정해 무료 모델 탐색  
  - 새로운 모델이 등장하면 실험할 가치 있음  
  
### Free Claude 4: lmarena.ai, and More  
  
###### Claude Opus 4 and Sonnet 4  
- [lmarena.ai](https://lmarena.ai/)에서 Claude Opus 4, Sonnet 4 등 무료 제공  
- **팁:** Anthropic 계열 모델의 무료 사용 기회는 반드시 저장·기억·활용  
- **활용:** 모든 것이 실패하거나, 즉시 완벽하게 작업을 완료해야 할 때 Claude 4 Sonnet 또는 Opus 선택  
  
### NEW!! Bad ass new Chinese models + GPT 5  
  
- ## GLM 4.5  
  - **성능:** Claude 4 Opus 또는 Sonnet과 유사  
  - **특징:** 에이전트 규칙 및 도구 사용을 거의 완벽하게 수행  
  - **활용:** 매우 어려운 버그 수정, 많은 컨텍스트를 요구하는 복잡한 작업 처리에 강함  
- ## Qwen3 Coder 480B  
  - **평가:** 강력하고 저렴해 선호도가 높은 모델  
  - **활용:** 고성능·저비용 환경에서의 코딩 작업  
- ## Qwen3 Instruct & Thinking 2507  
  - **성능:** Qwen3 Coder와 유사한 안정성과 강력함  
  - **장점:** 신뢰할 수 있고 비용 효율적  
- ## Kimi K2 (Moonshot)  
  - **특징:** Anthropic 기반 또는 Claude 유사 합성 데이터로 학습된 듯한 성격  
  - **평가:** 매우 뛰어난 성능, 자주 사용되는 모델  
- ## GPT 5  
  - **제한점:** 커스텀 툴 사용(MCP, Cline 등)에서는 강점이 적음  
  - **추천 사용법:**  
    1\. GPT 5, GLM 4.5 등 최고의 모델로 계획 수립·문제 해결  
    2\. 이후 간단한 에이전트 모델이 실제 편집과 툴 사용을 수행하도록 프롬프트 작성  
  - **비교:**  
    - GPT 4.1은 여전히 비용 대비 가치가 뛰어남  
    - 새로운 중국계 모델들은 커스텀 툴/Cline 사용에 강점  
  - **총평:** 아직 충분히 실험하진 않았지만, 모델마다 잘하는 분야가 다르며, 현재는 가격과 안정성 면에서 중국 모델들이 매우 매력적임  
  
---   
  
### Current Coding Workflow (2025)  
  
- ## For New Projects:  
  - 1\. **Planning Phase:**  
    - 모든 프로젝트 세부사항(언어, 라이브러리, 서버 등)을 노트패드에 기록  
  - 2\. **Multi-Model Consultation:**  
    - 동일 내용을 여러 모델에 붙여넣어 ‘다중 의사 의견’ 얻기:  
      * [Gemini 2.5 Pro](https://aistudio.google.com/) (무료)  
      * GPT 4.1  
      * o4-mini  
      * [Claude 4](https://poe.com/) (Poe의 무료 일일 크레딧 활용)  
  - 3\. **Refinement:**  
    - 모델과의 반복 대화를 통해 세부사항 미세 조정  
  - 4\. **Task Generation:**  
    - 모델에게 Cline AI 코딩 에이전트용 단계별 작업 리스트 작성 요청  
  - 5\. **Execution:**  
    - Cline(또는 Roo Code)에서 GPT 4.1을 ‘act’ 모드로 설정해 작업 실행  
- ## For Problem Solving:  
  - **복잡한 코드베이스 분석:** GPT 4.5 + [AI Code Prep](https://wuu73.org/aicp) 활용  
  - GPT 4.5에 “Cline이 이 작업을 완료하도록 프롬프트를 작성해줘” 요청  
  - 문제 복잡도에 따라 모델 선택  
  - 다양한 모델을 활용해 다각적 해결 방안 모색  
- ## Task List & Test Driven Development (Coming Soon)  
  **Test Driven Development & Task Lists:**  
  - AI에게 Cline, Roo Code, Trae agent 실행용 상세 작업 리스트 작성 요청  
  - Cline 또는 Roo Code가 마크다운 파일에 작업 진행 상황을 기록하고 완료 시 체크하도록 지시 가능  
  - 이를 통해 진행 상황을 쉽게 추적하고 누락 방지 가능  
  - 현재는 모델에게 마크다운 체크리스트를 생성하게 하고, Cline이나 Roo Code에 해당 파일을 업데이트하게 하는 방식으로 실험 가능  
- ## Money-Saving Hacks  
  - **GPT 4.5 & o3:** 모델 학습 데이터 공유를 활성화하면 매일 25만 토큰 무료 제공  
  - **저렴한 모델:** o4-mini, 4.1-mini/nano에서 매일 250만 토큰 사용 가능  
  - **GitHub Copilot:** 월 $10로 새로운 Claude 모델(속도 제한 있음) 사용 가능  
  - **Trae IDE:** 현재 무료로 Claude 4와 GPT 4.1 사용 가능(구독 불필요, 제한 없음으로 보임)  
  - **Poe.com:** 모든 모델에 대해 무료 일일 크레딧 제공  
  - **Web Interfaces:** 무료 웹 채팅 인터페이스를 활용해 계획 수립 및 컨설팅  
- ## Coming Soon: Live Reddit Data & Insights  
  **Live Reddit Data Scraping & Daily Insights:**  
  - Reddit 데이터를 실시간 스크래핑해 매일 업데이트된 AI 모델 사용 사례 제공 예정  
  - 세부 사용 분석, 데이터 시각화, 실제 코딩 워크플로우 및 트렌드에 대한 새로운 인사이트 포함

## Comments


### Comment 42345

- Author: neo
- Created: 2025-08-10T17:33:36+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=44850913) 
* 혹시 헷갈린 분들을 위해 말하자면, 본문에 2, 3페이지가 더 있고, 하단에 있는 화살표 아이콘을 통해 접근 가능함

* 본문 작성자인데, 글꼴 문제는 미안함. 내용이 약간 오래된 편인데 AI 쪽은 워낙 빠르게 바뀌어서 최신 모델을 포함해 업데이트 예정임. 요즘 새 모델이 엄청 자주 나오고, 개인적으로 최근 가장 좋아하는 건 GLM-4.5임. Kimi K2도 괜찮고, Qwen3-Coder 480b나 2507 instruct도 상당히 좋음. 이런 모델들은 어떤 agentic 환경이나 agent tool에서 매우 잘 동작함
  나만의 context helper 앱([https://wuu73.org/aicp](https://wuu73.org/aicp))도 만들었는데, 이 링크에서 접근 가능함. 내가 주로 사용하는 수많은 AI 챗탭들과 IDE 사이를 왕복할 때 아주 편리함(거의 항상 무료고, 최고의 결과도 얻음). 웹 챗 인터페이스 사용할 때 모든 번거로움과 불편함을 최대한 없애려 노력함. 무료이고 피드백이 아주 좋게 들어왔음, 비판적인 의견도 환영함
  IDE <----> 웹 챗탭 간의 이동이 엄청 편리해짐. 원래 내 시간 아끼려고 만든 거고 PySide6 UI라서 웹뷰보다 훨씬 가볍게 동작함. 자주 쓰는 텍스트는 프리셋 버튼으로 바로 추가할 수 있고, 프로젝트별로 창 크기와 사용한 파일 등 컨텍스트 상태도 기억함. 다음에 실행하면 그 상태 그대로 열림
  코드 파일 자동 스캔해서 쓸만한 파일을 추론함. 프롬프트 박스에서 코드 위아래로 텍스트를 넣을 수도 있음(이렇게 하면 출력이 더 좋아지는 경향이 있음). 개인적으로 자주 사용하는 버튼 하나는 "Cline(코딩 에이전트)용 프롬프트 작성, 전체 프롬프트를 하나의 코드 태그로 감싸서 복사/붙여넣기를 쉽게 해달라, 전체 작업을 잘게 쪼개고 상세 설명과 이유까지 제공해서 Cline이 따라할 수 있게 해달라, plain language로 search and replace 블록을 추가해 편집 위치를 지정해달라"로 세팅함
  내가 문제 해결이나 버그 찾기 위해 하는 방식은, VS Code에서 보통 터미널에 aicp 입력해서 앱을 열고 파일 fine-tuning, 내가 원하는 설명이나 고칠 점을 입력, Cline 버튼과 Generate Context! 클릭 후 GLM-4.5에 붙여넣음. 어려운 문제면 o3, o4-mini, GPT-5, Gemini 2.5 Pro 까지 2~3개 모델에 시도함. 가장 합리적인 답을 골라서 Cline(VS Code, GPT 4.1 무제한/프리 버전)에 붙여넣음. 4.1은 엄청 똑똑하진 않지만 명령 수행이 정확함. 큰 모델 특유의 사소한 실수도 스스로 고침. 큰 모델들은 세부 설명, 작업 리스트를 멋지게 써주고, 4.1이 이를 agent mode에서 실행함
  이렇게 하면 무제한 무료로 아주 똑똑한 AI와 코딩할 수 있음. MCP(tool 등)를 모델에 붙이면 성능이 오히려 떨어지고, Claude 4 같은 API 쓰면 돈만 많이 들게 됨

  * 웹사이트 스크롤 속도가 느리고(Firefox Android에서 sub1-fps), grok 관련 call-out은 스크롤 불가함. 상단에는 CSS loaded라는 수상하게 큰 녹색 버튼도 보임

  * [https://wuu73.org/aicp]의 다이어그램이 유용한데, 클릭해도 전체 해상도로 표시되지 않아 흐림. Firefox, Chrome 둘 다 같음. GitHub 레포에선 선명하게 보이니 JS 렌더링 라이브러리 쪽 이슈일 듯함

  * 글 잘 읽었고 업데이트에 감사함. 혹시 Roo Code와 Cline 사용 경험 차이점에 대해 더 깊이 다뤄줄 수 있다면 매우 관심이 있음. 나는 지금까진 Roo Code만 써봤는데, 흥미롭지만 결과가 다소 들쭉날쭉했음

  * Microsoft copilot 써봤는지 궁금함. 사실상 free openai 모델임

  * 무료로 코딩할 수 있다고 했는데, OpenAI 데이터 설정에서 내 데이터가 모델 훈련에 활용되도록 허용하면 그 때만 무료임. 즉, 진짜 "무료"는 아님

* 내 경험도 본문 내용과 일치함. agentic 기능은 진짜 큰 모델에서만 제대로 동작함 ("동작"이라는 게... 예를 들어 OpenAI Codex가 o4-mini로 3줄 고치는데 200번 요청 보내야 했음)
  단순 수정에는 오히려 작은 모델이 훨씬 빠르니까 더 나음. 그래서 "최고"의 모델이 아니라 "쓸 수 있는 한 가장 멍청한 것"으로 집중 중임
  이걸 더 밀어붙여서 agentic 방식을 포기하면 엄청 작은 모델로도 아주 정밀한 작업이 가능함. 원하는 걸 정확하게 알려주면 바로 diff 결과를 줌
  파일 시스템을 뒤지는 방식은 내 스케일엔 비효율적임. 코드베이스 거의 다 컨텍스트에 넣을 수 있어서 src/ 전체를 프롬프트에 던져버림. 다른 사람 프로젝트는 보일러플레이트가 많아서 gpt-oss-20b 같은 초저가 모델로 코드 검색 실험 중인데 그런 용도엔 더 작은 모델도 쓸만함. Patent pending임

  * 나도 같은 생각임. Haiku도 충분히 대화 흐름 관리가 가능하고, 더 복잡한 작업은 Gemini 2.5 Pro나 GPT-5 등 큰 모델에 요청함. 최근엔 Gemini CLI에서 MCP(${codex mcp})로 Codex를 쓰는 실험 중인데 아주 잘 됨. Gemini CLI는 주로 Flash 기반이지만 문제 정의, 답 재평가엔 충분함. Claude Code MCP로 Gemini 2.5 Pro 활용하는 것도 동일함. Claude Code를 MCP 자체로 쓰는 건 잘 안 됨. 이런 방식의 기본 아이디어는 물론 Aider에서 왔고, 메인·보조·에디터 모델을 동시에 쓰는 컨셉임

  * Aider는 agentic이 아닌 코딩 툴로서 효율성과 효과성 둘 다 적절하게 잡아줌. tree-sitter로 repo 맵핑을 만드니 파일 시스템 뒤질 필요가 훨씬 적어짐. MCP는 없지만 셸 커맨드라 내가 잘 아는 유틸도 쓸 수 있음. Cerebras 같은 공급자와 조합하면 프롬프트 처리 속도가 즉각적임. 여러 번 도구 호출 기다리지 않고 계속 개입 가능함. 작은 프로젝트에선 완전 베스트임

  * 나도 점점 비슷한 생각임. 빠르고 신뢰할 수 있는 도구를 원함. flow state 들어가는 게 내겐 중요한데 agentic 코딩 도구 기다리면서 그 흐름이 다 끊김. 그래서 작은 모델, 혹은 Cerebras 같은 프로바이더에 관심이 커짐. 문제 범위를 좁히면 신뢰도도 높아짐. 개인적으로 네가 사용하는 "surgical" 툴에 대한 얘기도 더 듣고 싶음. 이 주제로 최근 [내 블로그 글](https://hpincket.com/what-would-the-vim-of-llm-tooling-look-like.html)에서도 덕분에 여러 가지 생각을 정리함

  * Codex CLI에서 더 이상 GPT-5 이하 모델 교체가 안 됨(API키 없으면), 권장하지 않기 때문이라고 함. thinking=high 옵션으로 돌리면 o4-mini보다 훨씬 성능이 좋고, o4-mini는 사실상 gpt-5-thinking-mini 느낌임. codex에서는 그 설정이 안 되고, gpt-5-thinking-high는 o1이나 o3-pro와 비슷함

  * "(사실상 작동)"... OpenAI Codex가 o4-mini로 3줄의 코드 바꾸는 데 200번 요청한 것에 대해 이야기 했는데, 참고로 내 경험상 실제로 3줄짜리 작업에 며칠을 써본 적도 여럿 있음

* 완전히 local, Cursor 같은 클라우드 필요 없는 스택에 huge potential이 있다고 생각함. 예시로는:
  • agentic/dev 작업용 Cursor CLI([https://x.com/cursor_ai/status/1953559384531050724](https://x.com/cursor_ai/status/1953559384531050724))
  • CLI와 호환되는 로컬 메모리 계층 - LEANN(97% 작은 인덱스, 클라우드 비용 0, 완전 프라이버시, [https://github.com/yichuan-w/LEANN](https://github.com/yichuan-w/LEANN))이나 Milvus(근데 이건 종종 클라우드/토큰 기반으로 쓰게 됨)
  • inference engine 예시로는 Ollama가 있는데, 로컬에서 OSS GPT 모델을 돌리기에 아주 훌륭함
  이런 방식이면 완전히 오프라인이고, 프라이빗하며, 매우 빠른 개인 dev+AI 환경을 만들 수 있음. LEANN 프로젝트는 바로 이런 용도로 설계되어 tiny footprint, 온전한 local 환경 전체 세맨틱 검색, Claude Code/Cursor–호환 out-of-the-box, generation은 ollama로 해결 가능함. 돈 한 푼 안 들고, API도 전혀 필요 없음. 물론 세팅엔 약간 노력 필요함. 하지만 누가 완전히 오픈소스로 쉽게 만들어주면 좋겠다는 바람임

  * 이게 진짜 local AI stack의 궁극적 형태에 가까운 요약이라고 느낌. Cursor나 aider 같은 도구에선 강력하고 프라이빗한 memory layer가 늘 부족했다고 느낌. LEANN 처럼 tiny private index + Ollama 로컬 inference 조합은 정말 강력하다는 생각임. 프로그래밍에 이런 조합 쓰는 아이디어가 맘에 들고, 진정 프라이빗한 "Cursor-like" 경험이 실현되면 AI Workflow가 완전히 달라질 것 같음

* 무료 API를 찾고 있다면 Google Gemini에서는 무료로 Gemini, 특히 gemini-2.5-pro에 thinking 기능 켜고 쓸 수 있음. 제한이 꽤 높아서 벤치마크 중인데 아직 리미트에 도달 못했음. 오픈 가중치 모델인 DeepSeek R1, GPT-OSS도 여러 inference provider나 하드웨어 업체에서 무료 API access를 제공함

  * Gemini 2.5 pro 무료 한도는 하루 100건임  
    [https://ai.google.dev/gemini-api/docs/rate-limits](https://ai.google.dev/gemini-api/docs/rate-limits)

  * 참고로, 이 기능이 민감하지 않은 용도라면 괜찮겠지만 구글은 이런 interaction을 학습에 사용함(유료면 제외)

* 본문 내용에 생각보다 새로운 정보가 많아서 놀람. 평소엔 옵션을 그리 깊게 파지 않았는데, 이번엔 기사까지 다 읽어보길 잘했다고 느낌. 그리고 HN 댓글들도 실용적인 정보가 많아 모두에게 감사함

* OP에게 추천하고 싶은데, Continue.dev, ollama/lmstudio, 로컬에서 모델 돌리는 방법을 꼭 알아보길 바람. 몇몇 모델들은 자동완성에 정말 강하고, 또 gpt-oss 같은 모델은 추론이나 툴 활용도 잘함. 나는 이게 my goto copilot임

  * 나도 마찬가지임! VSCode에서 Continue 쓰고 있는데, Qwen 대형 모델들이나 gpt-oss-120b가 agentic 모드에서 꽤 괜찮게 동작함

  * continue.dev보다 Zed가 한 단계 더 업그레이드라고 느낌. 거기서는 원하는 모델 직접 사용할 수도 있음

* 포스트 내용대로, 코딩 에이전트의 문제는 각 요청마다 자기 데이터 + 거의 전체 코드베이스를 다 전송해서 비용이 비쌈. 대신 AI 챗에서는 비용이 사실상 무시해도 될 수준임. 나는 오로지 OpenRouter만 쓰는데, 거의 모든 모델에 접근 가능함. Sonnet이 원래 최애였지만 Gemini 2.5 Pro를 써보니 거의 항상 더 나음(단점은 느림). 간단한 질문이나 문법 기억 안 날 때는 Gemini Flash가 초고속이라서 딱임

* 누군가는 무료 티어 때문에 이렇게까지 자기 데이터를 내주는 게 놀랍다고 생각하겠지만, 사실 좋은 LLM을 집에서 직접 돌릴 자원이 너무 많이 들어서 그냥 내 코드를 내주고 무료로 쓰는 쪽이 낫다고 봄. 어차피 그 코드는 결국 오픈소스 될 예정임

  * 내가 일하는 곳에서 코딩에 모델 쓰는 걸 괜찮게 본다면 내 입장에선 신경 쓸 부분이 아님

* "웹 챗에서 AI 사용할 때(즉 ChatGPT, Openrouter 같은 웹 인터페이스)는 IDE나 에이전트 프레임워크보다 문제 해결이나 솔루션 제안에서 거의 항상 더 좋은 결과를 보여줌"이라는 주장에 정말 동의함. IDE에서 코드를 복사해서 웹챗에 붙여넣는 게 다소 불편해 보여도, 내 경험상 Github copilot이나 cursor보다 훨씬 더 낫다는 결과를 얻음

  * 완전 정반대 경험임. agentic이든 아니든 가장 중요한 건 context임. agentic으로 프로젝트 전체에 접근하거나, GitHub에 바로 붙이거나, fine-tune, RAG 등 컨텍스트 전체에 접근 가능한 게 환각을 엄청 줄여줌. "x를 써줘"와 "내 스타일, y 의존성, 주변 z 코드까지 반영해서 x를 써줘"는 엄청난 차이가 있음. 솔직히 복붙 AI 코딩을 옹호하는 이유를 이해하지 못함. 그래서 에이전트 방식이 지금 이렇게 폭발적으로 인기라고 생각함