Cursor 사용자들의 선호 언어 모델 TOP 3 및 그 이유
(reddit.com)- gpt-4.1은 신중하고 충실한 조력자로, 정확한 코드 이해와 보수적 접근에 강점이 있음
- gemini 2.5 pro는 넓은 컨텍스트 처리에 뛰어나고 이미지 분석 기능도 우수하지만, 과잉 수정을 유발할 위험성이 있음
- sonnet 3.5/3.7은 창의적이고 똑똑하지만, 맥락 유지와 일관성이 부족해 장기 대화에서 흔들림이 있음
- grok-3-beta는 느리지만 디자인 시각화와 복잡한 문제 해결에서 탁월한 잠재력을 보임
- 사용자들은 작업 흐름에 따라 모델을 분리하여 사용하며, 디버깅 실패 시 체크포인트 복원 및 모델 전환 전략을 선호함
gpt-4.1
- 지능적이고 신뢰도 높은 보조자처럼 행동함
- 성급히 판단하지 않고, 요청을 따르되 과도한 수정은 하지 않음
- 개발자의 연장선처럼 느껴지는 모델로, 경험 많은 개발자에게 특히 적합함
gemini 2.5 pro
- 긴 콘솔 로그, 전체 코드 파일 등 넓은 문맥을 활용할 때 강력함
- 이미지 분석 능력 탁월, 시각적 오류 포착 가능
- 단점은 지나치게 자율적으로 동작해 불필요한 코드 삭제 또는 과잉 수정을 일으킬 수 있음
- 주의 깊은 제어가 필요함
sonnet 3.5 / 3.7
- 3.7은 창의적이고 똑똑하지만, 장기 대화에서 맥락을 잃거나 지시를 무시하는 경우 있음
- 3.5는 단일 파일 기반의 코드 이해 및 수정에 강함
- Cursor와의 통합이 과도기적 문제로 일관성 있는 성능을 보여주지 못하고 있음
기타 의견 및 전략
- grok-3-beta는 느리지만 다른 모델이 실패한 문제를 해결하는 데 유용함
- 한 유저는 다음과 같은 모델 분업 전략을 사용 중:
- o3/4-mini: 계획 정리 및 마크다운 기반 사유 정리
- gemini 2.5 pro: 전체 파일 기반 문제 분석 및 기능 호출용
-
sonnet 3.5:
cmd+k
기반 단일 파일 수정용
Reddit 커뮤니티 반응
모델 활용 방식
- o3/4-mini: 기획 및 마크다운 기반 정리, 더 나은 reasoning과 대화 적합성을 보임 (Masony817, scragz, Princekid1878)
-
gemini 2.5 pro:
- 에이전트 모드 또는 긴 컨텍스트 기반 기능 호출에 유용 (Masony817, computerlegs)
- 복잡한 프로젝트에서 코드 전체를 조망하고 판단하는 데 강력 (WorryBubbly3438)
- 검색, 크로스 체크, 전처리 역할로 좋음 (computerlegs)
- sonnet 3.5: 단일 파일 이해 및 수정에 강점, cmd+k 단축키용으로 적합 (Masony817)
-
sonnet 3.7:
- 더 창의적이며 3.5보다 뛰어나지만 긴 대화에서 흐름 잃는 문제 있음 (Sea_Cardiologist_212)
- 최신 커트오프 데이터 반영과 사고력에서 뛰어남 (yairEO)
- 컨텍스트 윈도우 잘 다루면 안정적 (computerlegs)
- Claude 3.7: Cursor 환경에서는 안정적이고 꾸준함 (cmndr_spanky)
-
gpt-4.1:
- 단순 반복 작업이나 구조화된 작업에 적합 (Princekid1878, ILikeBubblyWater)
- 설명 없이 과도하게 변경하는 경향 있음 (ILikeBubblyWater)
- Deepseek R1: 특정 문제에서 의외로 다른 모델보다 잘 작동함 (Leather_Science_7911)
사용 전략 및 워크플로우
- 모델별 역할 분담 후 상황에 따라 전환 (복수 의견)
- cmd+k: sonnet 3.5로 단일 파일 처리 (Masony817)
- 에이전트 모드는 초기 설정 후에는 비활용, 대신 체크포인트 기능과 명확한 프롬프트 사용 (WorryBubbly3438)
- Auto mode 선호: 빠르고 저비용으로 실행 가능 (Funny-Anything-791, d0RSI)
- 기계적 접근법: CNC 기계처럼 명시적이고 정밀한 지시가 중요 (Funny-Anything-791)
- UI 및 디자인 테스트 특화 모델은 아직 미흡 (Princekid1878)
기타 의견
- Sonnet 3.7은 이전보다 집중력과 맥락 유지가 떨어졌다는 불만 (Sea_Cardiologist_212)
- Gemini나 Claude는 테스트 영상에서는 좋아 보이나 실제 환경에서는 다름 (cmndr_spanky)
- 대부분의 모델은 명시적 프롬프트가 핵심 (공통된 언급)
- 일부 사용자는 crypto나 Web 기반 통합을 기대 (간접적으로 언급됨)