23P by neo 2일전 | ★ favorite | 댓글 5개
  • gpt-4.1은 신중하고 충실한 조력자로, 정확한 코드 이해와 보수적 접근에 강점이 있음
  • gemini 2.5 pro넓은 컨텍스트 처리에 뛰어나고 이미지 분석 기능도 우수하지만, 과잉 수정을 유발할 위험성이 있음
  • sonnet 3.5/3.7창의적이고 똑똑하지만, 맥락 유지와 일관성이 부족해 장기 대화에서 흔들림이 있음
  • grok-3-beta는 느리지만 디자인 시각화와 복잡한 문제 해결에서 탁월한 잠재력을 보임
  • 사용자들은 작업 흐름에 따라 모델을 분리하여 사용하며, 디버깅 실패 시 체크포인트 복원 및 모델 전환 전략을 선호함

gpt-4.1

  • 지능적이고 신뢰도 높은 보조자처럼 행동함
  • 성급히 판단하지 않고, 요청을 따르되 과도한 수정은 하지 않음
  • 개발자의 연장선처럼 느껴지는 모델로, 경험 많은 개발자에게 특히 적합함

gemini 2.5 pro

  • 긴 콘솔 로그, 전체 코드 파일 등 넓은 문맥을 활용할 때 강력함
  • 이미지 분석 능력 탁월, 시각적 오류 포착 가능
  • 단점은 지나치게 자율적으로 동작해 불필요한 코드 삭제 또는 과잉 수정을 일으킬 수 있음
  • 주의 깊은 제어가 필요함

sonnet 3.5 / 3.7

  • 3.7은 창의적이고 똑똑하지만, 장기 대화에서 맥락을 잃거나 지시를 무시하는 경우 있음
  • 3.5는 단일 파일 기반의 코드 이해 및 수정에 강함
  • Cursor와의 통합이 과도기적 문제로 일관성 있는 성능을 보여주지 못하고 있음

기타 의견 및 전략

  • grok-3-beta는 느리지만 다른 모델이 실패한 문제를 해결하는 데 유용함
  • 한 유저는 다음과 같은 모델 분업 전략을 사용 중:
    • o3/4-mini: 계획 정리 및 마크다운 기반 사유 정리
    • gemini 2.5 pro: 전체 파일 기반 문제 분석 및 기능 호출용
    • sonnet 3.5: cmd+k 기반 단일 파일 수정용

제미나이 2.5프로가 go lang에 한해서는 최강이라고 단언할수 있습니다

재니마이가 속도는 가장빨라서 질의 응답용으로 추천합니다.

소넷만 주로 사용했는데
본문에 있는거 많이 공감되네요
4.1도 써봐야겠습니다

Reddit 커뮤니티 반응

모델 활용 방식

  • o3/4-mini: 기획 및 마크다운 기반 정리, 더 나은 reasoning과 대화 적합성을 보임 (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • 에이전트 모드 또는 긴 컨텍스트 기반 기능 호출에 유용 (Masony817, computerlegs)
    • 복잡한 프로젝트에서 코드 전체를 조망하고 판단하는 데 강력 (WorryBubbly3438)
    • 검색, 크로스 체크, 전처리 역할로 좋음 (computerlegs)
  • sonnet 3.5: 단일 파일 이해 및 수정에 강점, cmd+k 단축키용으로 적합 (Masony817)
  • sonnet 3.7:
    • 더 창의적이며 3.5보다 뛰어나지만 긴 대화에서 흐름 잃는 문제 있음 (Sea_Cardiologist_212)
    • 최신 커트오프 데이터 반영과 사고력에서 뛰어남 (yairEO)
    • 컨텍스트 윈도우 잘 다루면 안정적 (computerlegs)
  • Claude 3.7: Cursor 환경에서는 안정적이고 꾸준함 (cmndr_spanky)
  • gpt-4.1:
    • 단순 반복 작업이나 구조화된 작업에 적합 (Princekid1878, ILikeBubblyWater)
    • 설명 없이 과도하게 변경하는 경향 있음 (ILikeBubblyWater)
  • Deepseek R1: 특정 문제에서 의외로 다른 모델보다 잘 작동함 (Leather_Science_7911)

사용 전략 및 워크플로우

  • 모델별 역할 분담 후 상황에 따라 전환 (복수 의견)
  • cmd+k: sonnet 3.5로 단일 파일 처리 (Masony817)
  • 에이전트 모드는 초기 설정 후에는 비활용, 대신 체크포인트 기능과 명확한 프롬프트 사용 (WorryBubbly3438)
  • Auto mode 선호: 빠르고 저비용으로 실행 가능 (Funny-Anything-791, d0RSI)
  • 기계적 접근법: CNC 기계처럼 명시적이고 정밀한 지시가 중요 (Funny-Anything-791)
  • UI 및 디자인 테스트 특화 모델은 아직 미흡 (Princekid1878)

기타 의견

  • Sonnet 3.7은 이전보다 집중력과 맥락 유지가 떨어졌다는 불만 (Sea_Cardiologist_212)
  • Gemini나 Claude는 테스트 영상에서는 좋아 보이나 실제 환경에서는 다름 (cmndr_spanky)
  • 대부분의 모델은 명시적 프롬프트가 핵심 (공통된 언급)
  • 일부 사용자는 crypto나 Web 기반 통합을 기대 (간접적으로 언급됨)

제 느낌하고 비슷하네요. sonnet은 사용할 수록 불안했고, chatgpt 4.1은 주문을 하고도 일단은 마음이 놓이는 편입니다.

Grok에 대한 의견도 공감이 가는 바이지만 ide내에서 보다는 채팅상에서 침착히 확인할 때 많이 사용하는 편입니다