32P by neo 14일전 | ★ favorite | 댓글 5개
  • gpt-4.1은 신중하고 충실한 조력자로, 정확한 코드 이해와 보수적 접근에 강점이 있음
  • gemini 2.5 pro넓은 컨텍스트 처리에 뛰어나고 이미지 분석 기능도 우수하지만, 과잉 수정을 유발할 위험성이 있음
  • sonnet 3.5/3.7창의적이고 똑똑하지만, 맥락 유지와 일관성이 부족해 장기 대화에서 흔들림이 있음
  • grok-3-beta는 느리지만 디자인 시각화와 복잡한 문제 해결에서 탁월한 잠재력을 보임
  • 사용자들은 작업 흐름에 따라 모델을 분리하여 사용하며, 디버깅 실패 시 체크포인트 복원 및 모델 전환 전략을 선호함

gpt-4.1

  • 지능적이고 신뢰도 높은 보조자처럼 행동함
  • 성급히 판단하지 않고, 요청을 따르되 과도한 수정은 하지 않음
  • 개발자의 연장선처럼 느껴지는 모델로, 경험 많은 개발자에게 특히 적합함

gemini 2.5 pro

  • 긴 콘솔 로그, 전체 코드 파일 등 넓은 문맥을 활용할 때 강력함
  • 이미지 분석 능력 탁월, 시각적 오류 포착 가능
  • 단점은 지나치게 자율적으로 동작해 불필요한 코드 삭제 또는 과잉 수정을 일으킬 수 있음
  • 주의 깊은 제어가 필요함

sonnet 3.5 / 3.7

  • 3.7은 창의적이고 똑똑하지만, 장기 대화에서 맥락을 잃거나 지시를 무시하는 경우 있음
  • 3.5는 단일 파일 기반의 코드 이해 및 수정에 강함
  • Cursor와의 통합이 과도기적 문제로 일관성 있는 성능을 보여주지 못하고 있음

기타 의견 및 전략

  • grok-3-beta는 느리지만 다른 모델이 실패한 문제를 해결하는 데 유용함
  • 한 유저는 다음과 같은 모델 분업 전략을 사용 중:
    • o3/4-mini: 계획 정리 및 마크다운 기반 사유 정리
    • gemini 2.5 pro: 전체 파일 기반 문제 분석 및 기능 호출용
    • sonnet 3.5: cmd+k 기반 단일 파일 수정용

Reddit 커뮤니티 반응

모델 활용 방식

  • o3/4-mini: 기획 및 마크다운 기반 정리, 더 나은 reasoning과 대화 적합성을 보임 (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • 에이전트 모드 또는 긴 컨텍스트 기반 기능 호출에 유용 (Masony817, computerlegs)
    • 복잡한 프로젝트에서 코드 전체를 조망하고 판단하는 데 강력 (WorryBubbly3438)
    • 검색, 크로스 체크, 전처리 역할로 좋음 (computerlegs)
  • sonnet 3.5: 단일 파일 이해 및 수정에 강점, cmd+k 단축키용으로 적합 (Masony817)
  • sonnet 3.7:
    • 더 창의적이며 3.5보다 뛰어나지만 긴 대화에서 흐름 잃는 문제 있음 (Sea_Cardiologist_212)
    • 최신 커트오프 데이터 반영과 사고력에서 뛰어남 (yairEO)
    • 컨텍스트 윈도우 잘 다루면 안정적 (computerlegs)
  • Claude 3.7: Cursor 환경에서는 안정적이고 꾸준함 (cmndr_spanky)
  • gpt-4.1:
    • 단순 반복 작업이나 구조화된 작업에 적합 (Princekid1878, ILikeBubblyWater)
    • 설명 없이 과도하게 변경하는 경향 있음 (ILikeBubblyWater)
  • Deepseek R1: 특정 문제에서 의외로 다른 모델보다 잘 작동함 (Leather_Science_7911)

사용 전략 및 워크플로우

  • 모델별 역할 분담 후 상황에 따라 전환 (복수 의견)
  • cmd+k: sonnet 3.5로 단일 파일 처리 (Masony817)
  • 에이전트 모드는 초기 설정 후에는 비활용, 대신 체크포인트 기능과 명확한 프롬프트 사용 (WorryBubbly3438)
  • Auto mode 선호: 빠르고 저비용으로 실행 가능 (Funny-Anything-791, d0RSI)
  • 기계적 접근법: CNC 기계처럼 명시적이고 정밀한 지시가 중요 (Funny-Anything-791)
  • UI 및 디자인 테스트 특화 모델은 아직 미흡 (Princekid1878)

기타 의견

  • Sonnet 3.7은 이전보다 집중력과 맥락 유지가 떨어졌다는 불만 (Sea_Cardiologist_212)
  • Gemini나 Claude는 테스트 영상에서는 좋아 보이나 실제 환경에서는 다름 (cmndr_spanky)
  • 대부분의 모델은 명시적 프롬프트가 핵심 (공통된 언급)
  • 일부 사용자는 crypto나 Web 기반 통합을 기대 (간접적으로 언급됨)

제미나이 2.5프로가 go lang에 한해서는 최강이라고 단언할수 있습니다

재니마이가 속도는 가장빨라서 질의 응답용으로 추천합니다.

소넷만 주로 사용했는데
본문에 있는거 많이 공감되네요
4.1도 써봐야겠습니다

제 느낌하고 비슷하네요. sonnet은 사용할 수록 불안했고, chatgpt 4.1은 주문을 하고도 일단은 마음이 놓이는 편입니다.

Grok에 대한 의견도 공감이 가는 바이지만 ide내에서 보다는 채팅상에서 침착히 확인할 때 많이 사용하는 편입니다