7P by humblebee 6시간전 | ★ favorite | 댓글 2개

Anthropic이 2025년 5월 23일 Claude 4 시리즈를 출시했습니다. 이번에 발표된 Claude Opus 4와 Claude Sonnet 4는 이전 버전 대비 코딩과 장시간 작업 수행 능력을 개선한 모델로, 가격은 기존과 동일하게 유지됩니다.

  1. 지속 작업 능력

    • 7시간 연속 작업: Rakuten이 검증한 오픈소스 리팩토링에서 7시간 동안 독립적으로 작업 수행
    • 수천 개의 단계를 거치는 복잡한 작업도 중단 없이 처리
    • 기존 AI 에이전트의 한계를 크게 넘어선 작업 지속성
  2. 향상된 메모리 시스템

    • 'Navigation Guide' 같은 메모리 파일을 자동으로 생성하여 장기 작업 상황 인식 개선
    • 포켓몬 게임 플레이 중 내비게이션 가이드를 스스로 작성하는 등 실용적 메모리 활용
    • 이전 모델 대비 65% 감소한 지름길/허점 사용 행동
  3. 하이브리드 추론 모델

    • 즉각 응답 모드: 빠른 답변이 필요한 경우
    • 확장 사고 모드: 최대 64K 토큰까지 깊이 있는 추론 가능
    • 상황에 따라 두 모드를 자동으로 전환
  4. 도구 사용

    • 병렬 도구 실행: 여러 도구를 동시에 사용하여 효율성 up
    • 사고 중 도구 사용: 추론 과정에서 웹 검색 등을 활용해 더 정확한 답변 생성
  5. 코드 품질의 개선

    • Block 평가: "편집과 디버깅 중 코드 품질을 향상시킨 최초의 모델"
    • iGent 보고: 코드베이스 탐색 오류율 20%에서 거의 0%로 감소
    • Sourcegraph: 더 우아한 코드 품질과 깊은 문제 이해력
  6. Claude Code의 실무 통합

    • IDE 직접 통합: 코드 변경사항이 에디터에 바로 표시
    • GitHub PR 대응: PR 리뷰어 피드백 자동 처리, CI 오류 수정
    • 백그라운드 작업: GitHub Actions를 통한 자동화 지원
    • 확장 가능한 SDK: 개발자가 자체 에이전트 구축 가능
  7. API 신기능

    • 코드 실행 도구
    • MCP 커넥터
    • Files API
    • 최대 1시간 프롬프트 캐싱
  8. 안전성

    • ASL-3 (AI Safety Level 3) 보호 조치 구현
    • 더 정교한 지시사항 준수 능력
    • 악용 가능성을 줄인 더 책임감 있는 동작

7시간 동안 중단 없이 리펙토링을 수행했다고 적혀있는데요, 퀄리티가 괜찮다면 개발자가 퇴근 후 맡겨두고 다음날 검토하는 고급 외주 작업 수준도 기대해볼 수 있겠습니다 😂

이부분을 캐치해서 구글같은데서 jules같은 코딩에이전트 시범적으로 베타 하는중이긴 하죠... Ai한테 일감 던져두면 로컬기 아니라 클라우드 환경에서 알아서 뚝딱뚝딱 하다가 나중에 결과 확인하고 커밋, 배포등 하라고