1P by GN⁺ | ★ favorite | 댓글 1개
  • GitHub Copilot에 Kimi K2.7 Code가 추가되며, 모델 선택기에서 고를 수 있는 첫 오픈 가중치 모델이 됨
  • GitHub가 Microsoft Azure에서 호스팅해 코딩 워크플로에 더 많은 모델 선택지와 낮은 비용 옵션을 제공함
  • 과금은 사용량 기반 과금 체계에서 공급자 정가 기준으로 적용되며, 실제 비용은 Copilot 모델·요청 가격 문서를 확인해야 함
  • Copilot Pro, Pro+, Max 플랜부터 단계적으로 배포되며, Visual Studio Code 모델 선택기에서 사용할 수 있음
  • Copilot Business와 Enterprise는 기본값이 비활성화라서, 조직 사용 전 관리자의 정책 활성화와 보안·컴플라이언스·데이터 거버넌스 검토가 필요함

Copilot에 추가된 첫 오픈 가중치 모델

  • Kimi K2.7 Code는 GitHub Copilot에서 정식 제공되는 오픈 가중치 모델임
  • Copilot 모델 선택기에서 선택 가능한 첫 오픈 가중치 모델로 추가됨
  • 코딩 워크플로에서 더 많은 모델 선택지와 더 낮은 비용 옵션을 제공함
  • GitHub가 Microsoft Azure에서 모델을 호스팅함

사용량 기반 과금

Copilot 내 제공 범위

  • Kimi K2.7 Code는 Copilot Pro, Pro+, Max 플랜에 먼저 점진적으로 배포됨
  • 사용자는 Visual Studio Code의 모델 선택기에서 이 모델을 고를 수 있음
  • 배포는 단계적으로 진행되며, GitHub는 모델의 품질과 성능을 계속 모니터링함
  • 향후 몇 주 동안 Copilot Business, Enterprise, 추가 사용 화면으로 확대될 예정임

지원 클라이언트와 화면

  • 모델 선택기는 다음 환경에서 사용할 수 있음
    • Visual Studio Code 1.127.0 이상
    • Visual Studio 17.14.6 이상
    • Copilot CLI
    • GitHub Copilot cloud agent
    • GitHub Copilot App
    • github.com
    • GitHub Mobile iOS 및 Android
    • JetBrains 1.9.1-251 이상
    • Xcode
    • Eclipse

Business와 Enterprise의 관리자 설정

  • Kimi K2.7 Code는 Copilot BusinessCopilot Enterprise에서 기본적으로 꺼져 있음
  • 조직 구성원이 모델을 선택하려면 플랜 관리자가 Copilot 설정에서 Kimi K2.7 Code 정책을 활성화해야 함
  • 정책이 꺼진 상태로 유지되면 해당 조직에서는 모델을 사용할 수 없음
  • 관리자는 활성화 전에 오픈 가중치 모델이 자체 보안, 컴플라이언스, 데이터 거버넌스 요구사항에 맞는지 검토하는 것이 권장됨

문서와 피드백 경로

댓글과 토론

Hacker News 의견들
  • 클라우드 기반 AI 제품에는 이제 흥미를 거의 잃었음
    한때 기대했던 멋진 기능과 워크플로가 가격 인상, 성능 하향 체감, 서비스 종료, 대체 등 여러 이유로 더는 쓰기 어렵게 된 일이 너무 많아 피곤함
    작은 장비를 구성해 Qwen3.6에 거의 정착했고, 필요한 기능을 천천히 직접 추가하는 중임. Claude와 경쟁할 수준인지는 모르겠고, 확인도 그만둠. 지금도 충분히 큰 가치를 주고 계속 좋아지고 있으며, 어딘가의 잔디가 더 푸를 수 있어도 내 발밑에서 바뀌지 않는다는 점이 좋음

    • 이게 상위 댓글이라 기쁨. 나도 완전히 로컬로 쓰고 있음
      32GB급 큰 모델을 돌릴 메모리가 없는 사람에게는 가지치기된 모델도 성능이 꽤 좋다는 점을 남기고 싶음. 작은 머신이라면 14GB에 들어가는 GLM 4.7 Flash의 pruned unsloth Q4 양자화 모델을 시도해볼 만함: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
      보통 이런 용도에는 LM Studio를 쓰지만, unsloth에도 이런 양자화 모델에 더 잘 맞을 수 있는 자체 스튜디오 앱이 있음. GLM 4.7 Flash를 몇 달간 주 모델로 썼는데 매우 끈질기고 아주 빨랐으며, 제한된 하드웨어에서는 좋은 선택으로 보임
    • Qwen3.6-35B-A3B-UD-Q4_K_M이 내 낡은 1060에서도 초당 약 11토큰으로 돌아감. 여기까지 온 게 정말 말도 안 됨
    • 요즘 AI 발전은 대체로 미세조정 차이를 밀어붙이는 쪽으로 느껴짐
      예를 들어 새 Claude는 에이전트형 코딩에 맞춰 조정되어 비에이전트형 코딩에는 오히려 해로울 수 있고, Fable 5는 좋아 보이지만 추론 비용이 크고 출시 후 성능 하향이나 제한·가격 개편 가능성이 높음. Gemini 3.5는 제한이 더 관대하지만 성능은 조금 떨어짐
      새 버전이 나오고 번호는 올라가지만, 모든 변화가 전진인지 아니면 올해 초와 비슷한 달러당 성능에서 튜닝만 달라진 건지 의문임. 실제 변화는 Qwen이나 Gemma 4 31B 같은 작은 모델에서 더 많이 보이며, 특히 다국어 능력까지 고려하면 꽤 마법 같음
      방금 올리며 Fable의 전후 비교를 봤는데, 재도입된 버전은 모델을 계속 만지는 중이라 BridgeBench 성능이 재앙적으로 떨어졌음: https://x.com/Hesamation/status/2072692225100612032
    • 꽤 끌리는데, 이 정도를 하려면 Mac mini는 어느 사양이 필요할까?
    • 나도 낡은 MBP에 Qwen3.6을 올려 만족스럽게 쓰는 중임
      회사에서 쓰는 Claude만큼 빠르지는 않지만 로컬에서 충분히 잘 돌아가고, 크레딧이나 기능이 갑자기 빠지는 일 같은 걱정을 안 해도 됨
  • Copilot CLI를 아주 좋아함. Claude Code보다 논리적이고 마찰이 적게 느껴짐
    여러 모델을 마음대로 돌려 쓸 수 있는 점도 좋음. 예를 들어 “Opus 4.6으로 계획을 세우고, GPT 5.4로 그 계획을 검증하고 피드백을 받은 뒤 Sonnet 4.6으로 구현” 같은 식임
    하지만 6월의 Copilot 가격 변경 때문에 개인적으로도, 회사 부서 전체도 Claude Code로 옮겨야 했음. 4~5월에는 포함 크레딧을 조금 넘겨 몇 달러 추가 지출하는 수준이었는데, 6월부터는 월 예산을 2~3일마다 다 써버림
    고객 입장에서는 완전히 미친 가격 인상이고 Microsoft가 무슨 생각이었는지 모르겠음. 지속 가능성을 위해 필요한 가격이라 해도 경쟁사가 먼저 가격을 바꿀 때까지 기다렸어야 했음. 지난달 Copilot 고객의 50% 이상을 잃었어도 놀랍지 않음
    결국 주요 업체들이 전부 이런 가격대로 맞춘다면, 국가가 TV처럼 공공 접근 AI를 운영해야 할 수도 있음. 무료 공개 모델을 쓰고 세금으로 데이터센터 몇 곳을 운영하며, 지역 제한과 엄격한 쓰로틀링을 두되 학생과 시민에게는 자유롭게 쓰게 하는 식임
    몇 년 뒤 모든 AI 가격이 Copilot 수준이 된다면 유니콘 기업만 쓸 수 있고, 나머지는 AI를 쓰는 회사와 경쟁할 기회가 없어짐

    • 경쟁사가 가격을 바꿀 때까지 기다렸어야 한다고 했지만, 이미 그렇게 한 셈임
      말 그대로 비용을 전가하는 것임: https://platform.claude.com/docs/en/about-claude/pricing
      Anthropic은 구독도 제공하지만, 기업은 보통 그걸 쓰길 원하지 않음. 그 경로로 제출한 내용이 학습에 쓰이거나 모델의 일부가 될 수 있기 때문임
      고용주의 명시적 허가 없이 쓰면 계약 위반이 될 수 있고, 소송당하면 심각한 결과가 있을 수 있음
    • 가격 인상은 미친 수준이었음. 내 본업 회사도 Copilot에서 Claude Code 구독으로 옮기는 중임
      동시에 Claude Code가 결국 실제 토큰 비용에 맞춰 더 이상 좋은 거래가 아니게 될 때를 대비해, 공개 가중치 모델용으로 AWS Bedrock과 Deepinfra를 테스트하고 있음
    • 몇 달 만에 처음으로 직장에서 Claude 크레딧을 다 써서 Copilot으로 돌아갔는데, 의외로 괜찮았음
      Claude가 도구 면에서는 훨씬 앞서지만, 하위 에이전트별 모델 지정과 모든 모델 접근은 현재 Claude가 제공하는 기능을 다 합친 것보다 더 나은 기능임
      회사에서 한 달에 소비할 수 있는 AI 양의 유일한 제한은 달러라서, 비용을 줄여주는 것이 나에게는 최고의 모델이자 실행 환경임. Copilot은 하위 에이전트에 더 적절한 모델을 자동 배정하는 것도 더 잘했고, Claude는 종종 더 비싼 모델을 씀
    • 진지하게 궁금한데, Copilot CLI가 Claude Code보다 낫다고 느끼는 부분을 더 설명해줄 수 있을까? 선택권이 있으면 OpenCode를 쓰는데, Copilot CLI에서 어떤 점 때문에 더 선호하는지 궁금함
    • 모델을 자동 선택하게 두는 방식은 더 이상 지속 가능하지 않음
      다만 더 좋은 모델이 만든 계획을 실행할 수 있는 효율적인 모델들은 있음. Microsoft의 자동 모델 선택이 예전 손해 보는 가격 구조에서 의존성 충돌 해결 같은 작업에 최첨단 추론 모델을 골랐다는 걸 생각하면 좀 민망함
  • VS 2026 개발에 GitHub Copilot을 쓰며 ChatGPT와 Claude를 오갔고, 그건 Claude Code와 Codex 앱을 알기 전이었음
    Copilot은 내 용도에는 괜찮았고 월 10달러면 충분했음
    그런데 지난달 새 가격 모델이 도입되자, 10달러가 며칠 만에 소진됨. 기존 가격이 지속 가능하지 않았다는 건 알지만, 그 일로 Claude CodeCodex로 옮겼고 돌아볼 일은 없었음. Claude Code와 Codex의 토큰도 크게 보조받는 가격이지만, 좋은 일이 지속되는 동안 즐기면 됨
    Copilot을 통해 Claude를 쓰는 것과 Claude Code에서 Claude를 직접 쓰는 것 사이에는 차이가 느껴짐. Microsoft가 뒤에서 뭘 하는지는 모르겠음

    • 실행 환경이 매우 중요함. 사용할 수 있는 도구와 시스템 프롬프트가 실행 환경마다 다름
      Anthropic은 실행 환경과 모델 양쪽에서 약간 앞서 있어, 두 세계의 장점을 모두 가진 상황임
      Microsoft 쪽도 아마 같은 모델일 가능성이 높지만, 주변 도구와 프롬프트가 더 나빠서 결과도 더 나빠지는 것 같음
    • Zed 안에서 Copilot을 떠날 때 비슷했음
      지금은 DeepSeek용 reasonix 실행 환경을 쓰고 있고, 캐시 적중 시 비용이 거의 무료에 가까움. Digital Ocean이나 Cloudflare 같은 보조금 없는 미국 공급자를 써도 그렇음
    • 나도 Cursor로 옮겼음. msbuild 호출 방법을 알려주니 네이티브 Visual Studio 플러그인 없이도 알아서 편집함
      대상 언어는 C++이고 문제 없음
    • 최근 몇 주 사이 GitHub Copilot 비용이 크게 불었고, 예전에 100달러 들던 일이 이제 300달러가 필요함
      Copilot을 통해 VS Code에서 Claude를 쓰는 방식은 마음에 들고, 코드 품질을 더 잘 통제할 수 있어 더 나은 코드를 준다고 느낌. Claude Code보다 훨씬 투명하고, 오픈소스이며 IDE 인터페이스가 문맥과 생성물 제어 기능을 더 많이 줌
      비용 증가가 순수하게 가격 인상 때문만은 아니고, Opus 모델 에이전트가 더 많은 토큰을 쓰는 영향도 있음. 그래서 Claude Code로 옮겼고 여전히 Opus 4.6을 만족스럽게 쓰고 있음. Fable과 4.7은 더 큰 단위의 작업을 하면서 곁길로 새고 가정을 만들어내는 일이 잦아 결과물이 지저분해짐
    • Claude 4.8 Opus로는 Copilot 할당량이 아마 2~3개 프롬프트 만에 끝났음. 별로일 거라 예상했지만 이 정도일 줄은 몰랐음. 지속되는 동안은 좋았음
  • 드디어 기업이 쓸 수 있는 대형 업체의 대안이 나왔음
    사람들이 신뢰할 수 있는 공급자에서 중국 모델을 실행할 방법을 원해왔는데, GitHub가 그걸 제공함
    벤치마크를 믿는다면 성능은 Sonnet 4.6 수준임. GitHub 가격으로 쓸 만한지는 지켜봐야 함

    • Microsoft는 토큰 기반 과금으로 바꾼 만큼 더 싼 선택지를 제공해야 함
      GPT-5.4는 연간 구독자에게 1배였는데 이제 6배가 됨. 프리미엄 요청이 몇 개 프롬프트 만에 다 떨어짐. 월 10달러짜리 GitHub Copilot은 미국 AI 연구소 모델들을 싸게 쓸 수 있어 예전에는 최고의 가성비였음
    • 벤치마크는 믿지 않음. Kimi K2.7을 여러 번 써봤는데 실망스러웠음
      Claude가 한 번에 끝낼 일을 빙빙 돌았음. 다만 내 사용 경로는 Ollama Cloud였고, 실제 모델을 제공하는지 양자화 버전을 제공하는지 모르며, 양자화가 성능을 떨어뜨렸을 수도 있음
      그래도 좋은 소식은 선례가 생겼다는 점임. Microsoft가 이제 Kimi K2.7을 제공한다면 곧 GLM 5.2도 제공할 수 있고, 그건 실제로 매우 경쟁력 있는 모델임
    • 다시 홍보꾼 소리를 들을 수도 있겠지만 관련이 있어서 상관하지 않겠음
      Synthetic은 GLM5.2Kimi K2.7-Code를 포함해 자체 모델을 합리적인 가격에 운영함
      추천 링크: https://synthetic.new/?referral=kwjqga9QYoUgpZV
  • 입력: 0.95달러, 캐시 적중: 0.19달러, 출력: 4.00달러
    Moonshot이 받는 가격과 같고, 대략 GPT 5.4 mini 가격대라 나쁘지 않은 선택지임
    문맥을 위해 토큰을 낭비하는 바보 같은 프롬프트를 예로 들면: “5x5 보드에서 혼자 틱택토를 해라. 5개를 한 줄로 놓으면 이긴다.”
    Kimi K2.7에서는 0.006달러가 들고 전체 원시 추론 흔적을 볼 수 있음. GPT-5.4 mini는 0.016달러가 들고 요약됨
    궁금하다면 둘 다 믿을 수 없을 정도로 멍청하게 둠
    Kimi:

    A B C D E
    1 . . . . .
    2 . . . . .
    3 X X X X X
    4 . O O O O
    5 . . . . .

    GPT 5.4 mini:

    1: X X X X X
    2: O O . . .
    3: . . O . .
    4: . . . O .
    5: . . . . O

    • 참고로 궁금한 사람을 위해 말하면, GPT 5.5도 5.4 mini와 같은 쓰레기 플레이를 하면서 비용은 4배임
      Fable은 40센트 비용으로 그럴듯한 게임을 만들어냄

      X X O O O
      O O X X X
      X X X O O
      X O O X O
      X O X X O

    • 좋은 아이디어임. iOS의 Claude Chat에서 Haiku에게 똑같이 시켜봤더니, 대화형 React 게임을 만들고 규칙을 구현한 뒤 직접 플레이하게 했음
      입력 1달러, 출력 5달러 치고 영리한 움직임, Anthropic!

    • 대규모 언어 모델은 게임에는 약하지만, 그 게임 자체를 학습하는 강화학습 에이전트를 작성하는 건 충분히 가능함

    • 엄청 심심해지면 모델 두 개가 서로 체스를 두게 해볼 생각임
      어딘가에 이미 체스 벤치마크나 대규모 언어 모델 토너먼트가 있을 것 같음

  • AWS Bedrock이 이런 모델을 매우 빈약하게 지원하는 게 이상함
    Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 정도만 있고 최신 모델은 없음

    • 제품 결정인지 GPU 제약인지 궁금함
      Inf2 인스턴스는 AWS Neuron이 필요함 [1]. 모델을 해당 하드웨어에서 돌아가게 포팅하는 데 시간이 너무 오래 걸리는 걸 수도 있음
      [1] https://aws.amazon.com/ai/machine-learning/neuron/
  • 다른 모델들보다 실행 비용이 확실히 훨씬 싸고, 어제 한 시간 정도 써봤는데 결과가 유망해 보였음
    Reddit 토론에서 팀이 glm5.2를 평가 중이라고 봤으니 더 추가되길 기대함

  • GitHub Copilot이 기업용 플랫폼으로 가장 좋은 위치에 있는 걸까?
    Claude, GPT, Gemini를 지원하고 이제는 공개 가중치 모델까지 지원함. 대규모 조직은 어차피 API 요금 수준으로 내니 어디서 쓰든 비용은 비슷함
    꽤 좋은 에이전트 CLI와 SDK가 있고, 이제 데스크톱 앱도 있음. 호스팅 에이전트도 있고 CI에서 ‘Agentic Workflows’를 실행할 수도 있음
    평판이 너무 떨어져서 대안들만 주목받는 걸까? 아니면 기업 외 사용자는 사용량 비용 때문에 밀려나 무료 마케팅이 안 되는 걸까?

    • 사전 고지 없이 가격을 바꾼 러그풀은 기업 쪽에서 좋게 받아들여지지 않았음
    • 우리는 모두의 플랜을 취소하고 내부에 liteLLM을 배포했음
      Copilot은 토큰이 말도 안 되게 싸서 유지했는데, 새 가격으로 바뀐 뒤에는 openrouter와 비슷하고 모델 수만 훨씬 적은 서비스가 됨
    • 전에는 그랬지만, 스스로 서비스를 죽이기로 한 뒤로는 아님
    • 왜인지 Copilot은 VS Code의 Claude나 VS Code의 Codex보다 더 멍청하게 느껴짐
      정확한 이유는 모르겠지만 느낌이 좋지 않았음
    • Copilot의 실행 환경은 내가 비교 테스트하는 다른 CLI 기반 실행 환경들에 비해 형편없음. 놀랄 정도로 나쁨
      회사에서 이 얘기가 자주 나오는데, 벤더 관리 담당자들이 대규모 언어 모델 생태계를 이해하지 못해 Copilot을 통한 Claude와 Claude Code를 통한 Claude가 같다고 생각하기 때문임
      차이를 설명하라고 할 때마다 간단히 나란히 비교해보면 5번 중 3~4번은 극적으로 낮은 성능이 드러남
  • Copilot을 시도하려는 작은 팀이라면, 오래된 문서를 따라 청구 설정을 헤매느라 몇 시간을 날릴 수 있다는 점을 경고하고 싶음
    요약하면 결국 GitHub에서 “Copilot Business는 10개 이상 라이선스를 구매하는 팀에 제공된다”는 이메일을 받았음. 문서화되어 있지 않지만 다른 사람들도 같은 일을 겪고 있음: https://github.com/orgs/community/discussions/199346
    우리는 당분간 Cursor를 유지하고, Kimi를 “Composer”라는 이름으로 주력 사용 중임

  • 드디어 나왔음. 이게 Copilot의 첫 공개 가중치 LLM인가? 문이 열린 셈임