Kimi K2.7 Code, GitHub Copilot에서 정식 제공

(github.blog)

1P by GN⁺ 21시간전 | ★ favorite | 댓글 1개

GitHub Copilot에 Kimi K2.7 Code가 추가되며, 모델 선택기에서 고를 수 있는 첫 오픈 가중치 모델이 됨
GitHub가 Microsoft Azure에서 호스팅해 코딩 워크플로에 더 많은 모델 선택지와 낮은 비용 옵션을 제공함
과금은 사용량 기반 과금 체계에서 공급자 정가 기준으로 적용되며, 실제 비용은 Copilot 모델·요청 가격 문서를 확인해야 함
Copilot Pro, Pro+, Max 플랜부터 단계적으로 배포되며, Visual Studio Code 모델 선택기에서 사용할 수 있음
Copilot Business와 Enterprise는 기본값이 비활성화라서, 조직 사용 전 관리자의 정책 활성화와 보안·컴플라이언스·데이터 거버넌스 검토가 필요함

Copilot에 추가된 첫 오픈 가중치 모델

Kimi K2.7 Code는 GitHub Copilot에서 정식 제공되는 오픈 가중치 모델임
Copilot 모델 선택기에서 선택 가능한 첫 오픈 가중치 모델로 추가됨
코딩 워크플로에서 더 많은 모델 선택지와 더 낮은 비용 옵션을 제공함
GitHub가 Microsoft Azure에서 모델을 호스팅함

사용량 기반 과금

Kimi K2.7 Code는 사용량 기반 과금에서 공급자 정가 기준으로 청구됨
자세한 과금 기준은 GitHub Copilot’s pricing for models and requests 문서에서 확인할 수 있음

Copilot 내 제공 범위

Kimi K2.7 Code는 Copilot Pro, Pro+, Max 플랜에 먼저 점진적으로 배포됨
사용자는 Visual Studio Code의 모델 선택기에서 이 모델을 고를 수 있음
배포는 단계적으로 진행되며, GitHub는 모델의 품질과 성능을 계속 모니터링함
향후 몇 주 동안 Copilot Business, Enterprise, 추가 사용 화면으로 확대될 예정임

지원 클라이언트와 화면

모델 선택기는 다음 환경에서 사용할 수 있음
- Visual Studio Code 1.127.0 이상
- Visual Studio 17.14.6 이상
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS 및 Android
- JetBrains 1.9.1-251 이상
- Xcode
- Eclipse

Business와 Enterprise의 관리자 설정

Kimi K2.7 Code는 Copilot Business와 Copilot Enterprise에서 기본적으로 꺼져 있음
조직 구성원이 모델을 선택하려면 플랜 관리자가 Copilot 설정에서 Kimi K2.7 Code 정책을 활성화해야 함
정책이 꺼진 상태로 유지되면 해당 조직에서는 모델을 사용할 수 없음
관리자는 활성화 전에 오픈 가중치 모델이 자체 보안, 컴플라이언스, 데이터 거버넌스 요구사항에 맞는지 검토하는 것이 권장됨

문서와 피드백 경로

GitHub Copilot에서 사용 가능한 전체 모델은 supported models 문서에서 확인할 수 있음
작업에 맞는 모델 선택은 choosing the right AI model for your task 문서에서 확인할 수 있음
피드백은 GitHub Community 토론에서 공유할 수 있음

GN⁺ 21시간전 [-]

Hacker News 의견들

클라우드 기반 AI 제품에는 이제 흥미를 거의 잃었음
한때 기대했던 멋진 기능과 워크플로가 가격 인상, 성능 하향 체감, 서비스 종료, 대체 등 여러 이유로 더는 쓰기 어렵게 된 일이 너무 많아 피곤함
작은 장비를 구성해 Qwen3.6에 거의 정착했고, 필요한 기능을 천천히 직접 추가하는 중임. Claude와 경쟁할 수준인지는 모르겠고, 확인도 그만둠. 지금도 충분히 큰 가치를 주고 계속 좋아지고 있으며, 어딘가의 잔디가 더 푸를 수 있어도 내 발밑에서 바뀌지 않는다는 점이 좋음
- 이게 상위 댓글이라 기쁨. 나도 완전히 로컬로 쓰고 있음
  32GB급 큰 모델을 돌릴 메모리가 없는 사람에게는 가지치기된 모델도 성능이 꽤 좋다는 점을 남기고 싶음. 작은 머신이라면 14GB에 들어가는 GLM 4.7 Flash의 pruned unsloth Q4 양자화 모델을 시도해볼 만함: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
  보통 이런 용도에는 LM Studio를 쓰지만, unsloth에도 이런 양자화 모델에 더 잘 맞을 수 있는 자체 스튜디오 앱이 있음. GLM 4.7 Flash를 몇 달간 주 모델로 썼는데 매우 끈질기고 아주 빨랐으며, 제한된 하드웨어에서는 좋은 선택으로 보임
- Qwen3.6-35B-A3B-UD-Q4_K_M이 내 낡은 1060에서도 초당 약 11토큰으로 돌아감. 여기까지 온 게 정말 말도 안 됨
- 요즘 AI 발전은 대체로 미세조정 차이를 밀어붙이는 쪽으로 느껴짐
  예를 들어 새 Claude는 에이전트형 코딩에 맞춰 조정되어 비에이전트형 코딩에는 오히려 해로울 수 있고, Fable 5는 좋아 보이지만 추론 비용이 크고 출시 후 성능 하향이나 제한·가격 개편 가능성이 높음. Gemini 3.5는 제한이 더 관대하지만 성능은 조금 떨어짐
  새 버전이 나오고 번호는 올라가지만, 모든 변화가 전진인지 아니면 올해 초와 비슷한 달러당 성능에서 튜닝만 달라진 건지 의문임. 실제 변화는 Qwen이나 Gemma 4 31B 같은 작은 모델에서 더 많이 보이며, 특히 다국어 능력까지 고려하면 꽤 마법 같음
  방금 올리며 Fable의 전후 비교를 봤는데, 재도입된 버전은 모델을 계속 만지는 중이라 BridgeBench 성능이 재앙적으로 떨어졌음: https://x.com/Hesamation/status/2072692225100612032
- 꽤 끌리는데, 이 정도를 하려면 Mac mini는 어느 사양이 필요할까?
- 나도 낡은 MBP에 Qwen3.6을 올려 만족스럽게 쓰는 중임
  회사에서 쓰는 Claude만큼 빠르지는 않지만 로컬에서 충분히 잘 돌아가고, 크레딧이나 기능이 갑자기 빠지는 일 같은 걱정을 안 해도 됨
Copilot CLI를 아주 좋아함. Claude Code보다 논리적이고 마찰이 적게 느껴짐
여러 모델을 마음대로 돌려 쓸 수 있는 점도 좋음. 예를 들어 “Opus 4.6으로 계획을 세우고, GPT 5.4로 그 계획을 검증하고 피드백을 받은 뒤 Sonnet 4.6으로 구현” 같은 식임
하지만 6월의 Copilot 가격 변경 때문에 개인적으로도, 회사 부서 전체도 Claude Code로 옮겨야 했음. 4~5월에는 포함 크레딧을 조금 넘겨 몇 달러 추가 지출하는 수준이었는데, 6월부터는 월 예산을 2~3일마다 다 써버림
고객 입장에서는 완전히 미친 가격 인상이고 Microsoft가 무슨 생각이었는지 모르겠음. 지속 가능성을 위해 필요한 가격이라 해도 경쟁사가 먼저 가격을 바꿀 때까지 기다렸어야 했음. 지난달 Copilot 고객의 50% 이상을 잃었어도 놀랍지 않음
결국 주요 업체들이 전부 이런 가격대로 맞춘다면, 국가가 TV처럼 공공 접근 AI를 운영해야 할 수도 있음. 무료 공개 모델을 쓰고 세금으로 데이터센터 몇 곳을 운영하며, 지역 제한과 엄격한 쓰로틀링을 두되 학생과 시민에게는 자유롭게 쓰게 하는 식임
몇 년 뒤 모든 AI 가격이 Copilot 수준이 된다면 유니콘 기업만 쓸 수 있고, 나머지는 AI를 쓰는 회사와 경쟁할 기회가 없어짐
- 경쟁사가 가격을 바꿀 때까지 기다렸어야 한다고 했지만, 이미 그렇게 한 셈임
  말 그대로 비용을 전가하는 것임: https://platform.claude.com/docs/en/about-claude/pricing
  Anthropic은 구독도 제공하지만, 기업은 보통 그걸 쓰길 원하지 않음. 그 경로로 제출한 내용이 학습에 쓰이거나 모델의 일부가 될 수 있기 때문임
  고용주의 명시적 허가 없이 쓰면 계약 위반이 될 수 있고, 소송당하면 심각한 결과가 있을 수 있음
- 가격 인상은 미친 수준이었음. 내 본업 회사도 Copilot에서 Claude Code 구독으로 옮기는 중임
  동시에 Claude Code가 결국 실제 토큰 비용에 맞춰 더 이상 좋은 거래가 아니게 될 때를 대비해, 공개 가중치 모델용으로 AWS Bedrock과 Deepinfra를 테스트하고 있음
- 몇 달 만에 처음으로 직장에서 Claude 크레딧을 다 써서 Copilot으로 돌아갔는데, 의외로 괜찮았음
  Claude가 도구 면에서는 훨씬 앞서지만, 하위 에이전트별 모델 지정과 모든 모델 접근은 현재 Claude가 제공하는 기능을 다 합친 것보다 더 나은 기능임
  회사에서 한 달에 소비할 수 있는 AI 양의 유일한 제한은 달러라서, 비용을 줄여주는 것이 나에게는 최고의 모델이자 실행 환경임. Copilot은 하위 에이전트에 더 적절한 모델을 자동 배정하는 것도 더 잘했고, Claude는 종종 더 비싼 모델을 씀
- 진지하게 궁금한데, Copilot CLI가 Claude Code보다 낫다고 느끼는 부분을 더 설명해줄 수 있을까? 선택권이 있으면 OpenCode를 쓰는데, Copilot CLI에서 어떤 점 때문에 더 선호하는지 궁금함
- 모델을 자동 선택하게 두는 방식은 더 이상 지속 가능하지 않음
  다만 더 좋은 모델이 만든 계획을 실행할 수 있는 효율적인 모델들은 있음. Microsoft의 자동 모델 선택이 예전 손해 보는 가격 구조에서 의존성 충돌 해결 같은 작업에 최첨단 추론 모델을 골랐다는 걸 생각하면 좀 민망함
VS 2026 개발에 GitHub Copilot을 쓰며 ChatGPT와 Claude를 오갔고, 그건 Claude Code와 Codex 앱을 알기 전이었음
Copilot은 내 용도에는 괜찮았고 월 10달러면 충분했음
그런데 지난달 새 가격 모델이 도입되자, 10달러가 며칠 만에 소진됨. 기존 가격이 지속 가능하지 않았다는 건 알지만, 그 일로 Claude Code와 Codex로 옮겼고 돌아볼 일은 없었음. Claude Code와 Codex의 토큰도 크게 보조받는 가격이지만, 좋은 일이 지속되는 동안 즐기면 됨
Copilot을 통해 Claude를 쓰는 것과 Claude Code에서 Claude를 직접 쓰는 것 사이에는 차이가 느껴짐. Microsoft가 뒤에서 뭘 하는지는 모르겠음
- 실행 환경이 매우 중요함. 사용할 수 있는 도구와 시스템 프롬프트가 실행 환경마다 다름
  Anthropic은 실행 환경과 모델 양쪽에서 약간 앞서 있어, 두 세계의 장점을 모두 가진 상황임
  Microsoft 쪽도 아마 같은 모델일 가능성이 높지만, 주변 도구와 프롬프트가 더 나빠서 결과도 더 나빠지는 것 같음
- Zed 안에서 Copilot을 떠날 때 비슷했음
  지금은 DeepSeek용 reasonix 실행 환경을 쓰고 있고, 캐시 적중 시 비용이 거의 무료에 가까움. Digital Ocean이나 Cloudflare 같은 보조금 없는 미국 공급자를 써도 그렇음
- 나도 Cursor로 옮겼음. msbuild 호출 방법을 알려주니 네이티브 Visual Studio 플러그인 없이도 알아서 편집함
  대상 언어는 C++이고 문제 없음
- 최근 몇 주 사이 GitHub Copilot 비용이 크게 불었고, 예전에 100달러 들던 일이 이제 300달러가 필요함
  Copilot을 통해 VS Code에서 Claude를 쓰는 방식은 마음에 들고, 코드 품질을 더 잘 통제할 수 있어 더 나은 코드를 준다고 느낌. Claude Code보다 훨씬 투명하고, 오픈소스이며 IDE 인터페이스가 문맥과 생성물 제어 기능을 더 많이 줌
  비용 증가가 순수하게 가격 인상 때문만은 아니고, Opus 모델 에이전트가 더 많은 토큰을 쓰는 영향도 있음. 그래서 Claude Code로 옮겼고 여전히 Opus 4.6을 만족스럽게 쓰고 있음. Fable과 4.7은 더 큰 단위의 작업을 하면서 곁길로 새고 가정을 만들어내는 일이 잦아 결과물이 지저분해짐
- Claude 4.8 Opus로는 Copilot 할당량이 아마 2~3개 프롬프트 만에 끝났음. 별로일 거라 예상했지만 이 정도일 줄은 몰랐음. 지속되는 동안은 좋았음
드디어 기업이 쓸 수 있는 대형 업체의 대안이 나왔음
사람들이 신뢰할 수 있는 공급자에서 중국 모델을 실행할 방법을 원해왔는데, GitHub가 그걸 제공함
벤치마크를 믿는다면 성능은 Sonnet 4.6 수준임. GitHub 가격으로 쓸 만한지는 지켜봐야 함
- Microsoft는 토큰 기반 과금으로 바꾼 만큼 더 싼 선택지를 제공해야 함
  GPT-5.4는 연간 구독자에게 1배였는데 이제 6배가 됨. 프리미엄 요청이 몇 개 프롬프트 만에 다 떨어짐. 월 10달러짜리 GitHub Copilot은 미국 AI 연구소 모델들을 싸게 쓸 수 있어 예전에는 최고의 가성비였음
- 벤치마크는 믿지 않음. Kimi K2.7을 여러 번 써봤는데 실망스러웠음
  Claude가 한 번에 끝낼 일을 빙빙 돌았음. 다만 내 사용 경로는 Ollama Cloud였고, 실제 모델을 제공하는지 양자화 버전을 제공하는지 모르며, 양자화가 성능을 떨어뜨렸을 수도 있음
  그래도 좋은 소식은 선례가 생겼다는 점임. Microsoft가 이제 Kimi K2.7을 제공한다면 곧 GLM 5.2도 제공할 수 있고, 그건 실제로 매우 경쟁력 있는 모델임
- 다시 홍보꾼 소리를 들을 수도 있겠지만 관련이 있어서 상관하지 않겠음
  Synthetic은 GLM5.2와 Kimi K2.7-Code를 포함해 자체 모델을 합리적인 가격에 운영함
  추천 링크: https://synthetic.new/?referral=kwjqga9QYoUgpZV
입력: 0.95달러, 캐시 적중: 0.19달러, 출력: 4.00달러
Moonshot이 받는 가격과 같고, 대략 GPT 5.4 mini 가격대라 나쁘지 않은 선택지임
문맥을 위해 토큰을 낭비하는 바보 같은 프롬프트를 예로 들면: “5x5 보드에서 혼자 틱택토를 해라. 5개를 한 줄로 놓으면 이긴다.”
Kimi K2.7에서는 0.006달러가 들고 전체 원시 추론 흔적을 볼 수 있음. GPT-5.4 mini는 0.016달러가 들고 요약됨
궁금하다면 둘 다 믿을 수 없을 정도로 멍청하게 둠
Kimi:

A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .

GPT 5.4 mini:

1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
- 참고로 궁금한 사람을 위해 말하면, GPT 5.5도 5.4 mini와 같은 쓰레기 플레이를 하면서 비용은 4배임
  Fable은 40센트 비용으로 그럴듯한 게임을 만들어냄
  
  X X O O O
  O O X X X
  X X X O O
  X O O X O
  X O X X O
- 좋은 아이디어임. iOS의 Claude Chat에서 Haiku에게 똑같이 시켜봤더니, 대화형 React 게임을 만들고 규칙을 구현한 뒤 직접 플레이하게 했음
  입력 1달러, 출력 5달러 치고 영리한 움직임, Anthropic!
- 대규모 언어 모델은 게임에는 약하지만, 그 게임 자체를 학습하는 강화학습 에이전트를 작성하는 건 충분히 가능함
- 엄청 심심해지면 모델 두 개가 서로 체스를 두게 해볼 생각임
  어딘가에 이미 체스 벤치마크나 대규모 언어 모델 토너먼트가 있을 것 같음
AWS Bedrock이 이런 모델을 매우 빈약하게 지원하는 게 이상함
Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 정도만 있고 최신 모델은 없음
- 제품 결정인지 GPU 제약인지 궁금함
  Inf2 인스턴스는 AWS Neuron이 필요함 [1]. 모델을 해당 하드웨어에서 돌아가게 포팅하는 데 시간이 너무 오래 걸리는 걸 수도 있음
  [1] https://aws.amazon.com/ai/machine-learning/neuron/
다른 모델들보다 실행 비용이 확실히 훨씬 싸고, 어제 한 시간 정도 써봤는데 결과가 유망해 보였음
Reddit 토론에서 팀이 glm5.2를 평가 중이라고 봤으니 더 추가되길 기대함
GitHub Copilot이 기업용 플랫폼으로 가장 좋은 위치에 있는 걸까?
Claude, GPT, Gemini를 지원하고 이제는 공개 가중치 모델까지 지원함. 대규모 조직은 어차피 API 요금 수준으로 내니 어디서 쓰든 비용은 비슷함
꽤 좋은 에이전트 CLI와 SDK가 있고, 이제 데스크톱 앱도 있음. 호스팅 에이전트도 있고 CI에서 ‘Agentic Workflows’를 실행할 수도 있음
평판이 너무 떨어져서 대안들만 주목받는 걸까? 아니면 기업 외 사용자는 사용량 비용 때문에 밀려나 무료 마케팅이 안 되는 걸까?
- 사전 고지 없이 가격을 바꾼 러그풀은 기업 쪽에서 좋게 받아들여지지 않았음
- 우리는 모두의 플랜을 취소하고 내부에 liteLLM을 배포했음
  Copilot은 토큰이 말도 안 되게 싸서 유지했는데, 새 가격으로 바뀐 뒤에는 openrouter와 비슷하고 모델 수만 훨씬 적은 서비스가 됨
- 전에는 그랬지만, 스스로 서비스를 죽이기로 한 뒤로는 아님
- 왜인지 Copilot은 VS Code의 Claude나 VS Code의 Codex보다 더 멍청하게 느껴짐
  정확한 이유는 모르겠지만 느낌이 좋지 않았음
- Copilot의 실행 환경은 내가 비교 테스트하는 다른 CLI 기반 실행 환경들에 비해 형편없음. 놀랄 정도로 나쁨
  회사에서 이 얘기가 자주 나오는데, 벤더 관리 담당자들이 대규모 언어 모델 생태계를 이해하지 못해 Copilot을 통한 Claude와 Claude Code를 통한 Claude가 같다고 생각하기 때문임
  차이를 설명하라고 할 때마다 간단히 나란히 비교해보면 5번 중 3~4번은 극적으로 낮은 성능이 드러남
Copilot을 시도하려는 작은 팀이라면, 오래된 문서를 따라 청구 설정을 헤매느라 몇 시간을 날릴 수 있다는 점을 경고하고 싶음
요약하면 결국 GitHub에서 “Copilot Business는 10개 이상 라이선스를 구매하는 팀에 제공된다”는 이메일을 받았음. 문서화되어 있지 않지만 다른 사람들도 같은 일을 겪고 있음: https://github.com/orgs/community/discussions/199346
우리는 당분간 Cursor를 유지하고, Kimi를 “Composer”라는 이름으로 주력 사용 중임
드디어 나왔음. 이게 Copilot의 첫 공개 가중치 LLM인가? 문이 열린 셈임

답변달기

Kimi K2.7 Code, GitHub Copilot에서 정식 제공

Copilot에 추가된 첫 오픈 가중치 모델

사용량 기반 과금

Copilot 내 제공 범위

지원 클라이언트와 화면

Business와 Enterprise의 관리자 설정

문서와 피드백 경로

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들