Hacker News 의견들
  • GitHub 설정의 “Allow GitHub to use my data for AI model training” 항목을 보면, 켜거나 끌 수 있음
    그런데 이걸 마치 “기능 접근 권한”처럼 포장해둔 게 웃김
    데이터를 공짜로 넘기는 걸 혜택처럼 말하는 게 좀 아이러니함

    • 문구 자체는 헷갈리진 않아서 그나마 나음
      GCS 버킷 만들 때의 “public access prevention” 체크박스처럼 혼란스럽진 않음
    • Copilot 관련 기능을 다 꺼놨는데도 Copilot Chat 사용률이 2%로 표시되어 있어서 당황스러움
      개인 계정에서는 일부러 안 쓰는데 왜 기록이 남는지 모르겠음
    • “기능 접근”이라는 표현이 너무 조작적으로 느껴짐
      사실상 내 데이터를 넘기는 건데, 마치 뭔가 잃는 것처럼 들리게 만들어둠
    • 어쩌면 내 데이터로 모델이 재학습되어 나중에 나한테도 약간 도움이 될 수도 있다는 게 “혜택”일지도 모르겠음
    • 결국 그 “기능”은 내 코딩 스타일이 다음 모델에 반영되는 것일 뿐임
  • 4월 24일부터 GitHub Copilot의 상호작용 데이터가 AI 학습에 사용된다고 공지했음
    기본값이 활성화 상태라서 직접 꺼야 함
    설정 페이지 링크
    비즈니스 계정도 기본적으로 켜져 있는지 궁금함. 그렇다면 꽤 수상한 정책

    • 기본값이 켜져 있는 게 믿기지 않음
      블로그 글에도 비활성화 링크를 안 넣은 건 불친절함
      직접 끄려면 이 경로 → Privacy → “Allow GitHub to use my data for AI model training” → Disabled로 설정해야 함
    • 공식 커뮤니티 답변에 따르면,
      기업 고객은 계약상 데이터 학습에 사용되지 않으며, 개인 사용자만 제어 가능함
    • 비즈니스 사용자에게도 기본 opt-in이라면 보안·프라이버시 정책 위반
      고객 코드가 학습에 쓰이지 않도록 하는 내부 정책이 있음
    • Copilot Business나 Enterprise 고객의 데이터는 학습에 사용되지 않는다고 확인함
    • 블로그에도 “Business와 Enterprise 사용자는 이번 변경의 영향을 받지 않는다”고 명시되어 있음
  • Copilot은 API 키나 비밀번호 같은 민감한 파일을 무시할 방법이 없음
    IDE를 여는 순간 이런 정보가 Microsoft로 전송될 수 있음
    관련 토론 링크

    • Gemini CLI는 ‘AUTH’ 같은 문자열이 포함된 환경 변수를 차단함
      그런데 예외 설정이 두 개나 있는데 둘 다 작동하지 않음
      PR을 올려도 봇만 반응하고 사람은 안 봄
      게다가 Gemini 3는 오픈소스 코드를 리팩터링할 때, 원 개발자의 의도에 반한다고 판단하면 코드 생성을 거부함
    • 사실 민감한 파일을 저장소에 두는 게 문제이긴 함
    • 이런 문제는 Copilot뿐 아니라 OpenAI Codex 이슈에서도 반복됨
    • 엔터프라이즈나 조직 단위에서 ignore path를 설정해둔 기억이 있음
  • 유료 사용자라면 기본값이 opt-out이 아니라 opt-in이어야 한다고 생각함
    GitHub의 Mario Rodriguez(@mariorod)가 이런 결정을 내린 게 이해되지 않음

    • 그의 README를 보면 “narrative shaping과 ‘How we Work’ 변화”가 주요 관심사라서, 이런 접근이 그 연장선인 듯함
  • GitHub와 AI 시대 이후로 내 코드는 전부 자체 서버의 private git repo로 옮겼음
    오픈소스 라이선스를 고민할 이유가 사라졌음
    내 코드를 상업적 AI 학습에 쓰게 둘 생각이 없음
    진지하게 오픈소스를 하고 싶다면 Codeberg로 옮길 때임

    • 나도 같은 결정을 내렸음
      기존 오픈소스 프로젝트는 유지보수만 하고, 새 프로젝트는 SaaS나 바이너리 형태로만 배포함
      대신 언어·OS 프로젝트에 기여하면서 모델 재학습의 필요성을 느끼는 중임
    • 아마 GitHub의 TOS에 서비스 운영을 위한 라이선스 예외 조항이 있을 것 같음
    • 지금은 Forgejo를 셀프호스팅하고, 자체 하드웨어에서 러너를 돌리며 만족 중임
  • EU에서는 이런 정책의 법적 근거가 궁금함
    수집 데이터에 개인식별정보(PII)가 포함될 수 있고, GDPR 기준으로는
    “자발적이고 명확한 동의”가 필요함

    • GDPR은 opt-out 기본값을 금지함
      코드 한 줄에 내 전화번호를 테스트용으로 넣었다가 Copilot으로 전송되면 법적 조치를 취할 수도 있음
    • 내 GitHub 설정에는 이 옵션이 아예 없어서, 혹시 미국 사용자만 해당되는 건지 의문임
  • “이 접근은 업계 표준과 일치한다”는 말은 결국 “다른 곳도 하니까 괜찮다” 는 논리임

    • 하지만 Anthropic은 opt-in 방식이고, 활성화하면 할인 혜택까지 줌
  • 결국 GitHub은 모든 사용자의 전체 코드베이스를 보존하려는 것처럼 보임
    Copilot이 사용하는 데이터가 Microsoft 계열사 전체와 공유될 수 있다는 문구가 있음

  • Copilot 구독을 취소하는 옵션이 보이지 않음
    모바일 결제 설정 링크를 봐도 없음
    공식 문서에 따르면
    학생·교사·오픈소스 유지관리자로서 무료 접근 권한을 받은 경우 취소할 수 없다고

  • 그래도 GitHub이 이 변경을 숨기려 하진 않았고, opt-out 절차를 공개적으로 안내했음

    • 하지만 이메일에 직접 링크도 없고, 설정 이름도 명시하지 않음
      전형적인 다크 패턴 느낌임
    • 실제로는 opt-out이 간단하지 않음
      Android 앱에서는 설정 페이지를 찾기도 어렵고, 페이지가 제대로 작동하지 않음