10P by neo 7일전 | ★ favorite | 댓글 3개
  • AI 모델이 개발자 워크플로우에 통합되면서, 특정 기술 사용을 부추기거나 방해함
  • 대형 언어 모델이 특정 기술에 편향된 응답을 제공함에 따라, AI가 지원하기 용이한 기술을 우선 채택하려는 경향이 생겨남
  • 기존에도 문서화와 지원이 풍부한 도구가 선택되곤 했지만, AI가 이 결정 요소를 과도하게 증폭시키는 현상이 문제로 지적됨

지식 격차

  • 대형 언어 모델은 대규모 데이터셋과 긴 학습 기간을 거치므로, 출시 시점 기준으로 이미 구버전 지식을 포함하는 경우가 많음
  • 학습 cutoff 이후에 등장한 신기술에 관해서는 AI가 적절한 도움을 주지 못함
  • 예: Anthropic, OpenAI 등 주요 모델들은 2023~2024년 무렵의 지식 cutoff를 가짐
  • 지식 갭 때문에 새로운 기술을 사용하려는 이들이 AI 지원 부족으로 불편을 겪게 되며, 이로 인해 해당 기술 채택이 지연되는 현상 발생함
  • 기존에 시장 지분이 있는 기술은 열성 사용자층이 존재하기에 자료가 쌓이지만, 완전 신규 기술은 문서나 블로그 등 생성되는 자료 자체가 적어 모델 훈련에 반영되기 어려움
  • AI가 인터넷 연결 기능을 일부 제공하더라도, 명시적으로 요청해야 하거나 아예 기능이 없는 경우가 많음
  • 신기술에 대한 AI 지원 부족 → 사용자와 자료 감소 → 모델 학습 데이터 부족 → 재차 AI 지원 부족으로 이어지는 악순환 가능성 존재함
  • 최신 자바스크립트 프레임워크를 쓰려는 개발자가 AI 도움을 받으려 할 때, 모델이 충분한 안내를 주지 못하면 구방식 문서나 익숙한 도구에 대한 선택 유인이 더 커짐

시스템 프롬프트 영향

  • Claude 등 일부 AI 모델이 React와 Tailwind에 대한 선호를 자주 보여줌
  • 예: Claude에 “바닐라 HTML/CSS/JS를 사용” 요청을 했음에도 React 코드를 제안하거나, 기존 코드를 React로 재작성하려는 양상이 관찰됨
  • 일부 모델의 시스템 프롬프트(또는 비공개된 기능별 프롬프트)에 React, Tailwind, Mermaid 등 특정 라이브러리나 도구가 명시되어 있음
  • 실제 대화 예시에서 Svelte Runes 사용 요청 시 모델이 React 대안을 제시하며, 결과적으로 사용자가 React를 쉽게 수용하도록 유도하는 모습이 나타남
  • 사용자가 가장 간단한 해결책(Path of least resistance)을 택하기에, AI가 제시하는 기본 옵션이 기술 선택에 큰 영향을 미침

테스트

  • AI 모델들이 새 웹 앱 제작을 요청받을 때, React를 추천하는지 확인하기 위한 간단 테스트 수행
    • Anthropic Claude 3.5 Sonnet: 세 번 모두 React + Tailwind로 프로젝트 생성 예시를 제공함
    • OpenAI ChatGPT 4o: 세 번 모두 React + Tailwind로 앱을 생성하고, Canvas 기능으로 미리보기 제시함
    • Google Gemini 2.0 Flash: 세 번 모두 바닐라 HTML/CSS/JS를 사용했으나, React, Angular, Vue 사용을 권장함
    • DeepSeek-V3: 바닐라 HTML/CSS/JS나 Node.js, Express.js, MongoDB, Bootstrap 같은 다양한 조합을 제시함. 다만 구체적인 코드보다 프로젝트 개요 형태로 제안함
  • 이 결과 Claude와 ChatGPT는 React + Tailwind를 매우 선호하고, Gemini는 HTML/CSS/JS 선호지만 React를 추천, DeepSeek은 기술 편차가 가장 크지만 출력 품질은 다소 개요 중심임

회고

  • 초보 개발자나 프롬프트로만 앱을 만드는 사람은 ChatGPT 등의 결과물을 그대로 수용할 가능성이 큼
  • 다른 프레임워크를 선택해도, 모델이 시스템 프롬프트 등 내부 규칙에 의해 계속 React로 유도할 수 있음
  • 이미 AI와 잘 호환된다고 알려진 기술을 선택하는 분위기가 생길 수 있으며, 이는 신규 혹은 소수 기술의 확산을 방해함
  • 대형 언어 모델의 편향이 현재 인기 기술의 수명을 늘리고, 신규 기술의 시장 진입 장벽을 높이는 방향으로 작용한다고 봄
  • AI 회사들이 모델의 기술 편향 정보를 명시적으로 공개할 필요성을 제안함
  • 향후 연구로, 특정 기술이 포함된 시스템 프롬프트의 시계열 변화와 패키지 다운로드 추이를 비교해 상관성을 찾는 방법 등을 고려할 수 있음. 다만 변수가 많아 잡음이 많을 가능성이 있음

[참고 1] ‘가장 인기 있는 AI 챗 플랫폼’은 작성자의 주관적 관찰에 근거함
[참고 2] Claude와 ChatGPT는 artifact, canvas 기능으로 사용자에게 쉽고 즉각적인 결과물을 제공하기 때문에, 개발 입문자나 새로운 사용자에게 특히 영향을 크게 미침

이건 스택 오버플로도 마찬가지 아닐까요?

역설적인 것 같은데, 스스로 학습하는 능력을 키우는것이 AI 시대속에 경쟁력을 키우는 방법 같다는 생각이 듭니다.

Hacker News 의견
  • AI는 새로운 기술 채택을 방해하지 않음

    • 새로운 기술이나 버전 업그레이드는 사람들이 익숙해지는 데 시간이 걸림
    • Stack Overflow가 새로운 기술 채택을 방해한다고 말하는 것과 같음
    • LLM은 상업적 이유로 주기적으로 재훈련됨
    • 초기 수용자들은 LLM에 의존하지 않음
  • OpenAI Codex 논문에서 예측된 사항

    • Codex가 제안하는 패키지가 더 유용할 것이라는 가정 하에 사용자가 Codex의 답변을 수용할 가능성이 있음
    • 새로운 패키지에 대한 인식 부족 가능성
    • 기존 패키지에 대해 폐기된 방법을 제안할 수 있음
    • 오픈 소스 개발자들이 이전 버전과의 호환성을 유지하려는 동기가 증가할 수 있음
  • 새로운 기술은 데이터와 급여를 빨아들이는 쓰레기라는 의견

    • 사람들이 새로운 기술에 피로감을 느낌
    • 데이터와 급여를 빨아들이지 않는 새로운 것을 제안해야 함
  • LLM이 특정 기술을 명시하면 그 기술을 사용해야 한다는 의견

    • 기술을 명시하지 않으면 기술 선택에 대해 명확히 하고 질문해야 함
    • LLM은 제공자의 프롬프트 구조에 의해 고정된 선호도를 가지지 않아야 함
    • React와 같은 편향을 방지하기 위한 작업 필요
    • 기술 회사로부터 투자받는 Anthropic에 대한 우려
    • LLM이 AWS, Azure, GCP 등에서 추천을 받을 수 있는지 여부를 결정할 수 있음
  • LLM이 Elm과 같은 언어에 유용할 것이라는 의견

    • 평가 루프에서 작동할 수 있는 에이전트와 함께 사용
  • 데이터 시각화에 matplotlib 사용 경험 공유

    • AI가 코드 없이 그래프 변경을 요청할 수 있을 정도로 잘 작동함
    • 새로운 것에 대한 문이 닫히고 있다는 느낌
    • Emacs lisp와 같은 다른 예시
  • 새로운 프레임워크와 기술 채택에 대한 LLM의 영향에 대한 질문

    • React에 대한 질문은 좋은 답변을 얻지만 새로운 프레임워크에 대한 질문은 그렇지 않음
    • AI 도구에 의존하는 개발자가 증가함에 따라 새로운 기술 채택이 어려워질 수 있음
  • Claude 3.5 Sonnet의 코드 생성 선호도 문제

    • React로 코드를 생성하거나 기존 코드를 React로 변경하는 경향
  • 최신 JavaScript 프레임워크를 사용하는 개발자에 대한 예시

    • AI 도구가 의미 있는 지침을 제공하지 못함
    • Django와 React가 당연한 선택으로 여겨지는 세계가 더 저렴한 웹 앱 개발을 가능하게 함
  • Anthropic이 추진하는 MCP 표준의 예시

    • Claude가 프로토콜을 이해할 수 있도록 최적화된 긴 텍스트/MD 제공
    • 새로운 플러그인/서버 부트스트랩에 유용
    • 몇 달 된 표준이 이미 수백 개의 구현을 가짐