1P by GN⁺ | ★ favorite | 댓글 1개
  • Berkeley CS 수업의 낙제율은 2026년 봄 CS 10 35.3%, CS 61A 10.6%로 과거 학기보다 크게 높아졌고, 하위 과정 D·F 비율 7%와 평균 GPA 2.8~3.3이라는 EECS 지침에서 벗어남
  • Dan Garcia는 Claude, ChatGPT, Google Gemini 같은 LLM 사용으로 학업 부정행위가 크게 늘어난 점을 비정상적 낙제율의 “primary driver”로 봤고, CS 10에서는 거의 30명이 take-home exam 부정행위로 적발됨
  • 두 수업은 곡선 보정 없이 공개된 점수 기준으로 성적을 매겨 학생 성적이 동료 성과에 좌우되지 않았고, Garcia는 곡선 보정이 문제를 숨긴다고 봄
  • Gireeja Ranade의 EECS 127도 수학 준비도 부족과 인력 부족을 겪으며 F 비율 16.8%를 기록했고, 기존 기말 프로젝트는 조교 부족으로 빠졌으며 오피스아워 참여도 낮아짐
  • AI 시대의 Berkeley CS·EECS 수업은 학생이 어려운 문제와 혼란을 견디며 비판적·분석적 사고를 익히도록 더 많이 가르치고 보충 지원을 찾는 방향으로 재검토되는 중임

낙제율 급등과 성적 지침 이탈

  • Berkeleytime 기준 2026년 봄 CS 10 학생의 35.3%, CS 61A 학생의 10.6%가 F를 받음
  • 2025년 봄과 2024년 봄에는 두 수업 모두 F 비율이 10%를 넘지 않았음
  • EECS 학과 성적 지침은 CS 10과 CS 61A 같은 하위 과정에서 D와 F를 받는 학생 비율을 7%로 제시함
  • 지침상 하위 과정의 일반적인 GPA 범위는 2.8~3.3이지만, 2026년 봄 두 수업 평균 성적은 C+로 GPA 2.3에 해당함

LLM 의존과 부정행위 문제

  • Dan Garcia는 2026년 봄 CS 10 “The Beauty and Joy of Computing”과 CS 61A “The Structure and Interpretation of Computer Programs”를 모두 가르침
  • Garcia는 Claude, ChatGPT, Google Gemini 같은 대규모 언어 모델 사용으로 인한 학업 부정행위 증가를 비정상적으로 높은 낙제율의 “primary driver”로 봄
  • 일부 낙제 성적은 부정행위 적발과 징계 절차 이관에서 비롯됐고, 다른 경우에는 학생들이 LLM에 과도하게 의존한 뒤 시험에서 준비가 부족했던 것으로 봄
  • 2026년 봄 CS 10에서는 거의 30명이 take-home exam 부정행위로 적발됨

곡선 보정 없는 채점 방식

  • Garcia의 두 수업은 곡선 보정이 아니라 각 letter grade에 대한 점수 기준으로 채점됐음
  • 이 방식에서는 학생 성적이 동료 학생의 성과에 의존하지 않음
  • Garcia는 각 letter grade 기준을 공개하고 학생에게 기준에 도달할 기회를 많이 주는 방식을 선호함
  • Garcia는 Harvard처럼 일부 학생만 A를 받을 수 있게 하는 방식에 강하게 반대하며, 곡선 보정이 실제 문제를 숨긴다고 봄

수학 준비도와 EECS 127의 어려움

  • Garcia는 AI 과의존 외에도 많은 학생이 수학적으로 준비되지 않았다고 봤고, Gireeja Ranade도 같은 우려를 공유함
  • Ranade의 2026년 봄 EECS 127 “Optimization Models in Engineering”은 F 비율 16.8%를 기록했으며, EECS 학과가 상위 과정의 “typical” D·F 비율로 제시한 5%보다 훨씬 높음
  • EECS 127 학생들은 선형대수, 벡터 미적분, 수학적 증명을 이수한 상태로 들어오는 것이 기대됐지만, Ranade는 오피스아워에서 많은 학생이 선형대수에 어려움을 겪는 것을 확인함
  • 한 학생은 UC Berkeley에서 들은 선형대수 수업의 숙제와 시험에 “open-internet, open-AI policy”가 있었다고 Ranade에게 말함
  • Garcia와 Ranade는 UC 시스템 STEM 입학에서 ACT와 SAT 표준화 시험 점수 재도입을 요구하는 청원에 서명한 1,300명 이상의 UC 교수진에 속함

인력 부족과 학생 참여 감소

  • EECS 127은 과거에 교수와 조교 팀의 지도를 받는 기말 프로젝트가 있었고, Ranade는 대부분의 학생이 이 부분에서 높은 점수를 받는다고 봄
  • 2026년에는 인력 부족 때문에 Ranade가 이 기말 프로젝트를 수업에서 제외함
  • EECS 학과장 Jelani Nelson의 X 게시물 기준, 캠퍼스는 EECS 조교의 높은 시급 때문에 학부 CS 등록 인원과 학부 조교 수를 모두 줄여야 했음
  • Ranade의 오피스아워는 과거에 사람이 넘쳤지만, 이번 학기에는 학생들에게 자주 참여를 권해도 참여가 매우 낮았음
  • Garcia도 지난 두 학기 동안 오피스아워 출석 부족을 비슷하게 겪었고, 처음으로 아무도 오지 않는 오피스아워를 경험함

수업 재설계와 학습 태도

  • Garcia는 앞으로 수업 첫날에 2026년 봄에 벌어진 일을 알리고, 추가 보충 지원이 필요한 학생을 식별하는 방법을 찾을 계획임
  • Ranade는 AI 시대에 교수들이 학생에게 “더 많이, 덜이 아니라” 가르쳐야 한다고 봄
  • Ranade는 학생들이 경쟁적인 세계에서 리더가 되는 데 필요한 비판적 사고와 분석적 사고를 갖추길 원함
  • 두 교수 모두 학생들이 어려운 문제에 더 편안해질 필요가 있다고 봄
  • Garcia는 동료의 표현인 “Confusion is the sweat of learning”을 인용하며, 많은 학생이 그 “땀”을 충분히 흘리지 않는다고 봄

댓글과 토론

Hacker News 의견들
  • LLM이 학생 때 있었다면 숙제를 “빠르게 끝내는” 데 쓰고 시험은 전부 망쳤을 것 같아, 지금 학생들에게 어느 정도 공감함
    지금은 대부분 박사들과 일하지만, 늘 최상위권이던 사람들조차 사고 능력이 빠르게 떨어지는 게 보임. LLM이 90%를 해주지 않으면 브레인스토밍, 코딩, 깊은 사고, 글쓰기를 못 하는 사람이 많아졌고, 독창적 사고에 필요한 30분간 조용히 혼자 생각하기도 어려워짐
    성인은 시험이 없고 LLM 덕분에 산출량은 유지되니 인지 저하가 잘 측정되지 않겠지만, 이미 주변 곳곳에서 일어나고 있다고 봄. 부정하고 싶었지만 이제는 너무 명확해서 무시하기 어려움

    • 내 능력이 LLM 사용 이후 특별히 더 떨어졌다는 느낌은 없음. 학부를 20년 전에 마쳤고, 한때 날카롭던 수학 실력은 졸업 후 5~10년 만에 크게 줄었음
      암산으로 빠르게 하던 단순 산술과 백분율도 계산기와 스프레드시트에 의존하게 됐고, 잡학 지식은 주머니 속 인터넷 RAM에 맡겨버림. “아, 예전엔 알았는데 찾아봐야겠다”는 감각이 익숙함. 어쩌면 LLM 이전에 이미 개인적인 멍청함의 바닥에 닿았을지도 모름
      다만 요즘 커뮤니케이션 상태는 엄청난 정신적 부담으로 느껴짐. 이메일, 음성사서함, 채팅, 온라인, 문자, 개인, 업무, 집, 아이들, 가족, 친구, Messages, Messenger, WhatsApp 등 동시에 수많은 대화와 스레드를 굴려야 함. 그런데도 주변 사람들보다 훨씬 덜 연결된 편임. 감당할 여력이 없어서 대부분의 뉴스와 모든 스포츠를 끊었음
      내 뇌는 인터넷 이전에 형성됐고, 아날로그에서 디지털로 변환하는 과정이 한계에 다다른 느낌임. 적어도 매우 손실이 큰 변환처럼 느껴짐
    • 실제 인지 능력이 AI 사용으로 떨어졌다고 보진 않지만, 인내심과 집중 시간은 확실히 훨씬 줄어든 걸 느낌
      새 직장에서 새로운 코드베이스를 배우는 중인데, AI는 정말 양날의 검임. 한편으로는 코드베이스에 대해 질문할 때 엄청 유용하지만, 조심하지 않고 조사하기도 전에 수정안을 적용하게 두면 코드베이스를 전혀 제대로 배우지 못함. 이해를 유지하려면 실제로 새 코드를 직접 작성하며 필요한 정신적 근육을 써야 함
      동시에 이 큰 코드베이스는 AI의 한계도 보여줌. 이해 없이 기능을 분위기로 밀어붙이면 문제를 많이 만들 수밖에 없음. 표적화된 버그 수정조차 LLM이 보지 못하는 의도치 않은 결과가 많음. 나쁜 코드베이스는 아니지만, 최전선 모델도 버거워하는 규모임. 그래서 “AI 문제는 더 많은 AI로 풀면 되니 코드베이스를 이해할 필요 없다”는 주장은 지금은 성립하지 않는다고 봄
    • 대학 때 Google Translate로 프랑스어를 배우지 않은 채 넘어갔음. 다행히 품질이 너무 나빠서 출력물을 꼼꼼히 검토해야 했지만, 그래도 기본적인 언어 능력조차 기르지 못한 채 두 학기를 통과했음
      뭔가 과감한 조치가 필요함. 고등학교 수학 수업에는 여전히 “계산기 금지” 제한이 많았고, 긴 산술 계산이 학습을 방해한다고 느껴 싫어했음. 그래서 학생들이 종이만 쓰는 교육 방식에 반발할 수 있다는 건 이해하지만, 고품질 숙제 기계가 바로 옆에 있는 상황에서 뭘 배울 수 있는지도 잘 모르겠음
    • LLM이 있었다면 나도 끝장났을 것 같음. 교사와 대학은 가르치고 평가하는 방식을 바꿔야 할지도 모름
      학생들이 원하는 AI 도구를 쓰게 하되, 전문적으로 쓰는 방법을 안내하고, 정작 익혀야 할 기술과 지식은 오프라인·대면으로 이른 시점부터 자주 시험해야 함. 그리고 부정행위에 F를 주는 대신 정학시키는 게 맞다고 봄
      몇 년 전 어떤 고등학교 교사가 강의를 YouTube에 올려 학생들이 각자 보게 하고, 수업 시간은 상호작용·질문·시험에 썼다는 글을 읽었음
      수정: Claude가 검색보다 빨랐음. 2007년 고등학교 화학 교사 2명의 사례였고, 거꾸로 교실https://fltmag.com/the-flipped-classroom/
    • 박사도 없고 머리도 좋지 않지만, 약 1년 전부터 작은 코딩과 수학을 일부러 수작업으로 하게 만들었음
      “인지 저하”라고까지 느끼진 않지만 훨씬 게을러진 건 보임. 코딩을 처음 시작했을 때는 일상이던 것들도 이제는 무겁게 느껴짐
  • 기사 제목이 암시하는 것과 달리, 진짜 이유는 기사 속 한 문단에 숨어 있을 가능성이 큼. “Garcia와 Ranade는 1,300명 이상의 UC 교수진과 함께 UC 시스템의 STEM 입학에서 ACT와 SAT 표준화 시험 점수 복원을 요구하는 청원에 서명했다. 청원과 공개서한은 학생들의 수학 준비도에 대한 유사한 우려를 자세히 적고 있다”는 부분임
    COVID 전후로 많은 상위권 대학이 형평성을 이유로 입학 시험 요건 폐지를 실험했지만, 거의 모든 곳에서 실패했고 이미 상당수 대학이 되돌리고 있음. Yale은 “팬데믹 전후 연구에서, 모든 지원 요소 중 시험 점수가 미래 Yale 성적을 예측하는 단일 최강 지표였고, 이는 가족 소득과 인구통계 변수를 통제한 뒤에도 같으며 ACT/SAT뿐 아니라 AP·IB 같은 과목 기반 시험에서도 사실”이라고 밝힌 바 있음 https://archive.is/8zxfo
    저 링크는 원문 페이지가 삭제돼 아카이브임. Yale은 한때 점수 제출 여부를 선택할 수 있는 ‘test flexible’ 전략을 실험했지만 곧 폐기하고 시험 점수 요구로 돌아갔음

    • Berkeley 총장은 학생들에게 2020년 California Proposition 16에 투표하라고 했는데, 이는 공립대의 인종 기반 입학을 금지한 1996년 Proposition 209를 되돌리려는 것이었음. Prop 16은 실패했고, 이후 Cal은 SAT/ACT 점수를 무시하기 시작했음
      SAT/ACT 평균이 가장 높은 아시아계 학생을 덜 뽑기 위한 대안이었다고 볼 수밖에 없음. 얼마 지나지 않아 같은 총장에게서 인종 다양성이 늘었다며 변화를 칭찬하는 이메일을 받았고, 이메일의 전후 수치에는 아시아계 비율은 줄고 나머지는 늘어난 것으로 나와 있었음
    • 2021년에 표준화 시험 폐지가 진짜 이유라면, 왜 실패율 급증이 바로 지금 발생하는지 설명이 필요함
    • 미국인이 아니라 맥락을 놓쳤을 수 있는데, 시험 점수 없이 입학은 어떻게 운영됐는지 궁금함
    • SAT 요구사항은 2021년에 폐지됐음. SAT를 안 봤다는 사실만으로 2025년 F 비율 10%가 2026년 35%로 뛰는 건 설명되지 않음
  • CS 교수로서, 바로 어제 병렬 컴퓨팅 과목 프로젝트 토론을 했고 세 그룹 중 한 그룹은 명백히 ChatGPT 방식으로 갔음. LLM이 아키텍처 등에 대해 내린 선택조차 이해하지 못했음
    이런 학생들을 잡는 방법은 예전에 다른 학생에게서 베낀 경우와 비슷함. “스스로 목매달 밧줄을 주는” 식으로, 설명을 요구하다 보면 의도치 않은 막다른 길로 따라가게 됨
    의심스러울 때는 “솔직히 말해보자, 이 코드 중 얼마가 네 것이고 얼마가 ChatGPT 것이냐?”처럼 정직함에 호소하고, 같은 주에 마감이 여러 개 있었을 수 있다는 식의 공감도 제공하는 게 좋다고 봄. 그래도 올바른 방식으로 해야 한다는 교훈을 줄 기회를 놓치면 안 됨
    다른 두 그룹도 LLM을 썼지만 높은 수준의 설계와 아키텍처 보조로 사용했음. 코드를 100% 손으로 쓰진 않았더라도 분명히 자신들이 책임지고 있었고, 문제 해결에 쓴 추론과 전략을 설명할 수 있었음
    동료들과 아직 많은 프로젝트를 검토해야 해서 이런 사례 수를 세어달라고 했는데, 현재까지는 3개 중 1개, 즉 33%

    • 결국 모든 그룹이 사고를 LLM에 외주 준 것 아닌가. 앞으로 다른 유형의 프로젝트에 적용할 만한 걸 배웠을지 의문임
    • “다른 두 그룹도 LLM을 높은 수준과 아키텍처 방식으로 사용했다”면 점수는 3/3, 100% 에 더 가까워 보임
      라이브러리 코드를 복사해 붙여 프로젝트를 만드는 것도 받아들였을까? 아니라면 LLM이 생성한 코드를 쓰는 건 왜 다른지 궁금함
    • 교수 입장에서 LLM과 함께 쓰는 소크라테스식 문답법은 어떻게 보는지 궁금함. 단순히 “정답을 줘”라고 프롬프트하는 것보다 나은가
    • 6년 전에 병렬 컴퓨팅 과목을 들었지만 아직도 아무것도 이해하지 못함. LLM을 개인 튜터처럼 썼다면 아마 이해했을 것 같음
    • 학생들에게 LLM 사용 정책과 가이드를 어떻게 제시했는지 궁금함
  • 인간은 모든 위기 속으로 몽유병처럼 걸어 들어가고, 어떤 것에도 합의하지 못하다가, 막상 도착하면 원인에 대해서도 합의하지 못하는 이상한 존재임
    더 이상 “공학”이나 “과학”을 제대로 할 수 없는 지점에 이르면, 다음 10년은 문제가 정말 AI였는지, AI였더라도 불가피했는지, 아무도 혹은 모두가 책임인지 논쟁하며 보낼 것임. 반복임. 그런데 우리는 오늘 여기서 암울한 미래를 보면서도 또 한 걸음 앞으로 나아가고 있음
    사회가 스스로 조절한다고 가정하는 걸까. 어느 정도는 그렇다고 보지만, 자율 조절의 비용은 정말 높고 고통도 큼. 우리가 첫 번째로 고통받지 않을 가능성이 있으면 그 비용을 받아들일 수 있다고 여기는 건가

    • AI가 온다고 수십 년 동안 경고해 왔음. 좋든 나쁘든 대중문화, SF 책과 영화에 깊이 박혀 있음. 하지만 실제로 무엇을 할지 알아내는 건 전혀 다른 문제임
      이는 문화적 진화이고 시장도 그렇게 작동함. 중앙계획을 기대했던 건가
    • 기후변화 논쟁도 같은 방식으로 흘러갔음
    • 모두가 몽유병처럼 걸어 들어가는 건 아님. 많은 사람이 지붕 위에서 외치지만, 대중은 쉽게 조작됨
  • 성적 데이터는 https://berkeleytime.com/grades에서 온 것임
    선택한 서사를 뒷받침하는 과목만 골랐을까 걱정돼서, 아직 개설 중인 모든 CS 과목에 대해 F 비율을 빨간 선으로 그리고, 해당 과목이 최근 개설된 학기의 성적 부여 수를 하늘색 막대로 표시해 내림차순 정렬했음
    걱정이 맞아 보였음. 앞쪽 차트 몇 개를 보면 최근 몇 학기 동안 F 비율의 큰 증가가 없음
    https://x.com/rahimnathwani/status/2062431813143019525?s=61

    • 기사에서는 CS 10과 61A를 봤다고 하는데, 기억상 Berkeley의 입문 과목들임. 왜 이것이 체리피킹이고, 특히 인용된 교수의 과목처럼 상대평가가 아니라면 합리적인 분석 출발점이 아니라고 보는지 궁금함
    • 반대로 많은 교수진이 학생을 너무 많이 낙제시키지 않으려고 단순히 성적 곡선을 조정하고 있을 수도 있음
      교수에게 낮은 성적을 많이 주지 말라는 유인이 있음. 낮은 성적은 보통 강의 평가를 낮추고, 이는 연봉 인상과 승진에 영향을 줄 수 있으며, 낮은 성적은 행정 쪽의 추가 관심을 불러오는데 어떤 교수도 그걸 원하지 않음
  • 1월에 딸이 수학 수업을 힘들어해서, Claude로 매우 집중적인 연습문제지 생성 도구를 만들었음. 딸이 어려워하는 개념을 반복 훈련하도록 문제를 만들었음
    효과가 있었고, 전통적인 방식으로 했다면 훨씬 어려웠을 것임
    이 도구는 답안지와 풀이 세트를 포함한 PDF를 생성하고, 문제를 여러 기법으로 풀어줘서 딸의 풀이를 더 쉽게 확인하고 빠르게 반복할 수 있었음
    강력한 도구임. 결국 도구를 어떻게 쓰느냐의 문제로 돌아옴. 더 나아지게 쓰는가, 아니면 지름길을 택하는가

    • “더 나아지게 쓰느냐, 지름길을 택하느냐”가 핵심이라면, 사회 차원에서 효율보다 품질을 우선하게 만드는 유인이 어디에 있는지 봐야 함
      모두가 “올바른” 방식으로 한다면 문제가 없겠지만, 사회적 유인은 복잡하고 모순적이라 많은 사람에게 당장의 지름길이 더 매력적으로 보임
      이건 기술 문제인 만큼 사회적 문제이기도 함
  • 별개의 소식처럼 보이지만, “UC Berkeley 수학자들이 이끄는 600명 이상의 University of California 교수진이 과학·기술·공학·수학 지원자에 대한 표준화 시험 요건 복원을 요구하고 있다. 6년간의 시험 없는 입학이 준비도를 신뢰성 있게 평가하지 못했고, 교수들이 신입생에게 중학교 수학을 가르치는 일이 잦아졌다는 이유다”
    https://archive.ph/18spS

    • 실제 서한은 찾기 어려운데 여기 있음: https://ucstudentsuccess.org
    • 학생을 검증하는 표준 기준을 없애는 결정은 대체 누가 하는 건가
      그리고 거기서 가능한 이점이 뭐가 있나
  • LLM이 정말 많이 걱정됨
    15살 아들이 있고, Google Family Link로 휴대폰 사용을 관리함. 대부분은 꽤 열려 있고 설치 알림을 받는 정도지만 Gemini는 강하게 금지해뒀음
    위험성에 대해 길게 이야기해 왔음
    아들은 친구들이 LLM을 자주 쓴다고 말하고, 그게 시험 점수의 이유라고 의심함. 친구들 중 일부는 시험이 20~40%대인 반면, 내 아들은 기출문제를 공부하고 복습 때 질문에 답하며 80% 이상을 받음
    AI 제공업체들이 학생이 LLM으로 숙제 문제를 푸는지 신경 쓰지 않을 게 분명하니 미래가 걱정됨

    • 그래서 표준화 시험이 존재함. 수업 외 시간의 노력과 훈련을 학업·직장 환경에서 요구되는 지루함을 충분히 견디며 능력으로 보여줄 수 있게 하기 때문임
      AI를 위험으로만 볼 게 아니라, 아들이 학습을 가속하고 강화하는 데 어떻게 활용할 수 있을지 봐야 함. 오히려 전통적으로 실패하던 집단의 데이터를 숨기려고 표준화 시험을 없애는 정치적 환경이 진짜 위험임
    • 아들이 무슨 행동을 해서 Google Family Link를 설치한 건지, 아니면 기본적으로 설치한 건지 궁금함
    • Gemini를 강하게 금지한다는 건, 인터넷이 5년 전에 처음 나왔다면 아들에게 인터넷도 금지했을 것처럼 들림
  • “가이드라인은 하위 과목의 일반적인 GPA가 2.8~3.3 범위에 들어야 한다고 한다. Berkeleytime에 따르면 2026년 봄 두 수업의 평균 성적은 C+였고, 이는 GPA 2.3에 해당한다”
    Cal 졸업생으로서 성적 인플레이션에 선을 긋는 모습을 보니 정말 반가움. 내가 받은 GPA를 얻으려고 정말 열심히 일했는데, Cal이 Yale처럼 A와 A-를 79%씩 뿌리는 방향으로 가서 내 노력이 평가절하된다면 매우 싫을 것임: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits

    • 내가 다녔던 UC의 서브레딧을 읽는데, 올해 합격 발표가 나자 합격생 질문이 많이 올라왔음. 그중 1/3에서 1/2 정도가 성적 디플레이션이 얼마나 심한지, 다른 캠퍼스와 비교해 어떤지 묻고 있었음
    • 오래가진 않을 것임. 졸업 후 일자리를 구하려면 좋은 성적이 필요하니, 낮은 성적을 뿌리면 다음 해 지원자가 줄어듦
      그래도 높은 성적 + 오래전 졸업은 여전히 신호로 남음
    • 비인기 의견이지만, 공립대를 학문판 헝거게임으로 만드는 건 존재 목적과 정반대임. 공립대의 목적은 교육받은 시민을 만드는 것임
      의도적으로 수업의 질을 낮추고 시험에서 학생을 함정에 빠뜨리려 하는 건 누구의 교육 성과도 높이지 않음. 성적 인플레이션을 불평하는 사람들은 공교육이 왜 존재하는지 완전히 잊은 것임
  • 안타까움. 최근 수학을 다시 다듬는 재미있는 활동을 시작했는데, 문제를 풀면서 Gemini Live 모드에 확인과 제안을 요청하고 때로는 단계별로 진행함
    마치 아주 인내심 많은 교수가 바로 옆에 서 있는 것처럼 꽤 재미있었음. 지금까지 해본 수학 학습 경험 중 최고에 가까웠고, Gemini에게 호감을 유지하려고 뇌물이나 선물을 보낼 필요도 없음
    반면 스스로 생각해보지 않고 LLM에게 작업을 완전히 끝내게 한다면, 그건 자기 자신에게 하는 부정행위처럼 들림