- Anthropic은 Claude.ai에서 발생한 100만 건의 익명 대화 데이터를 분석하여 실제 교육 환경에서 대학생들이 AI를 어떻게 활용하는지 조사
- 기존의 설문조사나 실험 기반 연구의 한계를 보완하는 최초의 대규모 실사용 분석임
주요 발견 요약
- STEM 계열 학생들이 Claude 도입에 가장 적극적이며, 특히 Computer Science 전공이 전체 대화의 36.8%를 차지했음 (미국 학위 비중은 5.4%에 불과)
- 학생의 AI 사용 방식은 네 가지 유형으로 나뉨: 직접 문제 해결, 직접 출력 생성, 협업 문제 해결, 협업 출력 생성
- 대부분의 학생들은 '창조(Creating)'와 '분석(Analyzing)' 같은 고차 인지 기능에 Claude를 활용하고 있음
- 이는 Bloom의 교육 목표 분류 체계의 상위 단계에 해당하며, AI에 의존함으로써 비판적 사고력 약화를 우려할 수 있음
교육용 AI 사용 유형 식별 방식
-
Clio라는 내부 분석 도구를 사용하여 Claude 대화를 주제별로 분류하고, 개인 정보를 제거한 뒤 집계함
- 100만 건 중 574,740건이 학업 또는 연구와 직접 관련된 대화로 식별됨
- Clio는 ‘코드 디버깅’, ‘경제 개념 설명’ 등 상위 개념으로 자동 분류하여 분석함
학생들이 Claude를 사용하는 목적
- 전체 대화 중 39.3%는 교육 콘텐츠 생성과 향상에 사용됨 (예: 연습문제 제작, 에세이 편집, 요약 등)
- 33.5%는 과제 해결 및 기술적 설명을 위한 사용 (예: 코드 디버깅, 알고리즘 구현, 수학 문제 풀이 등)
- 기타 사용 목적:
- 데이터 분석 및 시각화: 11.0%
- 연구 설계 및 도구 개발: 6.5%
- 기술 다이어그램 생성: 3.2%
- 언어 번역 및 교정: 2.4%
학문 분야별 Claude 사용 비율 비교
-
과도하게 사용된 전공:
- Computer Science: 학위 비중 5.4% → 대화 비중 38.6%
- 자연과학 및 수학: 학위 비중 9.2% → 대화 비중 15.2%
-
적게 사용된 전공:
- Business: 18.6% → 8.9%
- Health Professions: 13.1% → 5.5%
- Humanities: 12.5% → 6.4%
- STEM 학생들이 Claude를 빠르게 수용하고 있음
학생-AI 상호작용 유형 분석
- 두 가지 축을 기준으로 네 가지 상호작용 유형을 정의함:
-
직접 vs 협업 (응답을 빠르게 얻기 vs AI와의 대화형 협업)
-
문제 해결 vs 출력 생성 (질문에 대한 해결책 vs 에세이 등 출력 생성)
- 네 가지 유형은 각각 전체 대화의 23~29%를 차지하여 비율이 고르게 분포됨
- 긍정적 학습 예시:
- 철학 개념 설명
- 화학 교육 자료 제작
- 근육 해부학 개념 설명
AI를 이용한 부정행위 가능성
- 약 47%의 대화가 직접형 상호작용으로, 부정행위 가능성이 있음
- 예: 기계학습 문제 정답 요청, 시험문제 답안 요청, 표절 회피 문장 재작성
- 협업형 대화도 학습 기여도가 낮을 수 있음
전공별 상호작용 패턴
-
자연과학 및 수학: 문제 해결 위주 (예: 단계별 풀이 요청)
-
컴퓨터공학, 공학, 자연과학: 협업형 상호작용 선호
-
인문학, 비즈니스, 보건계열: 직접형과 협업형 균형
-
교육 전공: 출력 생성 비중이 가장 높음 (74.4%)
- 교사들이 교육 자료 및 수업 계획서 작성을 위해 Claude를 사용하는 사례 포함
학생이 AI에 위임하는 인지 작업 분석
- Bloom’s Taxonomy를 기반으로 Claude가 수행한 인지 기능 분석
- 상위 인지 작업 비중:
- 창조(Creating): 39.8%
- 분석(Analyzing): 30.2%
- 하위 인지 작업 비중:
- 적용(Applying): 10.9%
- 이해(Understanding): 10.0%
- 기억(Remembering): 1.8%
- 생성형 AI가 상위 사고 기능을 수행할 수 있음은 교육적으로 유의미하나, 학습자 역량 저하를 유발할 가능성 있음
연구의 한계점
- 초기 도입자 중심 데이터일 가능성이 높음
- Claude 외 다양한 AI 사용은 반영되지 않음
- 일부 데이터는 교수나 직원의 대화일 수 있음
- 학기 중 시기에 따른 사용 차이는 반영하지 않음
- AI의 출력이 실제 학습 성과에 기여하는지 여부는 분석하지 않음
- 전공 간 융합적 활용 사례는 분류되지 않음
- Bloom 분류 체계를 AI에 적용하는 데 한계 있음
결론 및 향후 과제
- AI는 학습에 많은 가능성을 제공하나, 비판적 사고 및 학습 윤리 측면에서 도전 과제도 큼
- 핵심 질문:
- AI 시대에도 학생이 기초 인지 역량을 갖추려면 어떻게 해야 하는가?
- 시험과 평가 기준을 어떻게 재정의할 것인가?
- AI가 에세이 작성, 복잡한 문제 해결까지 할 수 있는 시대에 학습의 의미는 무엇인가?
- Claude는 이미 교육 현장에서 의미 있는 학습 도구로 사용 중이며, 교육자와의 협력도 확대 예정
Anthropic의 교육 접근법
- 대학과의 협력을 통해 AI의 교육적 역할을 지속적으로 연구 중
- 직접 해답 제공보다는 개념 이해 중심의 'Learning Mode' 실험 중
- 향후 AI가 학습에 어떤 영향을 주는지 심층 연구할 계획