ChatGPT 확산 이후 성적 상승―학습 효과 아닌 대행이 원인
캘리포니아대학교 버클리 캠퍼스의 연구가 ChatGPT 등장 이후 50만 건 이상의 성적 데이터를 분석한 결과, 글쓰기와 프로그래밍 과목을 중심으로 성적 상승이 확인되었다. 성적의 상승은 주로 숙제에 집중되어 있으며, AI가 학습을 심화하는 것이 아니라 과제를 대신 처리하고 있을 가능성을 보여주고 있다.

캘리포니아대학교 버클리 캠퍼스의 연구에 따르면 ChatGPT 등장 이후 학생들의 성적이 상승하고 있는 실태가 드러났다. 다만 그 상승은 학습 능력의 향상을 의미하는 것이 아니라 AI가 학생들의 과제 자체를 '대신 처리하고 있을' 가능성을 강하게 시사하고 있다.
이번 연구에서는 50만 건을 초과하는 성적 데이터가 분석 대상이 되었다. 조사 결과, 특히 글쓰기와 프로그래밍을 많이 다루는 수업에서 ChatGPT가 공개된 시점을 경계로 성적의 현저한 상승이 확인되었다. 이들은 모두 AI가 잘하는 작업과 겹치는 분야들이다.
더욱 주목할 점은 성적 상승이 주로 '숙제' 평가에 집중되어 있었다는 것이다. 시험이나 수업 내 과제가 아니라 집에서 진행하는 과제에서만 성적이 오르고 있다는 경향은 학생들이 AI를 학습의 보조수단이 아니라 제출물의 '대필 도구'로 활용하고 있음을 시사하고 있다. 만약 학습 자체가 심화되고 있다면 시험 성적에도 유사한 변화가 나타나야 하겠지만, 그러한 증거는 확인되지 않고 있다.
이러한 현상이 대두된 배경에는 생성 AI의 급속한 확산이 있다. ChatGPT는 2022년 11월에 공개되었고, 순식간에 전 세계 학생들에게 퍼져나갔다. 대학 교육 현장에서는 AI 활용 규칙 정비가 확산 속도를 따라가지 못하고 있으며, 학술적 성실성을 어떻게 지킬 것인가라는 과제가 전 세계 여러 곳에서 논의되고 있다.
이 연구가 지니는 의미는 단순히 '부정행위가 늘었다'는 문제에 그치지 않는다. 성적이 실제 학력을 정확히 반영하지 못하게 된다면 대학이 학습 성과를 측정하는 기반 자체가 흔들릴 것이다. 채용 기업이나 대학원 등 성적을 바탕으로 인재를 평가하는 체계 전체에도 영향이 미칠 수 있다는 관점이 가능하다.
한편 AI를 사용해 생각을 정리하거나 글의 구성을 배우는 것과 같은 '보조적 활용'이 해롭지 않은지에 대해서는 여전히 논의의 여지가 있다. 문제의 핵심은 AI가 학습 과정을 지원하는지, 아니면 통째로 대체하는지라는 점에 있다고 할 수 있다. 향후 교육 현장에서는 과제 설계 방법과 평가 방식을 재검토하는 움직임이 요구될 것으로 위치지어진다.
버클리 캠퍼스의 이번 조사는 50만 건을 초과하는 대규모 데이터에 바탕을 두고 있으며, 개별 사례가 아니라 구조적 추세로 파악된다는 점이 중요하다. 생성 AI가 교육에 미치는 영향을 정량적으로 보여준 연구로서 향후 정책 수립과 교육 설계 논의에서 참조될 가능성이 있다.
본 기사는 AI issue 편집부가 사실(fact)을 바탕으로 독자적으로 작성·편집한 저작물입니다. 저작권은 AI issue에 있으며, 무단 전재·재배포 및 AI 학습·활용을 금합니다.