내일의 눈
'인공지능(AI) 디지털교과서'에 대한 기대와 우려
2023-08-30 12:26:29 게재
교육부가 인공지능(AI) 디지털교과서 개발에 시동을 걸었다. 교육부가 그동안 주장한 '에듀테크를 활용해 교육격차를 완화하고 모두를 인재로 키우는 맞춤교육 실현'을 위한 여정이 시작된 것이다. 교육부의 도전은 전례 없는 일이라 의미가 있다. 특히 맞춤교육으로 가는 디딤돌이 될 수 있어 기대가 크다.
지난 6월 발표한 'AI 디지털교과서 추진방안'에 따르면 학생은 학습 수준과 속도에 맞는 배움을 할 수 있다. 앞서 AI 교수학습 플랫폼을 운영하고 있는 교육청 사례를 살펴보면 인공지능 기반 맞춤형 학습 분석을 위한 교육과정 데이터셋, 교과 지식 데이터셋, 학습분석 데이터셋 등 다양한 교육데이터 구축에 교사와 교육 전문가들이 많은 시간을 할애했다. AI 디지털교과서는 발행사마다 개발 전문성의 차이가 있어 단기간에 높은 수준에 도달하기 어렵다.
특정 기업 독과점 형태로 의도 변질
또한 다양한 출판사들이 공교육에서 학생들의 데이터를 다루는 만큼 그에 따른 표준 학습 데이터 수집에 대한 명확한 기준과 투명성, 책임성이 따라야 한다. AI 디지털교과서에서 공교육 교수학습 활동 데이터의 수집, 저장, 분석으로 이어지는 일련의 학습분석 시스템을 개발하기 위한 유의 사항은 이미 언론을 통해 여러 차례 지적 되었다.
우선 AI 디지털교과서 학습 데이터 수집 체계를 보면 AI 디지털교과서는 전국 모든 학생이 사용하기 때문에 출판사별 학습 데이터를 수집하는 방법이 다를 경우 많은 혼란이 가중될 수 있다. 현재 국가에서 운영하는 24개의 공공플랫폼이 학습활동 데이터를 수집·활용하는 데 어려움을 겪는 것은 중앙에서 데이터 수집 표준을 가지고 있지 않기 때문이다. AI 디지털교과서 또한 교육 데이터 수집 표준을 제시해야 출판사에서 표준에 맞게 교수학습 활동 데이터를 수집하고 활용할 수 있다.
더 큰 문제는 교수학습 데이터를 수집하고 분석할 수 있는 기업이 현재 전무한 상황이다. 출판사와 에듀테크 기업이 컨소시엄을 통해 디지털교과서를 개발하더라도 관련 기술을 확보하는 데 많은 시간과 예산이 소요될 수밖에 없다. 민간에서 투자에서 기술 상용화에 이르기까지 많은 시간과 예산이 소요될 것이며 AI 교과서가 제 역할을 하는데 생각보다 많은 시간이 소요 될 것이다.
또한 공교육 데이터를 저장하는 학습기록 저장소(LRS)를 출판사마다 구축하더라도 국가 단위의 교육데이터 센터는 별도 구축 운영해야 한다는 지적이 나온다. 학습기록 저장소(LRS)를 구축하기 위해 막대한 예산을 투자한 기업은 국가가 요구하는 데이터를 은폐하고 제공하지 않을 가능성도 있기 때문이다.
이런 과제들을 민간 기업에 요구하는 것은 AI 디지털교과서 생태계를 빈익빈 부익부 체제로 만들 뿐 아니라 특정 기업의 독과점 형태로 의도가 변질될 수 있다. 몇년 후 AI 디지털교과서 사업을 통해 공교육 데이터를 독점으로 관리·운영하는 거대 민간 플랫폼 기업이 나타나 공교육을 장악할뿐더러 데이터를 활용해 민간 서비스를 고도화할 수도 있다.
민감 데이터 민간 기업 관리 위험성
AI 디지털교과서에서 발생하는 학습데이터로 학습 분석을 제공하는 것 또한 출판사로서는 해결하기 어려운 과제이다. 교과에 특화된 학습 분석 정보를 제공하기 위해서는 현행 교육과정과 교과목별 연관 내용을 분석해야 한다. 이 자체도 매우 방대한 작업이다. 학습 분석에는 개인별 학습 현황, 학업 성취도 등 인지적 영역, 성취 목표, 교과 흥미도 등 정의적 영역과 개인별 추천 콘텐츠, 지원 필요 사항 등이 포함된다. 이를 해결하려면 교과 간, 학년 간 내용 분석이 필요하다. 단일교과 또는 국어, 수학, 과학 등 도구교과 중심의 출판사는 가이드라인을 충족하는 결과물을 제공하기는 힘들 것으로 보인다.
데이터 관리의 문제는 더 엄중하다. 민간 기업이 학생과 교사의 원천 데이터를 관리하는 사례는 전 세계적으로 드물다. 구글이나 MS도 표면적으로는 교수학습 활동 데이터 수집을 하지 않는다고 한다. 학생, 교사의 데이터 수집과 활용 권한을 민간에게 허용하는 사례는 전례 없는 일이다. 데이터의 안정성과 신뢰성 보장, 개인정보 데이터 보안과 정보보호를 위한 데이터 관리 정책 수립이 선제적으로 이뤄져야 한다.
교육부의 디지털교과서 가이드라인에는 AI 디지털교과서에서 발생하는 학습 원천 데이터를 민간에서 가공한 후 데이터셋으로 국가 데이터 허브에 전송하는 내용이 담겨 있다. 학생의 민감한 데이터는 원천 데이터에 있는데, 이를 민간 기업에서 관리하게 하는 것은 잠재적 위험성이 크다. 한 출판사에서 학생들의 학습과 관계된 모든 데이터를 활용해 학생들의 현재 학업능력뿐만 아니라 미래의 학업능력을 추론할 수 있다면 어떻게 될까?
이 정보를 활용해 자사의 서비스를 개선 또는 신규 개발하려 할 것이다. 데이터 가공에 드는 막대한 시간과 기술, 예산을 위임하는 대가라기엔 공교육에 가져오는 위협이 크다. 출판사의 원천 데이터를 국가가 제공받아 기업이 요구하는 데이터셋을 구축해 서비스하는 것이 올바른 대안이다. 교육부는 교육데이터 정책을 좀 더 세밀하게 짜야 한다. 교육 데이터 관리에 대한 국가의 책무를 저버려선 안 된다. 디지털교과서 정책에 대한 보다 면밀한 검토와 고민이 필요하다.
지난 6월 발표한 'AI 디지털교과서 추진방안'에 따르면 학생은 학습 수준과 속도에 맞는 배움을 할 수 있다. 앞서 AI 교수학습 플랫폼을 운영하고 있는 교육청 사례를 살펴보면 인공지능 기반 맞춤형 학습 분석을 위한 교육과정 데이터셋, 교과 지식 데이터셋, 학습분석 데이터셋 등 다양한 교육데이터 구축에 교사와 교육 전문가들이 많은 시간을 할애했다. AI 디지털교과서는 발행사마다 개발 전문성의 차이가 있어 단기간에 높은 수준에 도달하기 어렵다.
특정 기업 독과점 형태로 의도 변질
또한 다양한 출판사들이 공교육에서 학생들의 데이터를 다루는 만큼 그에 따른 표준 학습 데이터 수집에 대한 명확한 기준과 투명성, 책임성이 따라야 한다. AI 디지털교과서에서 공교육 교수학습 활동 데이터의 수집, 저장, 분석으로 이어지는 일련의 학습분석 시스템을 개발하기 위한 유의 사항은 이미 언론을 통해 여러 차례 지적 되었다.
우선 AI 디지털교과서 학습 데이터 수집 체계를 보면 AI 디지털교과서는 전국 모든 학생이 사용하기 때문에 출판사별 학습 데이터를 수집하는 방법이 다를 경우 많은 혼란이 가중될 수 있다. 현재 국가에서 운영하는 24개의 공공플랫폼이 학습활동 데이터를 수집·활용하는 데 어려움을 겪는 것은 중앙에서 데이터 수집 표준을 가지고 있지 않기 때문이다. AI 디지털교과서 또한 교육 데이터 수집 표준을 제시해야 출판사에서 표준에 맞게 교수학습 활동 데이터를 수집하고 활용할 수 있다.
더 큰 문제는 교수학습 데이터를 수집하고 분석할 수 있는 기업이 현재 전무한 상황이다. 출판사와 에듀테크 기업이 컨소시엄을 통해 디지털교과서를 개발하더라도 관련 기술을 확보하는 데 많은 시간과 예산이 소요될 수밖에 없다. 민간에서 투자에서 기술 상용화에 이르기까지 많은 시간과 예산이 소요될 것이며 AI 교과서가 제 역할을 하는데 생각보다 많은 시간이 소요 될 것이다.
또한 공교육 데이터를 저장하는 학습기록 저장소(LRS)를 출판사마다 구축하더라도 국가 단위의 교육데이터 센터는 별도 구축 운영해야 한다는 지적이 나온다. 학습기록 저장소(LRS)를 구축하기 위해 막대한 예산을 투자한 기업은 국가가 요구하는 데이터를 은폐하고 제공하지 않을 가능성도 있기 때문이다.
이런 과제들을 민간 기업에 요구하는 것은 AI 디지털교과서 생태계를 빈익빈 부익부 체제로 만들 뿐 아니라 특정 기업의 독과점 형태로 의도가 변질될 수 있다. 몇년 후 AI 디지털교과서 사업을 통해 공교육 데이터를 독점으로 관리·운영하는 거대 민간 플랫폼 기업이 나타나 공교육을 장악할뿐더러 데이터를 활용해 민간 서비스를 고도화할 수도 있다.
민감 데이터 민간 기업 관리 위험성
AI 디지털교과서에서 발생하는 학습데이터로 학습 분석을 제공하는 것 또한 출판사로서는 해결하기 어려운 과제이다. 교과에 특화된 학습 분석 정보를 제공하기 위해서는 현행 교육과정과 교과목별 연관 내용을 분석해야 한다. 이 자체도 매우 방대한 작업이다. 학습 분석에는 개인별 학습 현황, 학업 성취도 등 인지적 영역, 성취 목표, 교과 흥미도 등 정의적 영역과 개인별 추천 콘텐츠, 지원 필요 사항 등이 포함된다. 이를 해결하려면 교과 간, 학년 간 내용 분석이 필요하다. 단일교과 또는 국어, 수학, 과학 등 도구교과 중심의 출판사는 가이드라인을 충족하는 결과물을 제공하기는 힘들 것으로 보인다.
데이터 관리의 문제는 더 엄중하다. 민간 기업이 학생과 교사의 원천 데이터를 관리하는 사례는 전 세계적으로 드물다. 구글이나 MS도 표면적으로는 교수학습 활동 데이터 수집을 하지 않는다고 한다. 학생, 교사의 데이터 수집과 활용 권한을 민간에게 허용하는 사례는 전례 없는 일이다. 데이터의 안정성과 신뢰성 보장, 개인정보 데이터 보안과 정보보호를 위한 데이터 관리 정책 수립이 선제적으로 이뤄져야 한다.
교육부의 디지털교과서 가이드라인에는 AI 디지털교과서에서 발생하는 학습 원천 데이터를 민간에서 가공한 후 데이터셋으로 국가 데이터 허브에 전송하는 내용이 담겨 있다. 학생의 민감한 데이터는 원천 데이터에 있는데, 이를 민간 기업에서 관리하게 하는 것은 잠재적 위험성이 크다. 한 출판사에서 학생들의 학습과 관계된 모든 데이터를 활용해 학생들의 현재 학업능력뿐만 아니라 미래의 학업능력을 추론할 수 있다면 어떻게 될까?
이 정보를 활용해 자사의 서비스를 개선 또는 신규 개발하려 할 것이다. 데이터 가공에 드는 막대한 시간과 기술, 예산을 위임하는 대가라기엔 공교육에 가져오는 위협이 크다. 출판사의 원천 데이터를 국가가 제공받아 기업이 요구하는 데이터셋을 구축해 서비스하는 것이 올바른 대안이다. 교육부는 교육데이터 정책을 좀 더 세밀하게 짜야 한다. 교육 데이터 관리에 대한 국가의 책무를 저버려선 안 된다. 디지털교과서 정책에 대한 보다 면밀한 검토와 고민이 필요하다.
김기수 기자 kskim@naeil.com
김기수 기자 기사 더보기