1. 개요
가) 목적
본 지침은 공교육 분야에서 발생하는 학습데이터를 효과적으로 수집·연계·활용하기 위한 학습데이터 사전의 작성 방법을 제시하는 것을 목적으로 함
학습데이터의 일관성 있는 수집과 체계적인 관리를 위해서는 표준화된 용어 정의가 필수적이며, 이를 통해 에듀테크 기업 간 데이터 호환성을 확보하고 공교육 중심의 에듀테크 산업 성장 기반을 조성하기 위함
또한 Caliper Analytics, xAPI, CEDS 등 국제표준을 참조하여 학습데이터의 의미를 보다 명확히 정의하고, 이를 통해 맞춤형 교육을 위한 데이터 활용의 기반을 마련하고자 함
나) 적용 범위
본 지침은 교수·학습 과정에서 발생하는 모든 형태의 학습데이터를 대상으로 하며, 여기에는 AIDT 등 다양한 에듀테크에서 생성·활용되는 학습자의 활동 데이터가 포함되고 학습분석 및 맞춤형 교육을 위해 교육과정 연계 데이터도 포함함
다만 교무/학사 행정 데이터나 일반 행‧재정 관련 데이터는 본 지침의 적용 범위에서 제외하였는데, 이는 본 지침이 순수 학습 활동과 직접적으로 관련된 데이터의 표준화에 초점을 맞추고 있기 때문임
다) 참조 표준
본 지침의 작성에는 여러 국내외 표준이 참조되었으며, 학습분석을 위한 데이터 수집에 중점을 둔 IMS Global의 Caliper Analytics 표준과 다양한 학습 경험의 데이터화에 중점을 둔 Advanced Distributed Learning의 xAPI 표준을 참조함
국내 표준으로는 공공기관의 데이터베이스 표준화 지침(행정안전부고시 제2023-18호)과 교육행정데이터 표준화 가이드라인 및 AI 디지털교과서 개발 가이드라인 등을 참고하여 국내 교육환경에 적합한 표준안을 도출함
2. 학습데이터 사전 구조
가) 학습데이터 사전 구성 항목
학습데이터 용어명, 영문약어명, 영역, 항목, 엔티티(Entity), 속성(Attribute), 표준용어설명, 카테고리, 동사(Verb), 데이터 타입, 표현 형식, 대상 엔티티, 참조한 관련 표준과 같이 총 13개 항목으로 구성
<표 IV-4> 학습데이터 사전 구성 항목
| 구성 항목 | 설명 |
|---|---|
| 학습데이터 용어명 | 학습데이터 용어명의 한글 이름 |
| 영문약어명 | 학습데이터 용어명에 대한 영문 약어 표기 |
| 영역 | 학습분류체계의 영역에 해당하는 내용 |
| 항목 | 학습분류체계의 항목에 해당하는 내용 |
| 엔티티(Entity) | 학습분류체계의 엔티티에 해당하는 용어 |
| 속성(Attribute) | 학습분류체계의 속성에 해당하는 용어 |
| 표준용어설명 | 학습데이터 용어명에 대한 상세한 의미를 설명 |
| 카테고리 | 학습데이터 용어명이 속하는 네 가지 분류 중의 하나를 표기 ※ Entity, Attribute, Verb, Count로 분류 |
| 동사(Verb) | 학습데이터 용어명의 카테고리가 ‘Verb’인 경우 학습데이터 용어명과
연관 있는 영어 동사의 과거형을 표기 ※ xAPI, CEDS에서 정의한 동사와 AIDT를 고려하여 새롭게 정의한 동사 모두 사용 가능 |
| 데이터타입 | 학습데이터 용어명의 데이터 형식을 표기 ※ boolean, int, float, object, string, term, timestamp로 분류 |
| 표현 형식 | 학습데이터 용어명이 따라야 하는 형식이나 양식 |
| 대상 엔티티 | 속성이 속한 ‘엔티티(Entity)’의 영문약어명을 표기 ※ 카테고리가 Entity인 경우 ‘N/A’로 표기 |
| 참조한 관련 표준 | 학습데이터 용어명과 관련 데이터 요소 도출 시 참조한 주요 표준 |
영역 - 교육과정, 사용자, 학습목표, 미디어, 학습콘텐츠, 과제, 토의·협력학습, 주석, 질의, 평가, 성찰, 설문조사, 학습성취로 구성
항목 - 영역의 각각에 대하여 관련된 세부 데이터 또는 정보를 정의
예1) ‘교육과정’ - ‘교육과정 표준체계’, ‘교육과정 재구성’으로 분류
예2) ‘학습목표’ - ‘학습목표 수립’, ‘학습목표 달성 결과 확인’으로 분류
엔티티 - 엔티티(Entity)와 행위(Verb)를 정의
‘엔티티’는 학습 활동의 대상이 되는 객체를 의미
‘행위’는 해당 객체에 대해 수행되는 행동을 의미
학습데이터 용어명 중 엔티티와 속성 관계가 있는 경우, 속성에 해당하는 용어의 ‘엔티티’ 항목에는 관련된 상위
엔티티 명을 표기
예) 학습데이터명이 ‘과제 제출 정보’, ‘과제 제출 아이디’, ‘과제 제출
시각’인 경우 ‘과제 제출 정보’는 엔티티, ‘과제 제출 아이디’와 ‘과제 제출 시각’은 관련 속성에 해당하기에
‘과제 제출 아이디’와 ‘과제 제출 시각’의 엔티티에는 모두 ‘과제 제출 정보’를 표기
속성 - 각 엔티티가 가지는 구체적인 속성(Attribute)을 정의
‘속성’은 해당 학습 활동의 특성을 상세하게 나타내는 요소들로 구성
데이터의 수집과 분석에 필요한 가장 세부적인 단위가 됨
속성 필드에 기술되는 것은 엔티티 필드에 기술된 항목과 관련성이 있는 학습데이터 용어명을 작성함
3. 학습데이터 사전 작성 원칙
가) 일반 원칙
학습데이터 사전에 사용되는 모든 용어는 명확성과 일관성을 유지해야 함
정보통신 분야 용어는 한국정보통신기술협회의 정보통신용어사전에 포함되어 있는 용어를 우선 사용
학습데이터 용어와 관련하여 동일한 개념에 대해 서로 다른 용어가 사용되는 경우 공교육 에듀테크(AI 디지털교과서 개발 가이드라인 등)에서 사용하는 용어를 우선적으로 적용
이는 기존 에듀테크 생태계와의 일관성을 유지하고 용어 사용의 혼선을 방지하기 위함
학습데이터 용어에 대한 영문 표기는 xAPI, Caliper Analytics 및 CEDS 등에서 사용하는 용어를 우선적으로 적용
나) 데이터 명명 규칙
한글 용어명 정의
형식 : 영역명 + ‘ ’ + 속성명
영역명과 속성명 사이는 띄어쓰기를 적용
평가 정보, 문항 난이도, 평가 제출 시각
영문 용어명 정의
한글 용어명의 한글 각각에 대하여 관련된 영어 단어로 표기
형식 : 첫 번째 단어 [+ 두 번째 단어 + 세 번째 단어 + ...]
‘[ ]’는 생략될 수 있음을 의미
모든 단어는 타이틀 형식(Title case)을 사용
예) title ⇒ Title, case ⇒ Case
일반적으로 통용되는 약어는 그대로 사용
예) Identification ⇒ Id, Information ⇒ Info, Maximum ⇒ Max, Minimum ⇒ Min 등)
낙타 형식(Camel case(2)) 을 사용
동사(Verb)를 표기할 때는 해당 동사의 과거(Past Simple)를 사용
예) do ⇒ Did, give ⇒ Gave, play ⇒ Played, submit ⇒ Submitted 등
(2) 낙타의 등 모양에서 착안하여 2개 이상의 영문 단어를 붙여쓰기 할 경우 각 영문 단어의 첫 번째 글자는 대문자로 표기하고, 나머지 글자는 소문자로 표기함 (예, 평가 정보 → assessment info → AssessmentInfo)
다) 데이터 카테고리 및 데이터 타입 정의
데이터는 그 성격에 따라 다음과 같은 카테고리로 구분
<표 IV-5> 데이터 유형
| 카테고리 | 설명 | 예제 |
|---|---|---|
| Entity | 학습 활동의 주체나 객체가 되는 개념적 데이터 데이터 타입에서는 object로 정의하며, 하위 속성들을 포함할 수 있음 |
평가 정보, 평가 제출 정보 |
| Attribute | 엔티티가 가지는 특성을 표현하는 데이터 데이터 타입에서는 속성이 갖는 값의 형태에 따라 string, int, boolean, timestamp 등 구체적인 데이터 타입을 지정 |
문항 풀이 여부, 문항 풀이 시간 |
| Verb | 학습 활동에서 발생하는 행위를 표현하는 데이터 데이터 타입에서는 term으로 정의하며, 행위의 시점과 대상을 명확히 함 |
평가 제출, 이미지 조회 |
| Count | 학습활동의 반복 수행에 대한 누적 데이터 데이터 타입에서는 속성이 갖는 값의 형태에 따라 int 또는 float 중의 하나를 지정 |
텍스트문서 조회 횟수, 음원 미디어 재생 횟수 |
데이터 타입은 데이터가 가질 수 있는 값의 유형을 정의하며, 본 학습데이터 사전에서는 다음과 같은 데이터 타입을 사용
<표 IV-6> 데이터 타입
| 데이터 타입 | 설명 |
|---|---|
| boolean | 참 또는 거짓 값을 갖는 데이터 |
| int | 정수형 숫자 데이터 타입 |
| float | 소수점을 포함하는 실수형 숫자 데이터 타입 |
| object | 여러 속성을 포함할 수 있는 복합 데이터 타입 |
| string | 문자열 데이터 타입 |
| timestamp | 날짜와 시간을 포함한 데이터 타입 |
| term | 행위(Verb)를 나타내는 데이터 타입 |
라) 표현 형식 정의
표현 형식은 학습데이터 용어명이 따라야 하는 형식이나 양식을 지정
특별한 표현 형식이 정해지지 않은 경우는 일반적인 표준을 따름
특정 용어의 표현 형식이 사전에 정의된 제한된 어휘목록이 있는 경우, 그 목록에 있는 용어를 사용하되 ‘나) 데이터 명명 규칙’을 적용
<표 IV-7> 표현 형식(제한된 어휘목록 예시)
| 학습데이터 용어명 | 영문약어명 | 표현 형식(3) |
|---|---|---|
| 평가 유형 | AssessmentType | D:진단평가, F:형성평가, S:총괄평가, E:기타 |
| 문항 유형 | AssessmentItemType | M:객관식, S:단답형 주관식, L:서술형 주관식, E:기타 |
| 과제 등록 | AssignmentGave | - |
(3) 표현 형식으로 표기할 것이 없는 경우에는 빈칸으로 남겨 놓지 않고 하이픈(‘-’)을 표기
마) 대상 엔티티 정의
대상 엔티티는 해당 데이터 요소가 속하는 개념적 단위를 의미
예를 들어, ‘평가 아이디’, ‘평가 유형’ 데이터는 ‘평가 정보’라는 엔티티에 속하며, ‘문항 난이도’는 ‘문항 정보’ 엔티티에 속함
이러한 엔티티 - 속성 구조를 통해 연관된 데이터 요소들을 체계적으로 그룹화하고 관리할 수 있음
<표 IV-8> 엔티티-속성 구조
| 엔티티 | 속성 | 영문약어명 | 표준용어설명 |
|---|---|---|---|
| 평가 정보 | 평가 정보 | AssessmentInfo | 평가 속성 |
| 평가 정보 | 평가 아이디 | AssessmentId | 평가의 아이디 |
| 평가 정보 | 평가 유형 | AssessmentType | 평가의 유형 |
| 문항 정보 | 문항 정보 | AssessmentItemInfo | 문항 속성 |
| 문항 정보 | 문항 난이도 | AssessmentItemDifficulty | 문항의 난이도 |
학습데이터 용어명의 카테고리가 Entity 또는 Verb인 경우 ‘대상 엔티티’에 해당 없음(Not applicable)을 의미하는 ‘N/A’ 입력
바) 참조한 관련 표준 정의
학습데이터 용어명과 관련 데이터 요소 도출 시 참조한 주요 표준
IMS Global Caliper Analytics 표준
Advanced Distributed Learning xAPI 표준
CEDS (Common Education Data Standards)
AI 디지털교과서 개발 가이드라인
본 학습데이터 사전의 데이터 항목은 하나 이상의 표준을 참조할 수 있으며 이를 통해 해당 데이터 요소의 출처와 근거를 명확히 할 수 있음