Design and Implementation of Short-Essay Marking System by Using Semantic Kernel and WordNet

의미 커널과 워드넷을 이용한 주관식 문제 채점 시스템의 설계 및 구현

  • Cho, Woo-Jin (Dept. of Computer Engineering, Hallym University) ;
  • Chu, Seung-Woo (Dept. of Computer Engineering, Hallym University) ;
  • O, Jeong-Seok (Dept. of Computer Engineering, Hallym University) ;
  • Kim, Han-Saem (Dept. of Computer Engineering, Hallym University) ;
  • Kim, Yu-Seop (Dept. of Computer Engineering, Hallym University) ;
  • Lee, Jae-Young (Dept. of Computer Engineering, Hallym University)
  • 조우진 (한림대학교 컴퓨터공학과) ;
  • 추승우 (한림대학교 컴퓨터공학과) ;
  • 오정석 (한림대학교 컴퓨터공학과) ;
  • 김한샘 (한림대학교 컴퓨터공학과) ;
  • 김유섭 (한림대학교 컴퓨터공학과) ;
  • 이재영 (한림대학교 컴퓨터공학과)
  • Published : 2005.05.13

Abstract

기존 의미커널을 적용한 주관식 채점 시스템은 여러 답안과 말뭉치에서 추출한 색인어들과의 상관관계를 벡터방식으로 표현하여 자연어 처리에 대한 문제를 해결하려 하였다. 본 논문에서는 기존 시스템의 답안 및 색인어의 표현 한계로 인한 유사도 계산오차 가능성에 대한 문제를 해결하고자 시소러스를 이용한 임의 추출 방식의 답안 확장을 적용하였다. 서술형 주관식 평가에서는 문장의 문맥보다는 사용된 어휘에 채점가중치가 높다는 점을 착안, 출제자와 수험자 모두의 답안을 동의어, 유의어 그룹으로 확장하여 채점 성능을 향상시키려 하였다. 우선 두 답안을 형태소 분석기를 이용해 색인어를 추출한 후 워드넷을 이용하여 동의어, 유의어 그룹으로 확장한다. 이들을 말뭉치 색인을 이용하여 단어들 간 상관관계를 측정하기 위한 벡터로 구성하고 의미 커널을 적용하여 정답 유사도를 계산하였다. 출제자의 채점결과와 각 모델의 채점 점수의 상관계수 계산 결과 ELSA 모델이 가장 높은 유사도를 나타내었다..

Keywords