대화 코퍼스의 구축 및 주석 정보의 구조적 문서화

Construction of Dialogue Corpus and Structured Documentation of Annotation Information

  • 강창규 (원광대학교 컴퓨터 공학과, SiTEC) ;
  • 김영일 (원광대학교 컴퓨터 공학과 SiTEC) ;
  • 김봉완 (원광대학교 컴퓨터 공학과, SiTEC) ;
  • 이용주 (원광대학교 컴퓨터 공학과, SiTEC)
  • 발행 : 2003.11.01

초록

음성인식의 연구 대상은 낭독음성에서 대화음성으로 발전해가고 있다. 이를 위해서는 대량의 대화코퍼스가 필요하다. 그러나 아직 충분한 양의 대화코퍼스가 구축되어 있지 못하며 코퍼스의 주석 정보 또한 복잡하고 다양하게 표현하고 있어 효율적인 활용이 어렵다. 따라서 본 논문에서는 대화 영역으로 텔래뱅킹 영역을 설정하고 대화코퍼스를 구축하여 구축된 대화코퍼스의 주석 정보를 XML(Extensible Markup Language)로 표준화할 수 있도록 DTD(Document Type Definition)를 정의하여 문서 구조화하였다.

키워드