Mining Korean-English Terminologies by Pattern Generation in Internet

패턴생성을 통한 인터넷 문서의 한글-영문용어 추출

  • 강재호 (동아대학교 지능형통합항만관리연구센터) ;
  • 김종성 (부산대학교 정보컴퓨터공학부) ;
  • 류광렬 (부산대학교 정보컴퓨터공학부)
  • Published : 2003.10.01

Abstract

전문용어의 가짓수가 많고 생성빈도 또한 높은 분야에서 고품질의 정보검색과 기계번역 결과를 얻기 위해서는 상당 분량의 번역용어사전의 확보가 필수적이다. 이러한 분야에서 번역용어사전을 수작업으로 구축하는 것은 큰 부담이 된다. 본 논문에서는 이미 알고 있는 용어(원어)와 번역용어를 말뭉치에서 함께 표기한 부분을 찾아 패턴화하는 작업과, 생성된 패턴으로 추가의 용어-번역용어를 추출하는 작업을 반복하여 수행함으로써 번역용어사전을 자동으로 구축하는 방안을 제안한다. 인터넷 문서를 대상으로 본 제안방법을 적용해 본 결과 상당분량의 유효한 한글-영문용어들을 추출할 수 있었다.

Keywords