웹 검색을 이용한 한글대역어에 대한 영어약어의 중의성 해소

Web-based disambiguation of English Abbreviation for Korean Term

  • 구희관 (과학기술연합대학원대학교) ;
  • 정한민 (한국과학기술정보연구원 차세대유통개발팀) ;
  • 강인수 (한국과학기술정보연구원 차세대유통개발팀) ;
  • 성원경 (한국과학기술정보연구원 차세대유통개발팀)
  • 발행 : 2006.05.01

초록

특정 신문은 해당 도메인의 언어자원을 구축하는데 필요한 자원이며, 한글과 영어의 괄호를 통해 표현되는 대역어구는 다국어 정보로 언어자원 구축에 이용된다. 그러나, 실제로 신문에서 사용되는 한영대역어의 구성은 한글대역어와 영어약어로 구성된 비율이 80%이상을 보인다. 신문을 대상으로 대역어사전 등을 구축하기 위해서는, 영어양어의 완전한 형태인 영어비약어 정보가 필요하다. 본 논문은 영어비약어 정보를 획득하기 웹검색을 통해 영어비약어를 획득하고, 영어약어를 이용해 영어약어와 영어비약어의 관계를 이용하는 방법을 제안한다.

키워드