Analysis of the Candidate Terms and Structure Using the Log-data

로그데이터를 이용한 디스크립터의 외형적 특성 분석

  • Nam, Young-Joon (Dept. of Library and Information Science, Chung-ang University) ;
  • Lee, Too-Young (Dept. of Library and Information Science, Chung-ang University)
  • Published : 2004.08.20

Abstract

본 연구에서는 시소러스를 구축하기 위해 필요한 디스크립터 수집원으로써 이용자 로그데이터를 분석하여 후보 디스크립터의 외형적 특성을 분석하였다. 분석대상인 이용자 로그데이터는 국내 검색엔진가운데 야후와 라이코스를 대상으로 하였다. 분석결과, 이용자들은 대부분 검색어로써 명사와 복합명사를 사용하였으며, 조사 '의'이외에는 다른 품사로 이루어진 검색어는 거의 존재하지 않음을 알 수 있었다. 또한 검색어로써 이용자들은 고유명사(외국어 포함)를 많이 사용함으로써, 국내외 지침에서 권고하는 고유명사의 최소한 사용지침과 실제 이용자 사이의 이용행태와의 차이를 알 수 있었다. 따라서 국내외 시소러스 개발지침을 수용하면서, 이용자 중심의 시소러스를 개발하기 위해서는 전거어나 유사어 사전을 대등관계와 연동하여 개발하는 것을 고려해야 한다.

Keywords