Browse > Article
http://dx.doi.org/10.3745/KIPSTD.2012.19D.2.133

An Analytic Study on the Categorization of Query through Automatic Term Classification  

Lee, Tae-Seok (한국과학기술정보연구원 NDSL서비스실)
Jeong, Do-Heon (한국과학기술정보연구원 소프트웨어연구실)
Moon, Young-Su (한국과학기술정보연구원 NDSL서비스실)
Park, Min-Soo (한국과학기술정보연구원 NDSL서비스실)
Hyun, Mi-Hwan (한국과학기술정보연구원 NDSL서비스실)
Abstract
Queries entered in a search box are the results of users' activities to actively seek information. Therefore, search logs are important data which represent users' information needs. The purpose of this study is to examine if there is a relationship between the results of queries automatically classified and the categories of documents accessed. Search sessions were identified in 2009 NDSL(National Discovery for Science Leaders) log dataset of KISTI (Korea Institute of Science and Technology Information). Queries and items used were extracted by session. The queries were processed using an automatic classifier. The identified queries were then compared with the subject categories of items used. As a result, it was found that the average similarity was 58.8% for the automatic classification of the top 100 queries. Interestingly, this result is a numerical value lower than 76.8%, the result of search evaluated by experts. The reason for this difference explains that the terms used as queries are newly emerging as those of concern in other fields of research.
Keywords
Automatic Term Classification; Search Log; Analysis of Query; Similarity;
Citations & Related Records
Times Cited By KSCI : 8  (Citation Analysis)
연도 인용수 순위
1 남영준, 김규환, "유사어 사전을 이용한 웹기반 질의문의 자동 범주화에 관한 연구", 정보관리연구, 제 35권 제 4호, pp.81-105, 2004.   과학기술학회마을
2 이재윤, "연관성 척도의 빈도수준 선호경향에 대한 연구", 정보 관리학회지, 제 21권 제 4호, pp.281-294, 2004.   과학기술학회마을   DOI   ScienceOn
3 서진완, "로그화일(Log file)을 이용한 공공기관의 홈페이지 분석과 정책적 함의", 한국행정학회 춘계학술대회발표논문집, pp.501-517, 2001.
4 Dunja Mladenic, Marko Grobelnik, "Feature Selection for Classification Based on Text Hierarchy, In Working notes of Learning from Text and the Web", Conference on Automated Learning and Discovery(CONALD'98), 1998.
5 서은경, "용어의 자동분류에 관한 연구", 석사학위논문, 연세대학교 대학원, 도서관학과, 1984.
6 Gerard Salton, Michael J. McGill, "Introduction to Modern Information Retrieval", New York: Mc Graw Hill, 1983.
7 이수상, 위성광, "디지털 도서관 이용자의 검색행태 연구", 한국 도서관정보학회지, 제 40권 제 4호, pp.139-158, 2009.   과학기술학회마을
8 정도헌, 유소영, 김환민, 김혜선, 김용광, 한희준, "웹 정보의 자동 의미연계를 통한 학술정보서비스의 확대 방안 연구", 정보관리 연구, 제 40권 제 1호, pp.133-156, 2009.   과학기술학회마을
9 FAST, "FAST Enterprise Search Platform 5.3 Advanced Linguistics Guide", Document Number: ESP1036, Document Revision: A, 2009.
10 정도헌, 최희윤, "과학기술 전문용어의 다국어 의미망 생성과 분석", 정보관리연구, 제 37권 제 4호, pp.25-47, 2007.   과학기술학회마을
11 박소연, 이준호, "웹 검색 분야에서의 로그 분석 방법론의 활용도", 한국문헌정보학회 학술발표논문집 제 21집, pp.81-94, 2006.   과학기술학회마을
12 박소연, 이준호, 김지승, "클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석", 한국문헌정보학회지, 제 39권 제 1호, pp.265-278, 2005.   과학기술학회마을   DOI   ScienceOn
13 이재윤, "문서측 자질선정을 이용한 고속 문서분류기의 성능향상에 관한 연구", 정보관리연구, 제 36권 제 4호, pp.51-69, 2005.   과학기술학회마을