• 제목/요약/키워드: Search Term Log Analysis

검색결과 6건 처리시간 0.018초

로그분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구 (Investigating Web Search Behavior via Query Log Analysis)

  • 박소연;이준호
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.111-122
    • /
    • 2002
  • 본 연구에서는 웹 검색 이용자들의 전반적인 검색 행태를 이해하기 위하여 국내에서 널리 사용되고 있는 웹 검색 서비스 네이버에서 생성된 검색 트랜잭션 로그를 분석하였다. 본 연구에서는 웹 검색 트랜잭션 로그 분석에 필요한 세션 정의 방법을 설명하고 로그 정제 및 질의 유형 분류방법을 제시하였으며, 한글 검색 트랜잭션 로그 분석에 필수절인 검색어 정의 방법을 제안하였다. 본 연구의 결과는 보다 효과적인 국내 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

온라인 목록 검색 행태에 관한 연구-LINNET 시스템의 Transaction log 분석을 중심으로-

  • 윤구호;심병규
    • 한국도서관정보학회지
    • /
    • 제21권
    • /
    • pp.253-289
    • /
    • 1994
  • The purpose of this study is about the search pattern of LINNET (Library Information Network System) OPAC users by transaction log, maintained by POSTECH(Pohang University of Science and Technology) Central Library, to provide feedback information of OPAC system design. The results of this study are as follows. First, for the period of this analysis, there were totally 11, 218 log-ins, 40, 627 transaction logs and 3.62 retrievals per a log-in. Title keyword was the most frequently used, but accession number, bibliographic control number or call number was very infrequently used. Second, 47.02% of OPAC, searches resulted in zero retrievals. Bibliographic control number was the least successful search. User displayed 2.01% full information and 64.27% local information per full information. Third, special or advanced retrieval features are very infrequently used. Only 22.67% of the searches used right truncation and 0.71% used the qualifier. Only 1 boolean operator was used in every 22 retrievals. The most frequently used operator is 'and (&)' with title keywords. But 'bibliographical control number (N) and accessionnumber (R) are not used at all with any operators. The causes of search failure are as follows. 1. The item was not used in the database. (15, 764 times : 79.42%). 2. The wrong search key was used. (3, 761 times : 18.95%) 3. The senseless string (garbage) was entered. (324 times : 1.63%) On the basis of these results, some recommendations are suggested to improve the search success rate as follows. First, a n.0, ppropriate user education and online help function let users retrieve LINNET OPAC more efficiently. Second, several corrections of retrieval software will decrease the search failure rate. Third, system offers right truncation by default to every search term. This methods will increase success rate but should considered carefully. By a n.0, pplying this method, the number of hit can be overnumbered, and system overhead can be occurred. Fourth, system offers special boolean operator by default to every keyword retrieval when user enters more than two words at a time. Fifth, system assists searchers to overcome the wrong typing of selecting key by automatic korean/english mode change.

  • PDF

대통령기록포털 검색어 로그 분석 기반 이용자 정보요구 분석 (User Information Needs Analysis based on Search Terms Log of the Presidential Archives Portal)

  • 이수현;오효정
    • 한국기록관리학회지
    • /
    • 제24권3호
    • /
    • pp.23-44
    • /
    • 2024
  • 최근 방대한 정보자원 속에서 이용자가 원하는 정보를 제공하기 위해 이용자 정보요구를 파악하여 맞춤형 서비스를 제공하는 큐레이션의 중요성이 커지고 있다. 이에 본 연구는 역사적 가치가 높은 대통령 기록물의 활용 가치 향상을 위해 대통령기록포털의 검색어 로그 분석을 통해 이용자 정보요구를 파악하고자 한다. 또한, 현 대통령기록포털에서 이용자의 정보요구에 부합하는 기록정보서비스를 제공하고 있는지 검색 품질을 파악함으로써 디지털 기록 큐레이션 서비스를 통해 개선할 요소를 제시하고자 한다. 이를 위해 최근 8년간의 검색어 로그를 기반으로 주제 분석, 워드 네트워크 분석을 수행하고, 이용자 요구가 높은 분야를 중심으로 대통령기록포털의 검색 품질을 정확도 관점에서 평가하였으며, 분석 결과를 기반으로 시사점을 도출하였다. 본 연구는 대통령 기록물 대상의 디지털 기록 큐레이션을 위한 사전적 연구로서, 이용자의 구체적인 정보요구를 파악하고 기록관 포털 사이트의 검색 품질을 정량적으로 수치화하여 이용자 만족도 향상을 위한 실효성 있는 연구를 수행하였다는 점에서 의의가 있다.

국가기록원 웹사이트 유입경로와 이용자 검색어 분석 (Analysis of Users' Inflow Route and Search Terms of the Korea National Archives' Web Site)

  • 진주영;이해영
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 이용자 정보이용환경이 웹으로 변화하면서, 기록관리기관들도 종전보다 더 많은 서비스를 웹을 통해 제공하고 있다. 이 연구는 국가기록원 웹사이트를 이용하는 이용자의 최근 유입경로와 10년 반 동안 매달 상위 100개의 검색어 데이터를 분석하고 그에 맞는 기록정보서비스방안을 제시한다. 분석 결과 유입경로는 크게 포털 사이트별 접속, 국가별 접속, 유사기관 별 접속 및 모바일 접속으로 분류할 수 있었다. 이용자들의 검색어를 분석한 결과 이용자들이 10년 반 동안 가장 많이 검색한 검색어는 '토지조사부'였으며, 꾸준한 관심을 갖고 검색한 검색어 또한 '토지조사부'였다. 그 외에 정부 기관에서 생산한 문서 또는 관보에 대한 관심도 높음을 확인하였다. 그리고 이용자들이 가장 많이 검색한 검색어와 꾸준히 등장한 검색어를 파악한 결과, 검색어들을 크게 토지, 일제강점기, 6.25 전쟁과 남북관계, 기록관리 및 이용으로 묶어볼 수 있었다. 분석결과를 토대로 포털 사이트 및 모바일 등을 활용한 국가기록원 웹사이트의 연계성 강화와 검색 서비스의 고도화 방안을 제안하였다. 이 연구는 이렇게 웹로그나 이용자 검색어 등을 분석하면 기록관리기관 이용자들에게 제공하는 서비스를 고도화할 수 있는 의미 있는 결과를 얻을 수 있음을 확인하였다.

용어 자동분류를 사용한 검색어 범주화의 분석적 고찰 (An Analytic Study on the Categorization of Query through Automatic Term Classification)

  • 이태석;정도헌;문영수;박민수;현미환
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.133-138
    • /
    • 2012
  • 검색 창을 통해 입력된 검색어는 정보이용자가 의미 있는 자료를 찾아내는 적극적인 활동의 산물이다. 따라서 검색로그는 정보이용자의 관심사항을 알 수 있는 중요한 분석 데이터이다. 본 연구의 목적은 입력한 검색어의 범주화 결과와 엑세스한 문서의 범주가 어느 정도 유사한 상관관계를 가지는지 분석적으로 고찰해보는 것이다. KISTI(한국과학기술정보연구원)의 NDSL(과학기술정보센터) 사이트의 2009년 검색로그의 검색세션을 식별하고 검색세션단위로 검색어와 이용 자료를 추출한 후, 검색어에 대해 어떤 주제 분류에 속하는 용어인지 자동분류기로 식별한 결과가 실제 이용한 자료의 주제 분야와 잘 맞는지 비교하였다. 그 결과 상위 100개 검색어 분류에 대한 유사도 평균이 58.8%로 파악되었다. 결국 전체적인 유사도는 58.8%이하이며, 관련 연구에서 수행한 자료의 자동분류 검색성능 전문가 평가 결과인 76.8%에 비해 낮다. 이것은 검색어로 쓰인 용어가 다른 연구 분야의 관심 용어로 새롭게 주목 받고 있기 때문이라는 사실을 알 수 있었다.

이미지 검색 과정에 나타난 질의 전환 및 재구성 패턴에 관한 연구 (Examining Categorical Transition and Query Reformulation Patterns in Image Search Process)

  • 정은경;윤정원
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.37-60
    • /
    • 2010
  • 이 연구는 이미지 특성 범주와 관련하여 질의 재구성 패턴을 탐색하고자 하였다. 이러한 연구 목적을 수행하기 위해서 Excite 웹검색 엔진 로그 데이터가 사용되었으며, 총 592 세션과 2,445 질의어가 분석되었다. 데이터 분석은 Batley의 정보 형태 구분과 선행 연구에서 밝혀진 팻싯과 서브팻싯을 활용하여 수행되었다. 분석결과는 두가지 형태로 구분하여 제시되었다. 첫째, 질의 재구성에 관한 분석결과이다. 질의 분석 결과, 가장 많은 부분을 차지하는 범주는 특정어(specific)와 지칭어(nameable)이며, 이러한 경향은 다양한 정보 탐색 단계에서도 지속적으로 나타났다. 둘째, 질의 재구성 패턴과 관려하여, 평행이동이 가장 많이 나타났으며, 이러한 경향은 최초 혹은 직전 질의 범주에 따라 근소한 차이를 보였다. 범주 전환 분석에서는 높은 비율(60%-80%)로 검색 질의의 범주가 지속적으로 동일한 범주에 머무르는 경향을 밝혀내었다. 이러한 결과는 이미지 검색 시스템 설계와 구현에 있어서, 이용자의 질의 선정 과정에 도움을 제공하고 효과적인 시소러스 구축 등에 활용될 수 있을 것으로 기대된다.