• 제목/요약/키워드: Query logs analysis

검색결과 13건 처리시간 0.019초

클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석 (An Analysis of Query Types and Topics Submitted to Navel)

  • 박소연;이준호;김지승
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2005
  • 웹 검색 분야의 대부분의 선행 연구들은 검색 질의를 살펴본 연구자의 판단에 근거하여 질의의 주제를 분석하였다. 그러나 웹 검색 질의의 주제 분야가 방대하고 다양하여서 이용자가 검색 결과에서 실제로 조회한 문서를 모르는 상태에서 연구자의 판단에 근거하여 질의의 주제를 분류하기에는 한계가 있다. 이에 본 연구에서는 1년 동안 네이버 이용자들이 입력한 질의를 기록한 질의로그와 질의에 대한 검색 결과에서 이용자가 조회한 문서를 기록한 클릭 로그에 근거하여 국내 웹 검색 질의의 형태 및 주제를 분석하였다. 질의를 형태별로 분류한 결과 사이트 검색 질의가 내용 검색 질의보다 많은 것으로 나타났다. 또한 이용자들이 전반적으로 가장 많이 검색한 주제는 컴퓨터/인터넷. 엔터테인먼트, 쇼핑, 게임. 교육 순으로 나타났다. 본 연구의 결과는 인터넷 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

질의 로그 분석을 통한 네이버 이용자의 검색 형태 연구 (Information Seeking Behavior of the NAVER Users via Query Log Analysis)

  • 이준호;박소연;권혁성
    • 정보관리학회지
    • /
    • 제20권2호
    • /
    • pp.27-41
    • /
    • 2003
  • 이용자와 검색 서비스 시스템의 모든 검색 과정을 기록한 질의 로그는 이용자의 실제 검색 행위를 사실적으로 반영한다. 따라서, 웹 검색 이용자들의 검색 행태를 이해하기위하여 웹 검색 서비스 시스템이 생성한 질의 로그를 분석하는 방법이 널리 사용되고 있다. 본 연구는 네이버 이용자의 웹 검색 행태를 파악하기 위하여 기존의 질의 로그 분석 방법론을 보완하여 제시한다. 또한, 본 연구는 통합 검색, 디텍토리 검색, 웹 문서 검색과 같은 다양한 검색 유형에 대하여 일주일 동안 생성된 질의 로그를 분석함으로써 네이버 웹 검색 이용자들의 전반적인 검색 행태를 파악하였다. 본 연구의 결과는 보다 효과적인 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

로그분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구 (Investigating Web Search Behavior via Query Log Analysis)

  • 박소연;이준호
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.111-122
    • /
    • 2002
  • 본 연구에서는 웹 검색 이용자들의 전반적인 검색 행태를 이해하기 위하여 국내에서 널리 사용되고 있는 웹 검색 서비스 네이버에서 생성된 검색 트랜잭션 로그를 분석하였다. 본 연구에서는 웹 검색 트랜잭션 로그 분석에 필요한 세션 정의 방법을 설명하고 로그 정제 및 질의 유형 분류방법을 제시하였으며, 한글 검색 트랜잭션 로그 분석에 필수절인 검색어 정의 방법을 제안하였다. 본 연구의 결과는 보다 효과적인 국내 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

웹검색 행태 연구 - 사용자가 스스로 쿼리를 뭉치는 방법으로 - (Web Search Behavior Analysis Based on the Self-bundling Query Method)

  • 이중식
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.209-228
    • /
    • 2011
  • 검색이 편재화 되고 있다. 사용자들은 PC를 너머 스마트폰과 스마트TV에서도 검색을 일상적으로 사용하고 있다. 따라서 사용자의 검색행태도 진화 중이다. 하지만 검색행태 연구는 서버의 트랜잭션 로그(transaction log)를 기반으로 하거나 사용자 로그(user log)를 관찰하는 경우에도 개별 쿼리(query instance)를 분석단위로 삼기에 여러 매체와 여러 시간을 가로지르는 검색 행태를 분석하기에 부족하다. 본 연구에서는 사용자가 직접 덩어리 지운 쿼리 뭉치(bundled query)를 살펴보아 시간과 매체를 가로지르며 궁금증을 해결해 나가는 사용자의 검색행동을 분석해 보았다. 연구를 위해 사용자 PC에 웹로그 캐처를 설치하고, 취합된 웹검색 기록을 사용자들이 직접 덩어리 지워 같은 궁금증을 가진 뭉치를 만들도록 하였다. 또한 각 뭉치에 대한 설문을 통해 검색의 동기, 계기, 만족도 및 검색 후 활동을 조사하였다. 사용자에 의해 만들어진 뭉치는 전화 인터뷰를 통해 검증하였고 맥락을 확인하였다. 뭉치를 통한 인터뷰는 검색 당시의 기억을 떠올리는 힌트로 작용하여 사용자의 검색 회상을 생생하게 하였다. 분석 결과 사용자들은 하루에 평균 4.75개의 검색 뭉치를 발생시키고, 각각의 검색 뭉치는 평균 2.75개의 쿼리로 구성되어 있음을 확인할 수 있었다. 또한 뭉치 내 쿼리의 발전을 '쿼리의 정교화'와 '주제의 정교화'라는 상위 범주 아래 9개의 패턴으로 확인하였다.

웹 검색 행태의 추이 및 변화 분석 (Trends and Changes of Web Searching Behavior)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제45권1호
    • /
    • pp.377-393
    • /
    • 2011
  • 이 연구에서는 국내 주요 검색 포털인 네이버 이용자들의 검색 행태 추이를 조사, 분석하였다. 즉 1년 동안 분기별로 네이버에 입력된 질의들을 대상으로 질의의 입력 행태, 오타 입력 행태, 멀티미디어 검색 행태, 결과 문서 클릭 행태 등의 추이를 조사하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구결과, 입력된 질의의 길이 및 주제, 멀티미디어 질의의 특징 및 비율, 오타의 비율 등에 있어서는 1년 동안 큰 변화 없이 일정한 것으로 나타났다. 반면, 질의별로 발생되는 클릭 횟수는 시간이 지남에 따라 점진적으로 증가하는 것으로 나타났다. 본 연구의 결과는 향후 포털의 효과적인 콘텐츠 구축 및 검색 알고리즘 개발에 활용될 수 있을 것으로 기대된다.

NDSL 검색 질의어와 기술용어간의 관계에 대한 분석적 연구 (A Relation Analysis between NDSL User Queries and Technical Terms)

  • 강남규;조민희;권오석
    • 정보관리연구
    • /
    • 제39권3호
    • /
    • pp.163-177
    • /
    • 2008
  • 본 논문에서는 NDSL을 검색하기 위해 이용자가 입력하는 검색 질의어를 대상으로 질의어에 사용되는 키워드와 학술지에서 추출한 기술용어와의 관계를 분석하고자 한다. 관계 분석을 위해 사용된 키워드는 17개월 동안의 NDSL 검색 질의어에서 추출한 약 83만3,000개, 기술용어는 NDSL, INSPEC, FSTA 3개 영문 학술지 데이터베이스 약 4,100만건에서 추출한 약 97만5,000개이다. 그리고 분석에 사용된 키워드와 기술용어는 2어절 이상의 영어 단어이며, 이들 간의 관계 분석은 키워드와 기술용어간의 일치성, 연관성, 기술용어에 대한 빈도 분석 등이다.

검색 포털의 클릭 집중 문서 분석 평가 (Analysis and Evaluation of Most Clicked Documents of Korean Search Portal)

  • 박소연
    • 한국도서관정보학회지
    • /
    • 제42권1호
    • /
    • pp.325-338
    • /
    • 2011
  • 본 연구에서는 국내 주요 검색 포털인 네이버 통합 검색의 클릭 집중 문서의 특징을 조사, 분석하였다. 즉 이 연구에서는 클릭 집중 문서들을 대상으로 클릭 집중 비율, 컬렉션별 분포, 작성 연도별 분포를 조사하고, 문서의 적합도, 최신성, 신뢰도 등을 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 클릭 집중 문서가 가장 많이 발생한 컬렉션은 블로그였으며, 질의별로 클릭의 절반가량이 한 문서에 집중되고 있는 것으로 나타났다. 또한 클릭 집중 문서의 적합도와 최신성은 상당히 높지만, 신뢰도는 보통 수준인 것으로 나타났다. 본 연구의 결과는 향후 포털의 효과적인 검색 알고리즘 및 인터페이스 개발에 활용될 수 있을 것으로 기대된다.

이용자들의 쇼핑 검색 행태 분석: 팝슈즈 로그 분석을 중심으로 (Information Seeking Behavior of Shopping Site Users: A Log Analysis of Popshoes, a Korean Shopping Search Engine)

  • 박소연;조기훈;최기린
    • 정보관리학회지
    • /
    • 제32권4호
    • /
    • pp.289-305
    • /
    • 2015
  • 본 연구에서는 국내 쇼핑 검색 사이트인 팝슈즈 이용자들의 정보 검색 행태를 조사, 분석하였다. 이를 위하여 팝슈즈에서 2015년 1월부터 3월까지 3개월 동안 생성된 검색 로그를 수집, 분석하였다. 연구 결과, 팝슈즈 이용자들의 검색 행태는 매우 단순하고 수동적인 것으로 나타났다. 이용자들이 정보 접근 시, 질의를 직접 입력하여 검색하는 경우보다 사이트에 구축되어 있는 디렉토리를 브라우징하는 경우가 더 많은 것으로 나타났다. 반면, 제품 정보 클릭이나 제품 주문과 같은 주요 의사 결정에 있어서는 브라우징보다 질의의 역할이 더 큰 것으로 나타났다. 본 연구의 결과는 향후 쇼핑 검색 서비스의 개선에 활용될 수 있을 것으로 기대된다.

국내 포털 이용자들의 멀티미디어 검색 행태 분석 (The Multimedia Searching Behavior of Korean Portal Users)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제44권1호
    • /
    • pp.101-115
    • /
    • 2010
  • 멀티미디어 검색은 전통적인 검색과 웹 검색을 차별화시키는 중요한 요소 중 하나이다. 본 연구에서는 국내 주요 검색 포털인 네이버 이용자들의 멀티미디어 검색 행태를 분석, 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 이용자가 입력하는 멀티미디어 질의 중 음악 질의가 차지하는 비중이 가장 높았으며, 이미지 질의와 동영상 질의의 비중은 비슷한 것으로 나타났다. 한편 멀티미디어 관련 컬렉션들 중 이용자가 가장 많이 조회하는 컬렉션은 동영상 컬렉션이었고, 이어서 이미지 컬렉션, 음악 컬렉션 순으로 나타났다. 이용자가 입력하는 멀티미디어 질의나 멀티미디어 컬렉션에서 클릭하는 문서 모두 엔터테인먼트와 관련된 주제가 가장 많았다. 본 연구의 결과는 향후 포털의 멀티미디어 컨텐츠 구축 및 검색 알고리즘 개발에 활용될 수 있을 것으로 기대된다.

용어 자동분류를 사용한 검색어 범주화의 분석적 고찰 (An Analytic Study on the Categorization of Query through Automatic Term Classification)

  • 이태석;정도헌;문영수;박민수;현미환
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.133-138
    • /
    • 2012
  • 검색 창을 통해 입력된 검색어는 정보이용자가 의미 있는 자료를 찾아내는 적극적인 활동의 산물이다. 따라서 검색로그는 정보이용자의 관심사항을 알 수 있는 중요한 분석 데이터이다. 본 연구의 목적은 입력한 검색어의 범주화 결과와 엑세스한 문서의 범주가 어느 정도 유사한 상관관계를 가지는지 분석적으로 고찰해보는 것이다. KISTI(한국과학기술정보연구원)의 NDSL(과학기술정보센터) 사이트의 2009년 검색로그의 검색세션을 식별하고 검색세션단위로 검색어와 이용 자료를 추출한 후, 검색어에 대해 어떤 주제 분류에 속하는 용어인지 자동분류기로 식별한 결과가 실제 이용한 자료의 주제 분야와 잘 맞는지 비교하였다. 그 결과 상위 100개 검색어 분류에 대한 유사도 평균이 58.8%로 파악되었다. 결국 전체적인 유사도는 58.8%이하이며, 관련 연구에서 수행한 자료의 자동분류 검색성능 전문가 평가 결과인 76.8%에 비해 낮다. 이것은 검색어로 쓰인 용어가 다른 연구 분야의 관심 용어로 새롭게 주목 받고 있기 때문이라는 사실을 알 수 있었다.