• 제목/요약/키워드: 클릭 로그 분석

검색결과 30건 처리시간 0.022초

검색 포털의 클릭 집중 문서 분석 평가 (Analysis and Evaluation of Most Clicked Documents of Korean Search Portal)

  • 박소연
    • 한국도서관정보학회지
    • /
    • 제42권1호
    • /
    • pp.325-338
    • /
    • 2011
  • 본 연구에서는 국내 주요 검색 포털인 네이버 통합 검색의 클릭 집중 문서의 특징을 조사, 분석하였다. 즉 이 연구에서는 클릭 집중 문서들을 대상으로 클릭 집중 비율, 컬렉션별 분포, 작성 연도별 분포를 조사하고, 문서의 적합도, 최신성, 신뢰도 등을 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 클릭 집중 문서가 가장 많이 발생한 컬렉션은 블로그였으며, 질의별로 클릭의 절반가량이 한 문서에 집중되고 있는 것으로 나타났다. 또한 클릭 집중 문서의 적합도와 최신성은 상당히 높지만, 신뢰도는 보통 수준인 것으로 나타났다. 본 연구의 결과는 향후 포털의 효과적인 검색 알고리즘 및 인터페이스 개발에 활용될 수 있을 것으로 기대된다.

클릭스트림 분석을 통한 확장된 웹 로그 처리 시스템 (Extended Web Log Processing System by using Click-Stream)

  • 강미정;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2798-2800
    • /
    • 2001
  • 인터넷 사용자가 급증하고, 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 맞춤 정보를 제공하는 퍼스널라이제이션이 인터넷 개발자 및 사용자들의 관심을 모으고 있다. 원투원 마케팅은 개별 고객의 성별, 나이, 소득 등 인구 통계 정보와 고객의 취미, 레저 등에 관한 정보 및 구매 패턴을 DB화하여 고객에게 가장 적절한 상품, 정보, 광고를 제공하는 것이다. 원투원 마케팅을 기본으로 개인과의 끊임없는 상호교류를 통해 고객에게 맞춤 서비스를 제공할수 있다. 본 논문에서는 맞춤 서비스 제공을 위한 전처리과정으로 클릭스트림 분석을 통한 확장된 웹 로그 정보를 통해서 고객들의 성향을 분석하였다. 그리고 이 웹 로그서버는 웹사이트로부터 얻은 로그정보를 분류하고 저장하여 관리자가 확장된 웹 로그 정보를 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO 기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤 서비스에 대한 사용자 프로파일을 구축 할 수 있다.

  • PDF

클릭스트림 분석을 위한 웹 서버 시스템의 설계 및 구현 (Design and Implementation of Web Server for Analyzing Clickstream)

  • 강미정;정옥란;조동섭
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.945-954
    • /
    • 2002
  • 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 개인화된 서비스를 제공하려는 노력이 커지고 있다. 개인화(Personalization)란 고객 한 명을 대상으로 하여 그 고객 한 사람을 위한 정보나 제품을 제공해주는 작업을 말한다. 개인화 서비스를 위해서 전 처리과정인 사용자 프로파일 생성과정이 필요하며, 적극적인 개인화 서비스를 제공하기 위해서는 충분한 고객 데이터가 필요하다. 본 논문에서는 웹사이트 상에서 사용자 행위 패턴을 파악할 수 있는 클릭스트림 정보를 모듈화 하였으며, 이를 이용하여 확장된 웹 로그 시스템을 구현하였다. 클릭스트림 정보를 웹 로그정보에 포함시켜 사용자의 행위 패턴을 파악할 수 있도록 웹 서버 시스템을 설계하고 구현하였다. 그리고 이 웹 서버는 웹사이트로부터 얻은 클릭스트림 정보를 분류하고 저장하여 관리자가 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO(ActiveX Data Object)기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤서비스에 대한 사용자 프로파일을 구축할 수 있다.

클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석 (An Analysis of Query Types and Topics Submitted to Navel)

  • 박소연;이준호;김지승
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2005
  • 웹 검색 분야의 대부분의 선행 연구들은 검색 질의를 살펴본 연구자의 판단에 근거하여 질의의 주제를 분석하였다. 그러나 웹 검색 질의의 주제 분야가 방대하고 다양하여서 이용자가 검색 결과에서 실제로 조회한 문서를 모르는 상태에서 연구자의 판단에 근거하여 질의의 주제를 분류하기에는 한계가 있다. 이에 본 연구에서는 1년 동안 네이버 이용자들이 입력한 질의를 기록한 질의로그와 질의에 대한 검색 결과에서 이용자가 조회한 문서를 기록한 클릭 로그에 근거하여 국내 웹 검색 질의의 형태 및 주제를 분석하였다. 질의를 형태별로 분류한 결과 사이트 검색 질의가 내용 검색 질의보다 많은 것으로 나타났다. 또한 이용자들이 전반적으로 가장 많이 검색한 주제는 컴퓨터/인터넷. 엔터테인먼트, 쇼핑, 게임. 교육 순으로 나타났다. 본 연구의 결과는 인터넷 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

웹 검색 행태의 추이 및 변화 분석 (Trends and Changes of Web Searching Behavior)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제45권1호
    • /
    • pp.377-393
    • /
    • 2011
  • 이 연구에서는 국내 주요 검색 포털인 네이버 이용자들의 검색 행태 추이를 조사, 분석하였다. 즉 1년 동안 분기별로 네이버에 입력된 질의들을 대상으로 질의의 입력 행태, 오타 입력 행태, 멀티미디어 검색 행태, 결과 문서 클릭 행태 등의 추이를 조사하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구결과, 입력된 질의의 길이 및 주제, 멀티미디어 질의의 특징 및 비율, 오타의 비율 등에 있어서는 1년 동안 큰 변화 없이 일정한 것으로 나타났다. 반면, 질의별로 발생되는 클릭 횟수는 시간이 지남에 따라 점진적으로 증가하는 것으로 나타났다. 본 연구의 결과는 향후 포털의 효과적인 콘텐츠 구축 및 검색 알고리즘 개발에 활용될 수 있을 것으로 기대된다.

세션과 객체 정보를 이용한 개인화된 로그 추출기법 (A Personalized Extracting Method using Session and Object Information)

  • 김민숙;박명순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.89-92
    • /
    • 2004
  • 웹 로그에는 개별 사용자를 식별할 수 있는 사용자 정보와 세션 정보가 포함되어 사용자 식별과 해당 URL은 알 수 있지만, 그 URL에 해당하는 페이지내에 어느 객체에 관심이 있어 클릭하는지 알 수 없고, 페이지내에서 외부 사이트로의 링크 부분을 클릭했을 시 로그 파일에 기록이 되지 않는다. 본 연구에서는 세션과 사용자 중심의 로그 기록 방식에 객체를 추가함으로써 복잡하고 다양해지는 객체 요소(동영상, 오디오, 플래시 등)가 포함된 웹사이트에서는 객체 중심의 로그 기록 방식이 고객의 행동 패턴을 분석하여 세분화된 개인화 서비스에 보다 효율적임을 관찰하였다.

  • PDF

클릭스트림과 서버사이드 이벤트에 의한 확장된 웹 로그 처리시스템 (Extended Web Log Processing System by using Click-Stream and Server Side Events)

  • 강미정;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.460-462
    • /
    • 2001
  • 인터넷 사용자가 급증하고, 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 맞춤 정보를 제공하는 퍼스널라이제이션이 인터넷 개발자 및 사용자들의 관심을 모으고 있다. 이러한 퍼스널라이제이션을 위해서 전처리과정인 사용자 프로파일 생성과정을 확장된 웹 로그 처리 시스템을 통해서 구현해본다. 웹사이트 서버의 확장된 이벤트 처리, 즉 사용자의 행위정보를 로그에 포함시켜 로그정보를 웹 로그 서버에 전송하도록 설계하였다. 그리고 이 웹 로그 정보를 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO 기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤 서비스에 대한 사용자 프로파일을 구축할 수 있다.

  • PDF

웹로그 마이닝을 통한 인터넷 쇼핑몰에서의 사용자 행동 분석

  • 이동하;김성민;오재훈;서동렬;임규건
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.305-312
    • /
    • 2004
  • 인터넷 웹 사이트 상에서 사용자 행동은 클릭(click)을 단위로 모두 로그 (log)에 기록된다. 웹 서버를 통해 남는 웹로그를 가공하여 단순한 통계 수치 외에, 사용자 행동을 분석할 수가 있다. 특히 인터넷 쇼핑몰에서 사용자의 행동에 대한 분석은 중요하며, 고객의 획득, 유지 전략을 수립하기 위한 중요한 정보가 된다. 본 논문에서는 인터넷 쇼핑몰에서의 사용자 행동을 비즈니스 관점에서 분석한다. 쇼핑몰 사이트의 유입 경로 분석의 다양한 관점에 대해 논의하며, 관심 카테고리 및 상품 분석, 첫페이지 영역별 분석 등 새로운 분석 방법에 대해 소개한다. 이와 함께, 이 분석과정에서 필요한 효율적인 데이터 구조, 운영계 데이터 베이스 정보 및 이들간의 연동방안과 분석 결과의 활용 방안을 제시한다.

  • PDF

주요 검색 포탈들의 통합 검색 서비스 비교 평가 (Comparative Evaluation of the Unified Search Services Provided by Major Korean Search Portals)

  • 박소연;이준호
    • 한국도서관정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2008
  • 국내 검색 포탈들이 제공하는 다양한 서비스들 중 가장 대중적이고 인기가 있는 서비스는 통합 검색 서비스이다. 따라서 급변하는 국내 인터넷 환경에서 검색 포탈들의 경쟁력을 강화하기 위해서는 우수한 통합 검색 서비스를 이용자에게 제공하는 것이 필수적이다. 본 연구에서는 국내 주요 검색 포탈들인 네이버, 다음, 야후, 엠파스의 통합 검색 서비스를 결과의 적합도 측면에서 비교, 분석하였다. 통합 검색 서비스 평가 시 본 연구에서는 실제 이용자들이 입력한 실제 질의들을 활용하였다. 또한 질의에 대한 검색 결과에서 이용자들이 실제 조회한 문서를 기록한 클릭 로그를 참고하였다. 본 연구의 결과는 향후 통합 검색 서비스의 개선에 활용되고, 이용자가 우수한 통합 검색 서비스 선택 시 참고자료로 활용될 수 있을 것으로 기대된다.

  • PDF

웹 이용 마이닝을 위한 데이터 전처리에서 사용자 구분에 관한 연구 (A Study of User Identification in Data Preprocessing for Web Usage Mining)

  • 최영환;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.118-120
    • /
    • 2001
  • 웹 이용 마이닝은 거대만 웹 데이터 저장소의 로그들을 이용하여 웹 사용자의 사용 패턴을 분석하는 데이터 마이닝 기술이다. 마이닝 기술을 적용하기 위해서는 전처리 과정 중의 사용자와 세션을 정확하게 구분해야 하는데, 표준 웹 로그 형식의 웹 로그만으로는 사용자를 완전히 구분할 수 없다. 따라서 정확한 결과를 얻기 위해 사용자와 세션을 구분할 수 있는 모듈을 웹 서버에서 제공하거나, 각각의 페이지에 적당한 실행 필드를 삽입해야 한다. 사용자와 세션을 구분하는 데는 캐시 문제, 방화벽 문제. IP(ISP)문제, 프라이버시 문제, 쿠키 문제 등 많은 문제들이 있지만, 이 문제를 해결하기 위한 명확한 방법은 아직 없다. 이 논문은 참조 로그와 에이전트 로그, 그리고 액세스 로그 등 서버측 클릭스트림 데이터만을 이용하여 사용자와 세션을 구분하는 방법을 제안한다.

  • PDF