• 제목/요약/키워드: 웹 로그분석

검색결과 268건 처리시간 0.029초

웹 사용 마이닝에서의 데이터 수집 전략과 그 응용에 관한 연구 (Research on Data Acquisition Strategy and Its Application in Web Usage Mining)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.231-241
    • /
    • 2019
  • 웹 사용 마이닝 (WUM)은 웹 마이닝과 데이터 마이닝 기술의 응용 중의 하나다. 웹 마이닝 기술은 사용자가 웹 사이트에 액세스 할 때 웹 사용자가 생성 한 웹 서버 로그 데이터를 사용하여 사용자의 액세스 패턴을 식별하고 분석하는데 사용된다. 따라서 우선 데이터 마이닝 기술을 적용하여 웹 로그에서 사용자 액세스 패턴을 발견하기 전에 합리적인 방법으로 데이터를 수집해야 한다. 데이터 수집의 중요한 일은 사용자의 웹 사이트 방문 과정에서 사용자의 자세한 클릭 동작을 효율적으로 얻는 것이다. 이 논문은 주로 데이터 수집 전략 및 필드 추출 알고리즘과 같은 웹 사용 마이닝 데이터 프로세스의 첫 단계 이전의 데이터 수집 단계에 중점을 둔다. 필드 추출 알고리즘은 로그 파일에서 필드를 분리하는 프로세스를 수행하며 대용량의 사용자 데이터에 대한 실제 응용에도 사용된다.

소프트웨어 개발 프로세스 교육을 위한 웹기반 로그 시스템의 구현 및 분석 (Analysis and Implementation of Web Based Log System for The Education of Software Developing Process)

  • 박지연;유욱성
    • 컴퓨터교육학회논문지
    • /
    • 제9권4호
    • /
    • pp.55-61
    • /
    • 2006
  • PSP(personal software process)는 소프트웨어 개발자들이 양질의 코드를 생산할 수 있도록 개발된 정밀하면서도 계량적인 수치를 기반으로 한 소프트웨어공학 기법이다. PSP의 효과적 학습을 위해서는 프로젝트에서 발생하는 많은 양의 데이터를 계산하고 기록하는 작업을 필수적으로 행해야만 한다. 이 작업은 많은 시간이 소요될 뿐 아니라, 오류의 발생이 쉬워 PSP 학습의 동기와 효과를 감소시키는 결과를 초래한다. 이를 개선하기 위해서 본 연구에서는 데이터의 정리, 검증 및 분석을 처리할 수 있도록 웹 기반의 PSP 로그 시스템을 설계하고 구현하였다. 3년간의 실험 결과는 이 시스템이 생산성과 정밀도를 높일 뿐만 아니라, 데이터의 처리보다는 PSP 기법의 프로세스에 대한 학습과 교수에 더 집중할 수 있게 해주었음을 보여주었다.

  • PDF

웹 로그 분석을 통한 높은 정확도를 가지는 소형 트리 구축 (Constructing A Small Tree with High Accuracy through Web Log Classification)

  • 현우석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2006
  • 웹 마이닝은 e-서비스 시스템에서 고객 활동을 분석하기 위하여 널리 보급된 방법 중 하나로서 궁극적인 목표는 새로운 고객을 얻고 기존 고객을 유지하면서 고객의 생산성을 증가시키는데 도움을 줄 수 있는 유용한 정보를 인식하는 것이다. 그러나 웹 로그 자료와 고객의 구매 패턴 사이에 직접적인 관계가 없고, 실험 데이터 집합이 적고 부정확 할 경우 실험 데이터의 적은 집합만으로 유용한 정보를 인식하는 것은 불충분하기 때문에 유용한 정보를 인식하는 것은 더욱 어렵게 된다. 본 논문에서는 기업들에게 유용한 패턴을 제공할 수 있는 독자적인 분류 방법을 사용하여 기존 고객의 보존력을 높일 수 있는 높은 정확도를 가지는 소형 트리를 구축할 수 있었다.

  • PDF

실시간 로그를 통한 지능형 웹 서버 침입 탐지 시스템에 대한 연구 (Real-Time Intellectual Invasion Detection Systems Using Log)

  • 선준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.1172-1173
    • /
    • 2007
  • 웹 어플리케이션의 프로그래밍 오류를 이용한 침입이 대부분의 공격 수단으로 이용되고 있다. 본 논문에서는 웹 어플리케이션의 동작으로 인한 취약점을 분석 후 기계학습 기법을 이용하여 웹 해킹공격 패턴을 비교, 분석하며 새로운 공격시도를 학습하는 지능형 침입 탐지 시스템 모델을 제안한다.

국가기록원 질의로그 빅데이터 기반 이용자 정보요구 유형 분석 (User Information Needs Analysis based on Query Log Big Data of the National Archives of Korea)

  • 백지연;오효정
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.183-205
    • /
    • 2019
  • 이용자의 정보요구를 파악하기 위한 다양한 방법 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영하고, 대다수 이용자의 전반적인 이용행태를 분석할 수 있다. 이에 본 연구에서는 국가기록원 웹 포털서비스를 통해 입수된 대량의 질의로그 빅데이터를 기반으로 이용자의 정보요구를 파악하기 위해 1) 질의에 내포된 정보요구 유형별과 2) 검색결과로 제공한 기록 유형별 분석을 진행하였다. 분석에 활용한 질의로그는 국가기록원이 웹을 통해 검색서비스를 제공한 2007년부터 2018년 12월까지, 총 141개월 동안 수집된 월별 상위 100개 질의어 1,571,547개를 대상으로 하였다. 나아가 분석결과를 토대로 이용자 검색 만족도를 향상시킬 수 있는 개선방안을 제안하였다. 본 연구의 결과는 국가기록원 검색 서비스 개선 및 고도화를 위한 구체적이고 실질적 방안을 제시했다는 점에서 의의가 있다.

웹사이트 로그 분석과 사례기반의 전자상거래 에이전트 시스템 (An e-Commerce Agent System based on Web Site Log Analysis and Case Base)

  • 나윤지;원동유;이순애;조용환
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.363-368
    • /
    • 2002
  • 전자상거래시스템의 효율적인 운영과 관리를 위해 더욱 많은 노력이 요구되고 있으며 고객의 요구에 대해 가장 적절한 정보를 제공함으로서 만족을 극대화할 수 있어야 한다. 이를 위해 많은 지능형 에이전트 기술을 사용한 전자상거래 시스템이 도입되고 있다. 본 논문에서는 전자상거래시스템에서 CRM 지원을 위한 사례기반 추론과 웹 로그 분석을 기반으로 한 다중 에이전트 시스템을 제안하였다. 본 논문에서 제안한 시스템은 로그분석을 통해 트래픽과 시스템 정보의 분석과 사례기반 추론을 통해 특정 조건에서 고객의 요구에 대해 적절한 정보를 제공할 수 있다.

  • PDF

온라인 뉴스 웹사이트의 로그를 이용한 연관규칙 발견에 관한 연구 (Mining Association Rules from the Web Access Log of an Online News website)

  • 황현석;유기동
    • 한국산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.47-57
    • /
    • 2013
  • 인터넷의 활용으로 기업활동의 많은 영역이 온라인을 통해 이루어지고 있다. 온라인 쇼핑몰에서는 고객이 웹사이트 방문 후에 어떤 활동을 하는지를 파악하고 이를 경영활동의 성과로 연계하기 위해 웹 로그를 분석하고 있다. 온라인 뉴스 사이트에서도 방문자의 활동을 파악하고 어떤 기사에 관심이 많은지, 어떤 분야의 기사를 많이 보는지 등을 파악하여 독자에게 서비스하는 것이 필요하다. 그러나 언론사의 웹사이트 로그를 분석하는 연구는 충분히 이루어지지 않고 있다. 본 연구에서는 온라인 뉴스 웹사이트에서 수집된 로그를 이용하여 방문자의 웹사이트 내에서의 활동을 파악하고 뉴스 기사간 연관규칙을 도출한다. 연구는 크게 방문자의 세션(session)을 파악하는 첫 번째 단계와 방문자가 읽은 뉴스 기사간의 연관규칙을 살펴보는 두 번째 단계로 이루어져 있으며 두 차례에 걸쳐 수집된 웹사이트 로그를 이용하여 분석하였다. 최종적으로 도출된 규칙의 의미와 온라인 뉴스 사이트에서 고려해야 하는 함의를 제시하였다.

데이터마이닝을 이용한 웹 데이터 분석 (Analysis of Web Data Applying Data Mining)

  • 채승경;서용무
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.345-361
    • /
    • 2001
  • 인터넷의 확산으로 웹 구조, 웹 로그 등을 분석하는 웹마이닝(Web Mining)에 대한 연구가 활발히 진행되고 있다. 그러나 웹에서 발생하는 데이터에 대한 분석은 아직 미약한 상태이다. 웹에서 획득된 데이터는 신뢰도가 낮아 통계와 같은 기존의 분석 방법을 적용하기에 많은 어려움이 따른다. 또한 대용량 데이터와 실제 데이터에 유연한 분석을 제공하는 데이터 마이닝은 아직까지 적용 분야가 매우 한정되어 있다. 본 논문에서는 인터넷 사이트의 실제 데이터를 이용하여 데이터마이닝 과정에 따라 데이터 정제, 데이터 선택, 데이터 변환 등 효과적인 데이터 전처리 방법을 제시한다. 또한 이렇게 전처리된 데이터로 고객 세분화, 우수 고객 분류를 위한 데이터마이닝 기법을 적용한 후 수행 결과를 분석한다. 마지막으로 분석의 한계점을 지적하고 보다 양질의 데이터마이닝을 위한 시스템 및 사이트 설계 방안을 제시한다.

  • PDF