• 제목/요약/키워드: 로그항목

검색결과 54건 처리시간 0.028초

웹 로그(Web Log) 분석을 통한 정보의 활용

  • 김석기;안정용;한경수;한범수
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.123-127
    • /
    • 2000
  • 인터넷이 데이터 저장 및 서비스를 위한 도구로 폭넓게 활용되고 있으며, 이 과정에서 웹 서버 방문객에 대한 정보인 로그가 발생된다. 이러한 로그는 방문객 주소, 참조 페이지, 방문 시각 등의 정보를 포함하고 있다. 웹 로그에 대하여 패턴분석(pattern analysis), 군집분석(clustering), 판별분석(classification) 등의 통계적 분석을 통하여 방문객이 관심을 가지는 항목이나 항목간의 연관관계 등 새로운 정보를 생성하여 웹 디자인 또는 비즈니스에의 적용에 대한 연구가 활발히 논의되고 있다. 본 연구에서는 웹 로그 분석에 대하여 소개하고 웹 로그 분석을 위한 방안을 제시하고자 한다.

  • PDF

웹 로그데이터를 이용한 대학입시 지원자 행태 분석 (Behavior analysis of entrance applicants using web log data)

  • 최승배;강창완;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권3호
    • /
    • pp.493-504
    • /
    • 2009
  • 홈페이지는 홈페이지를 운영하고 있는 모든 조직체들을 대변하는 얼굴이다. 웹 로그데이터는 홈페이지를 방문하는 사람들의 행적을 나타낸다. 웹 로그데이터를 분석함으로써 홈페이지 운용에 대한 유용한 정보를 얻을 수 있고, 이러한 정보를 이용하여 효율적인 홈페이지 관리 및 고객관계 관리를 수행할 수 있다. 본 연구에서는 D대학교의 홈페이지에서 얻어진 웹 로그데이터를 분석함으로써 효율적인 홈페이지 관리와 신입생 유치를 위한 홍보 전략을 세우는데 기초적인 정보를 제공한다.

  • PDF

DB테크 / 가상 카탈로그를 통한 정보공동체의 실현

  • 어니스트페레즈
    • 디지털콘텐츠
    • /
    • 4호통권95호
    • /
    • pp.63-67
    • /
    • 2001
  • 전문도서관원들은 오랫동안 '가상 콜렉션'을 만드는 작업을 진행해왔다. 우리는 전통적으로, 실제 항목들의 대규모 합동 콜렉션들을 인위적으로 구축함으로써가 아니라 소장서들의 도서목록 기록을 축적시킴으로써 도서관 자료들을 결합시키는 작업에 접근해 왔다. 인터넷 이전의 시대에는 이를 가상 카탈로그라기보다는 '결합' 카탈로그라 칭했었다.

  • PDF

컴포넌트 기반의 웹 로그 분석 시스템 설계 (Design of Component-Base Analysis System)

  • 심민석;유대승;엄정섭;이명재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.592-594
    • /
    • 2001
  • 분석 도구들의 필요성이 증대되고 있다 웹 분석 도구들 중 웹 로그 분석 도구들은 축적된 웹 로그를 분석하여 분석 가능한 정보를 산출하고 이를 효율적인 웹 운영의 기초 정보로 이용할 수 있도록 한다. 그러나 기존의 웹 로그 분석 도구들은 웹사이트에 따라 요구되는 로그 분석 목적을 충족시키기 위해서 변형되어야 하거나 특정한 목적이 맞게 새롭게 개발되어야 한다. 본 연구에서는 로그 분석 시스템 또는 로그 분석 도구 개발에서 공통적으로 수행되는 과정(로그 파일로부터 필요한 항목들을 추출하고 정제하여 분석 가능한 데이터로 저장 루틴)을 컴포넌트화하였다. 이 컴포넌트는 로그로부터 추출한 정보를 XML 문서 또는 데이터베이스에 저장한다. 본 연구에서 개발한 컴포넌트는 로그 데이터를 XML 문서 형식과 데이터베이스에 로그 정보를 저장하여 쉽게 다른 시스템에서 저장된 정보를 유용하게 사용하도록 한다. 또한 생성한 컴포넌트의 효용성을 검증하기 위하여 웹 로그 분석 시스템을 설계하였다.

  • PDF

로그 데이터를 이용한 하둡기반 맞춤형 관광시스템 (A Customized Tourism System Using Log Data on Hadoop)

  • ;김강철
    • 한국전자통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.397-404
    • /
    • 2018
  • 인터넷 사용이 증가함에 따라 많은 사용자 행위가 로그 파일에 기록되고, 최근에 이들을 이용한 연구와 산업이 활성화되고 있다. 본 논문은 오픈 소스 기반 분산 컴퓨팅 플랫폼인 하둡을 사용하고, 로그 파일에 기록된 사용자 행위를 분석하여 맞춤형 관광 정보를 제공하는 시스템을 개발한다. 제안된 시스템은 사용자들이 검색한 웹사이트로부터 로그 파일을 얻기 위하여 구글의 Analytics를 사용하고, 하둡의 MapReduce를 사용하여 검색 항목을 추출하여 HDFS에 저장한다. Octopus 프로그램을 사용하여 여행안내 웹사이트로부터 여행관련 관광지나 도시에 대한 정보를 모으고, MapReduce를 사용하여 관광지의 특징을 추출한다. 그리고 관광지의 특징과 사용자 검색항목을 매칭하여 사용자에게 관광하고 싶은 맞춤형 도시를 제안한다. 본 논문에서는 매칭의 확률을 높이기 위하여 NBP(next bit permutation)알고리즘을 사용하여 검색항목과 관광지 특징을 재정렬하는 기법을 도입한다. 그리고 개발된 시스템의 효용성을 확인하기 위하여 39 명의 사용자에 대한 로그 데이터를 분석하여 맞춤형 관광도시를 제안한다.

프로덕트 라인을 적용한 전자 카달로그 작업 프로세스 (E-Catalog process of Product Line)

  • 박옥자;유철중;장옥배;신현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.430-432
    • /
    • 2004
  • 본 논문에서는 프로덕트 라인 개념을 활용하여 전자 카달로그 운영 프로세스를 구축하고자 한다. 전자 카달로그는 reactive approach(1)방법으로 프로덕트 라인 개발에 접근하여 기본적인 핵심적이고 표준적인 프로세스만 우선적으로 정의하여 각 세부항목을 명시하고 이를 기반으로 프로세스의 기능을 확장하고자 한다 FORM 방법론에서 제안한 휘처 모델링 방법을 통해 얻어진 공통점과 차이점을 이용하여 scoping을 수행하였으며 이를 기반으로 필수 프로세스와 지원 프로세스로 분류하였다. 전자 카달로그 표준안에서 제안한 비즈니스 프로세스, 표준안 보고서, 프로세스 관리 계획 등을 기본 자료로 하여 각 애플리케이션에 적합한 product가 만들어지도록 production plan을 수립하였다.

  • PDF

게임에서 밸런스 평가에 필요한 로그 항목 연구 (A Study the Log Entries Required for Balance Evaluation in the Games)

  • 이윤임;이대웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.85-87
    • /
    • 2021
  • 본 연구는 MMORPG에서 사용자간의 균형을 나타내는 밸런스에 대한 연구를 통해 콘텐츠의 경쟁 구조 혹은 콘텐츠의 밸런스에 필요한 항목을 추출하고자 한다. 게임의 밸런스는 다양한 용어로 활용되고 있으며 그 정의가 각기 다르다. 이런 문제점들을 해결하고자 밸런스의 정의에 대한 문헌 연구를 진행하였으며, 이를 통해 밸런스에 필요한 로그의 항목들을 추출하였다. 게임의 빅데이터는 매우 중요한 연구적 가치를 가지고 있으나 이를 제대로 활용하지 못하고 있는 추세이다. 본 연구를 통해 체계적인 로그데이터를 수집하고 이를 실제 게임 운영에 활용될 수 있기를 기대해 본다.

  • PDF

침입탐지 감사자료 분석을 위한 연관규칙 생성 기술 (Generating Technology of the Association Rule for Analysis of Audit Data on Intrusion Detection)

  • 소진;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1011-1014
    • /
    • 2002
  • 최근 대규모 네트워크 데이터에 대한 패턴을 분석하기 위한 연구에 대하여 관심을 가지고 침입탐지 시스템을 개선하기 위해 노력하고 있다. 특히, 이러한 광범위한 네트워크 데이터 중에서 침입을 목적으로 하는 데이터에 대한 탐지 능력을 개선하기 위해 먼저, 광범위한 침입항목들에 대한 탐지 적용기술을 학습하고, 그 다음에 데이터 마이닝 기법을 이용하여 침입패턴 인식능력 및 새로운 패턴을 빠르게 인지하는 적용기술을 제안하고자 한다. 침입 패턴인식을 위해 각 네트워크에 돌아다니는 관련된 패킷 정보와 호스트 세션에 기록되어진 자료를 필터링하고, 각종 로그 화일을 추출하는 프로그램들을 활용하여 침입과 일반적인 행동들을 분류하여 규칙들을 생성하였으며, 생성된 새로운 규칙과 학습된 자료를 바탕으로 침입탐지 모델을 제안하였다. 마이닝 기법으로는 학습된 항목들에 대한 연관 규칙을 찾기 위한 연역적 알고리즘을 이용하여 규칙을 생성한 사례를 보고한다. 또한, 추출 분석된 자료는 리눅스 기반의 환경 하에서 다양하게 모아진 네트워크 로그파일들을 분석하여 제안한 방법에 따라 적용한 산출물이다.

  • PDF

지능적 이미지 검색 시스템을 위한 질의 패턴 탐사 (Mining Query Patterns for the Intelligent Image Retrieval System)

  • 이충우;나연목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.284-286
    • /
    • 1999
  • 본 논문은 지능적 이미지 검색 시스템을 위한 질의 패턴 탐사를 제안한다. 지능적 이미지 검색 시스템은 이미지 검색시 질의 로그로부터 사용자의 검색 패턴을 탐사하여 패턴에 따라 연관된 검색을 동시에 수행함으로써 검색 효율을 높일 수 있는 시스템이다. 본 논문은 이 시스템의 질의 로그 마이닝 과정에서 필요한 질의 패턴 탐사 방법을 제안한다. 연관 규칙의 경우 단편적인 연관 관계만이 탐사되기 때문에 사용자의 질의 패턴으로 사용하기에 효과적이지 못하다. 따라서 본 논문에서는 연관 규칙을 개선하여 하나의 항목과 연관된 패턴을 표현할 수 있는 형태를 제안한다. 질의 패턴을 사용하면 사용자의 패턴을 탐사하는 응용에서 좀 더 효율적으로 사용할 수 있다.

  • PDF

웹 로그 분석을 위한 전처리기의 설계 (Design of a Preprocessor for Web Log Analysis)

  • 김건량;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.47-50
    • /
    • 2000
  • 최근 들어 인터넷 쇼핑몰의 활성화로 인한 고객의 행동 패턴 분석의 필요성이 증가하고 있다. 본 논문에서는 고객의 행동 패턴 분석 방법 중의 하나로 데이터마이닝 기법을 이용한 웹 로그 분석을 소개한다. 웹 로그에는 고객의 접근 시간, 접근한 웹 페이지, 접근 시 사용한 브라우저 등 많은 정보가 포함되어 있는데, 마이닝 기법을 적용하기 위해서는 우리에게 필요한 정보만을 추출하고 적용하기 편리한 형태로 변환해야 한다. 본 논문에서는 마이닝 기법을 적용하기 위해 필요한 정보를 추출하고 적절한 형태로 변환하는 작업을 수행하는 전처리기의 설계를 제안한다. 본 논문에서 제안하는 전처리기로 구축된 트랜잭션을 통하여 원하는 항목과 범위에 대해서 연관 규칙을 얻을 수 있다.

  • PDF