• 제목/요약/키워드: Web Log

검색결과 294건 처리시간 0.027초

클릭스트림 분석을 위한 웹 서버 시스템의 설계 및 구현 (Design and Implementation of Web Server for Analyzing Clickstream)

  • 강미정;정옥란;조동섭
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.945-954
    • /
    • 2002
  • 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 개인화된 서비스를 제공하려는 노력이 커지고 있다. 개인화(Personalization)란 고객 한 명을 대상으로 하여 그 고객 한 사람을 위한 정보나 제품을 제공해주는 작업을 말한다. 개인화 서비스를 위해서 전 처리과정인 사용자 프로파일 생성과정이 필요하며, 적극적인 개인화 서비스를 제공하기 위해서는 충분한 고객 데이터가 필요하다. 본 논문에서는 웹사이트 상에서 사용자 행위 패턴을 파악할 수 있는 클릭스트림 정보를 모듈화 하였으며, 이를 이용하여 확장된 웹 로그 시스템을 구현하였다. 클릭스트림 정보를 웹 로그정보에 포함시켜 사용자의 행위 패턴을 파악할 수 있도록 웹 서버 시스템을 설계하고 구현하였다. 그리고 이 웹 서버는 웹사이트로부터 얻은 클릭스트림 정보를 분류하고 저장하여 관리자가 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO(ActiveX Data Object)기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤서비스에 대한 사용자 프로파일을 구축할 수 있다.

패킷 리덕션 방식의 침입탐지 시스템 설계 및 구현 (Design and Implementation of Intrusion Detection System of Packet Reduction Method)

  • 정신일;김봉제;김창수
    • 수산해양교육연구
    • /
    • 제17권2호
    • /
    • pp.270-280
    • /
    • 2005
  • Many researchers have proposed the various methods to detect illegal intrusion in order to improve internet environment. Among these researches, IDS(Intrusion Detection System) is classified the most common model to protect network security. In this paper, we propose new log format instead of Apache log format for SSL integrity verification. We translate file-DB log format into R-DB log format. Using these methods we can manage Web server's integrity, and log data is transmitted verification system to be able to perform both primary function of IDS and Web server's integrity management at the same time. The proposed system in this paper is also able to use for wire and wireless environment based on PDA.

웹 로그와 구매 DB를 이용한 개인화 시스템에 관한 연구 (A Study on Personalization System Using Web Log and Purchasing Database)

  • 김영태;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.23-26
    • /
    • 2003
  • In this paper, a methodolgy for customizing web pages for indivisual users is suggested. It shows an efficient way to personalize web pages by predicting one's site access pattern. In addition, the prediction can reflect one's tendency after actual purchase. By using the APRIORI algorithm, one of the association rule search methods, the associativity among the purchase items can be inferred. This inferrence is based on the log data in a web server and database about purchase. Finally, a web page which contains the relationship, relative links on other web pages, and inferred items can be generated after this process.

  • PDF

기계학습 기반의 웹 마이닝을 이용한 고객 세분화에 관한 연구 (Identification of Customer Segmentation Sttrategies by Using Machine Learning-Oriented Web-mining Technique)

  • 이건창;정남호
    • 산업공학
    • /
    • 제16권1호
    • /
    • pp.54-62
    • /
    • 2003
  • With the ubiquitous use of the Internet in daily business activities, most of modern firms are keenly interested in customer's behaviors on the Internet. That is because a wide variety of information about customer's intention about the target web site can be revealed from IP address, reference address, cookie files, duration time, all of which are expressing customer's behaviors on the Internet. In this sense, this paper aims to accomplish an objective of analyzing a set of exemplar web log files extracted from a specific P2P site, anti identifying information about customer segmentation strategies. Major web mining technique we adopted includes a machine learning like C5.0.

트랜잭션 로그 분석을 통한 웹기반 온라인목록의 검색행태 추이 분석 (Trends of Web-based OPAC Search Behavior via Transaction Log Analysis)

  • 이성숙
    • 한국비블리아학회지
    • /
    • 제23권2호
    • /
    • pp.209-233
    • /
    • 2012
  • 이 연구에서는 웹기반 온라인목록 이용자들의 전반적인 검색행태를 알아보기 위해, 7년 동안의 트랜잭션 로그를 분석하였다. 웹기반 온라인목록의 검색형태는 검색전략과 검색실패의 관점에서 조사하였다. 검색전략에서는 검색유형, 접근점, 연산자, 검색문의 길이, 단어 사용횟수, 웹기반 온라인목록 이용횟수, 시간대별 및 요일별 이용횟수를 분석하였다. 또한 검색실패는 검색실패율과 접근점별 검색실패율, 연산자별 검색실패율을 분석하였다. 이 연구결과는 향후 웹기반 온라인목록 시스템과 서비스 개선에 활용될 수 있을 것으로 기대된다.

웹서버 로그 데이터의 이상상태 탐지 기법 (Novelty Detection on Web-server Log Dataset)

  • 이화성;김기수
    • 한국정보통신학회논문지
    • /
    • 제23권10호
    • /
    • pp.1311-1319
    • /
    • 2019
  • 현재 웹 환경은 정보 공유와 비즈니스 수행을 위해 보편적으로 사용되고 있는 영역으로 개인 정보 유출이나 시스템 장애 등을 목표로 하는 외부 해킹의 공격 타켓이 되고 있다. 기존의 사이버 공격 탐지 기술은 일반적으로 시그니처 기반 분석으로 공격 패턴의 변경이 발생할 경우 탐지가 어렵다는 한계가 있다. 특히 웹 취약점 기반 공격 중 삽입 공격은 가장 빈번히 발생하는 공격이고 다양한 변형 공격이 언제든 가능하다. 본 논문에서는 웹서버 로그에서 정상상태를 벗어나는 비정상 상태를 탐지하는 이상상태 탐지 기법을 제안한다. 제안된 방법은 웹서버 로그 내 문자열 항목을 머신러닝 기반 임베딩 기법으로 벡터로 치환한 후 다수의 정상 데이터와 상이한 경향성을 보이는 비정상 데이터를 탐지하는 머신러닝 기반 이상상태 탐지 기법이다.

ScienceON 웹 로그에 대한 인간 및 웹 크롤러 행위 패턴 분석 (Analysis of Behavior Patterns from Human and Web Crawler Events Log on ScienceON)

  • ;정한민;박정훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.6-8
    • /
    • 2022
  • 웹 로그 분석은 서비스 개선에 있어 필수적인 절차 중 하나이다. ScienceON은 다양한 과학기술 문헌과 정보를 서비스하는 대표적인 정보 서비스이며, 우리는 지속적인 개선을 위해 웹 로그를 분석하고 있다. 본 연구는 2020년 5월과 2021년 5월 생성된 ScienceON 웹 로그에 대해 인간과 웹 크롤러로 구분하여 심층적인 분석을 하는 데 목표를 두고 있다. 먼저 S(검색), V(상세보기), D(다운로드) 타입에 해당하는 웹 로그만 추출하여 각 시기에 대해 658,407와 8,727,042 레코드로 정규화하였다. 그리고, 파이썬 'user_agents' 라이브러리를 이용하여 인간과 웹 크롤러로 로그를 분리하였으며, 각 로그에 대해 60초를 기준으로 세션 크기를 설정하고 분석하였다. 인간과 달리 웹 크롤러는 세션 당 평균 행위 패턴(Average Behaviors per Session)의 길이가 상대적으로 길고, 행위 패턴이 V 중심으로 이루어짐으로 확인하였다. 향후 웹 크롤러를 쉽게 탐지하고 대응하며, 인간 사용자의 행위 패턴에 대응할 수 있도록 서비스를 개선할 예정이다.

  • PDF

웹사이트의 효율적인 구조 관리와 평가 방법 (A Method for Efficient Structure Management and Evaluation of Website)

  • 유대승;엄정섭;이명재
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.306-315
    • /
    • 2002
  • 웹의 급속한 성장과 함께 기존의 시스템들이 웹을 기반으로 통합되며, 다양한 시스템들이 개발되고 있다. 일반적인 어플리케이션과는 달리 웹 어플리케이션들은 다양한 기술의 접목으로 개발된다는 점과 본래의 복잡성으로 인해 개발과 관리에 있어 어려움은 더욱 증대된다. 또한 급변하는 비즈니스 환경과 사용자들의 요구사항에 순응하기 위해서는 지속적인 진화가 요구된다. 본 논문에서는 웹 어플리케이션의 구조 정보인 링크 정보를 추출하고, 웹사이트에 대한 유용한 정보를 담고 있는 로그 파일을 분석하여 웹 어플리케이션의 보다 효율적인 개발과 유지보수에 활용하는 방법을 제시한다. 본 논문에서 추출한 정보들은 웹 어플리케이션 테스팅을 위한 기초적인 정보가 될 수 있으며 추출한 정보들을 웹 테스팅에 적용하는 방법을 설명한다. 그리고 링크 정보 추출과 웹 로그 분석을 수행하기 위해 개발된 시스템에 대해 기술한다.

  • PDF

Sparse Data Cleaning using Multiple Imputations

  • Jun, Sung-Hae;Lee, Seung-Joo;Oh, Kyung-Whan
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권1호
    • /
    • pp.119-124
    • /
    • 2004
  • Real data as web log file tend to be incomplete. But we have to find useful knowledge from these for optimal decision. In web log data, many useful things which are hyperlink information and web usages of connected users may be found. The size of web data is too huge to use for effective knowledge discovery. To make matters worse, they are very sparse. We overcome this sparse problem using Markov Chain Monte Carlo method as multiple imputations. This missing value imputation changes spare web data to complete. Our study may be a useful tool for discovering knowledge from data set with sparseness. The more sparseness of data in increased, the better performance of MCMC imputation is good. We verified our work by experiments using UCI machine learning repository data.

웹 및 시스템 로그 분석 기반 공간정보 오픈플랫폼 서비스 사용 현황 분석 (Service Status Analysis About the Spatial Information Open Platform based on the Analysis of Web Server Log and System Log)

  • 장한솔;홍성훈;김민수;장인성
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.45-54
    • /
    • 2015
  • 공간정보 오픈플랫폼 서비스인 브이월드가 2012년 시범 서비스를 시작한 후부터 지금까지 많은 국민들의 관심으로 매년 사용자가 폭발적으로 증가하고 있다. 증가하는 사용자의 요구에 따라 앞으로 추가될 서비스 및 사용자의 이용 환경 개선 등의 지표로 활용하기 위해 구체적인 서비스 사용 현황을 알 필요가 있다. 하지만 현재의 시스템에는 실시간 모니터링 시스템이 구축되어 있지 않아 브이월드가 제공하는 2D/3D/Portal 서비스별 하드웨어 자원 사용량과 실사용자들의 이용 패턴 등의 구체적인 서비스 사용 현황을 파악하는데 어려움이 있다. 이에 본 논문에서는 웹 로그를 바탕으로 2D/3D/Portal 서비스별 시스템 사용 현황 및 시스템 로그를 바탕으로 자원(CPU, Memory) 사용 현황 분석을 통해 2015년도 서비스 사용 현황을 분석하고 2014년도 대비 분석 결과를 비교하여, 현 시스템의 문제점 및 해결 방안을 제시한다.