• 제목/요약/키워드: 웹로그 분석

검색결과 269건 처리시간 0.026초

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 (Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM)

  • 전성해;오경환
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.277-282
    • /
    • 2003
  • 웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

개인화 된 추천정보 소기를 위한 Web Usage Mining 알고리즘 (Web Usage Mining Algorithm for Personalized Recommender System)

  • 이은영;곽미라;염선희;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 추계학술대회 논문집 학회본부 D
    • /
    • pp.827-829
    • /
    • 2000
  • 오늘날 인터넷 사용자들은 정보의 홍수 속에 놓여있다. 웹사이트에 들어가면 대부분은 자신과 관련 없는 정보들이 쏟아진다. 따라서 인터넷 사용자들의 관심에 맞는 내용을 제 공해주어 시간의 절약과 동시에 사용자에게 가치 있는 정보를 제공할 수 있게 하는 서비스가 필요하다. 이러한 개인화 된 서비스를 제공해주기 위해 사용자에 대한 정확한 분석을 바탕으로 사용자에게 효율적인 서비스를 제공하여야 할 것이다. 따라서 본 논문에서는 사용자 프로파일 및 웹 로그 등을 토대로 각 고객의 성향과 패턴을 정확하게 분석하여, 사용자 각 개인에게 적합하며 효율적인 서비스를 제공해 줄 수 있는 Web Usage Mining 을 통한 사용자 패턴 추출 알고리즘을 개발하고자 한다. 본 논문에서 연구한 Web Usage Mining 알고리즘은 사용자의 웹 사용 습관을 토대로 데이터 마이닝의 과정을 거쳐 사용자의 성향과 관심을 결정하고, 이를 바탕으로 사용자에게 알맞은 내용을 제공할 수 있도록 할 것이다. 이때, 사용자의 정보는 웹 내에서의 행동 중에서 중요하게 사용되는 특정한 페이지를 보는 시간, 웹 서핑 패턴, 전자 상거래 사이트의 경우에는 구매한 상품과 쇼핑 카트에 넣은 상품 등의 관찰된 정보를 기반으로 하며, 개인의 사생활을 침해하지 않는 범위 내에서 이루어지도록 했다.

  • PDF

국내 웹 이용자의 검색 행태 추이 분석 (Trends of Search Behavior of Korean Web Users)

  • 박소연;이준호
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.147-160
    • /
    • 2005
  • 본 연구에서는 1년이라는 장기간에 걸쳐 네이버에 입력된 검색 질의들의 표본과 각 질의에 대한 클릭 로그에 근거하여 국내 웹 이용자의 검색 행태 추이를 분석하였다. 질의의 형태에 대한 조사 결과, 계절별, 주중과 주말 요일별 질의 형태의 분포에 있어서 유의한 차이가 있는 것으로 나타났다. 또한 웹 이용자들이 입력한 질의의 주제 역시 계절별, 주중과 주말, 요일별로 변화하는 것으로 나타났다. 반면 1년 동안을 전체적으로 살펴볼 때 사이트 검색과 내용 검색의 비율 그리고 주제의 비율이 큰 변화 없이 일정한 상태를 유지하였다. 본 연구의 결과는 인터넷 검색 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

상호연관성 분석을 이용한 웹서버 보안관리 시스템 (Web-Server Security Management system using the correlation analysis)

  • 김성락
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.157-165
    • /
    • 2004
  • 본 논문에서는 현재 증가하고 있는 웹 서비스 공격을 정확하고 빠르게 탐지할 수 있고, 잘못된 공격탐지를 줄여줄 수 있는 웹서버 보안관리시스템을 제안한다. 이 시스템은 여러 단위보안모듈들의 결과를 실시간으로 수집하고 상호연관성 분석과정을 통해 탐지의 정확성을 향상시킨다. 단위보안모듈은 네트웍기반 침입탐지시스템 모듈, 파일무결성 검사 모듈, 시스템로그분석 모듈 그리고 웹로그분석 모듈로 구성되며, 그리고 각각의 단위보안모듈들의 결과에 연관성을 부여하여 실시간으로 분석하는 상호연관성 분석 모듈이 있다. 제안한 시스템은 공격탐지의 정확성 뿐 아니라 단위보안모듈의 추가 그리고 상호연관성 분석의 범위확장이 용이한 프레임워크를 제공한다. 그리고 제안한 시스템의 단위보안모듈 중 침입탐지시스템 모듈은 다중 쓰레드 기반으로 Snort를 재구성하여 보다 빠른 공격 탐지 시간을 갖는다. 처리량이 많은 단위보안모듈의 처리시간을 단축함으로서 웹서버 보안관리시스템 처리 성능을 향상시킬 수 있다.

  • PDF

초등과학 수업을 위한 애니메이션 기반 튜터링 다이얼로그 에이전트 개발 (On the Development of Animated Tutoring Dialogue Agent for Elementary School Science Learning)

  • 정상목;한병래;송기상
    • 정보교육학회논문지
    • /
    • 제9권4호
    • /
    • pp.673-684
    • /
    • 2005
  • 본 연구에서는 인간 교사를 모사하는 "컴퓨터 교사" 역할을 하는 애니메이션 된 튜터링 다이얼로그 에이전트를 구현하고 초등학교 과학과 교수-학습 자료와 통합시켜서 자연어를 기반으로 한 일대일 대화를 통한 교수 학습이 이루어지는 교수-학습 시스템을 개발하였다. 개발된 교수용 다이얼로그 에이전트는 학습자의 대답을 분석하고, 웹 코스웨어를 학습한 후에 초등과학 학습과제에서 요구되는 성취 수준과 비교하여 적절한 질문이나 대답을 제공하는데, TTS(Text-to-Speech) 기능을 이용하여 학습자에게 구어체로 질문이나 대답을 주는 기능을 갖고 있으며 애니메이션 된 인간 교사의 얼굴을 통하여 학습자에게 피드백을 제시할 수 있도록 하였다. 구현된 대화형 인터페이스는 6학년 초등학생 64명에게 현장 실험을 하였다. 현장 실험 결과 비교집단보다 실험집단의 학습 성취도가 평균 10.797점이 향상됨을 보여주었다. 이러한 학습효과는 기존의 웹 코스웨어와 달리 "묻고-답하는" 과정과 인간 교사의 감정을 담은 애니메이션 된 캐릭터를 통하여 학습자들의 호기심을 자극하여 보다 쉽게 교수-학습 과정에 몰입하게 함으로서 학습 효과를 증진시킨 결과로 판단된다.

  • PDF

인터넷 광고에서 방문 횟수를 측정하는 암호학적 방법에 관한 연구 (A Study on Cryptographical Metering Scheme for Advertisements on the Web)

  • 신제용;김순석;김성권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.1045-1048
    • /
    • 2001
  • 통신기술의 발전으로 많은 사람들이 인터넷에 접속하여 정보를 얻고 있다. 인터넷으로 서비스를 제공하는 회사들은 회원이나 방문자들에게 필요한 자료를 공급하고 인터넷 광고를 통해서 수입을 얻고 있다. 광고를 제공하는 서버에 고객들이 방문한 횟수 즉, 광고에 노출된 횟수에 비례해서 광고를 제공한 측에서 광고주에게 광고 수수료를 청구한다. 따라서 광고주와 광고를 직접 제공하는 서버측 모두에게 방문자 수의 측정은 중요하다. 현재 가장 많이 이용되는 웹 로그 분석 기법은 로그파일의 조작에 의해 방문자의 정확한 측정이 어렵고 또 정확한 통계자료로 보기도 어렵다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해서 지금까지 제안된 방문자 측정 방법보다 효율성과 유연성을 가지면서 안전한 측정 방법을 제안한다.

  • PDF

웹 사이트 이용 고객의 행동 정보를 기반으로 한 고객 선호지수 산출 방법 (Method for Preference Score Based on User Behavior)

  • 서동렬;김두진;윤정기;김재훈;문강식;오재훈
    • CRM연구
    • /
    • 제4권1호
    • /
    • pp.55-68
    • /
    • 2011
  • 최근 웹 서비스의 발달과 함께 웹 컨텐츠를 다양하게 활용함으로써, 사용자의 경험을 기반으로 한 개인화 분석이 주목 받고 있다. 기존의 개인화 분석은 주로 데이터베이스의 데이터를 활용한 규칙 및 통계 모형을 기준으로 수행되고 있다. 이에 시장조사 소요기간에 따른 적시성을 반영하는데 어려움이 있었으며, 데이터베이스 적재 데이터가 고객 행동에 대한 결과였기 때문에 고객의 이용 특성을 반영하는데 한계가 지적되어 왔다. 그러나, 최근 고객의 사이트 방문에서부터 방문을 종료할 때까지의 모든 행동을 추적하고 분석하여 개인화된 서비스를 제공하기 위한 많은 연구와 상용화된 기술 개발이 진행되었다. 본 연구에서는 온라인상에서의 고객 행동을 웹 로그 분석을 이용하여 분석함으로써 고객의 행동정보를 U-Score(Usage Score, 이용지수), P-Score(Preference Score, 선호지수), M-Score(Mania Score, 마니아지수) 등 다양한 고객 선호지수를 도출하였다. 이러한 고객의 선호지수를 통해 웹 컨텐츠에 대한 고객의 선호정보를 파악함으로써, 고객에 대한 심도 있는 리포팅과 고객관계관리가 가능하며 개인화 추천 서비스에 유용하게 사용할 수 있다.

  • PDF

ELK Stack을 활용한 SQL Injection 로그 탐지 (Detecting SQL Injection Logs Leveraging ELK Stack)

  • 민송하;유현재;임문주;김종민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.337-340
    • /
    • 2022
  • SQL Injection 공격은 오래된 공격기법 중 하나로 웹 서비스에 대한 해킹 시도 유형 중에서도 높은 비중을 차지하고 있다. SQL Injection 공격은 데이터 노출 및 권한획득 등의 방법으로 현재까지도 해킹 시도가 많이 발생하고 있으며, 본 논문에서는 오픈소스인 ELK Stack을 활용하여 실시간으로 SQL Injection 공격 대응할 수 있는 로그 분석시스템을 구현하였다. 구현한 시스템을 통해 SQL Injection 공격에 대한 로그 데이터를 시각화하여 제공함으로써, 사용자는 공격의 위험도를 쉽게 파악할 수 있으며 신속하게 공격에 대비할 수 있을 것으로 기대한다.

  • PDF

웹 사용 정보에 기반한 다중 성향 키워드 모델의 설계와 응용 (Design and Application of Multi Concept Keyword Model based on Web-using Information)

  • 윤태복;이승훈;윤광호;이지형
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.95-105
    • /
    • 2009
  • 웹의 방대한 데이터에서 사용자에게 유용한 정보를 제공하기 위하여 다양한 연구가 시도되고 있다. 그 중에서 웹 사용 마이닝은 웹 사용자의 로그 정보를 기반으로 의미 있는 패턴을 추출하는 방법이다. 하지만 기존의 웹 사용 마이닝을 이용한 패턴 추출에는 사용자들의 다양한 성향을 고려하지 않은 개별적인 모델을 생성하는데 주를 이루고 있다. 웹에서 사용된 사용자들의 검색 키워드는 그들의 검색 의도나 배경지식에 따라 다양한 의미를 가질 수 있고, 그런 개개인의 검색의도에 맞는 검색 서비스가 제공할 수 있는 기술이 요구된다. 본 논문은 사용자 검색 키워드에 대한 웹 페이지 사용 행위 정보 및 방문한 웹 페이지 리스트를 수집하고 분석하여 다중 성향 키워드 모델(Multi Concept Keyword Model : MCK-Model)을 생성한다. MCK-Model은 사용자들이 특정 키워드를 이용하여 검색 후 방문한 웹 페이지 리스트를 통합하여 생성한 것으로, 사용자들이 검색 키워드에 대해 가지고 있는 다양한 검색 의도에 따라 방문하는 웹 페이지의 정보를 포함하고 있다. 생성된 MCK-Model은 웹 페이지 추천을 위하여 유용하게 사용할 수 있으며, 실험을 통하여 제안하는 방법의 유효함을 확인하였다.

  • PDF

Redis를 활용한 Web Service 성능 향상 (Web Service Performance Improvement with the Redis)

  • 김철호;박경원;최용락
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2064-2072
    • /
    • 2015
  • 대부분의 Web Service는 성능 개선을 위해 사용자 접속 로그를 생성하여 관리한다. 생성된 접속 로그를 통해 트래픽이 많이 발생하는 시간대와 어떤 Resource가 많이 사용되는지 확인할 수 있으며 로그 분석을 통해 Web Service의 성능 측정 및 개선하는데 이용된다. 하지만, 많은 공공부문 Web Service와 같이 일정 기간 동안에 접속량이 증가할 때, 처리 할 사용자 접속 로그 수 증가로 인해 Web Service의 성능이 저하된다. 이를 해결하기 위해, 시스템의 성능을 개선하거나 튜닝을 필요로 하지만 많은 비용이 발생하게 되며 일정한 시간이 지나면, 사용자의 접속이 줄어들게 되어 더 많은 비용이 발생한다. 본 논문에서는 사용자 접속 로그 처리의 성능을 개선을 통한 Web Service의 성능개선을 제안한다. 또한, 최근 대용량 데이터를 처리하기 위하여 많이 사용되고 있는 Redis를 활용하여 NoSQL을 일부 적용한 방법을 제안한다.