• 제목/요약/키워드: web log

검색결과 294건 처리시간 0.037초

웹 로그 분석을 통한 높은 정확도를 가지는 소형 트리 구축 (Constructing A Small Tree with High Accuracy through Web Log Classification)

  • 현우석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2006
  • 웹 마이닝은 e-서비스 시스템에서 고객 활동을 분석하기 위하여 널리 보급된 방법 중 하나로서 궁극적인 목표는 새로운 고객을 얻고 기존 고객을 유지하면서 고객의 생산성을 증가시키는데 도움을 줄 수 있는 유용한 정보를 인식하는 것이다. 그러나 웹 로그 자료와 고객의 구매 패턴 사이에 직접적인 관계가 없고, 실험 데이터 집합이 적고 부정확 할 경우 실험 데이터의 적은 집합만으로 유용한 정보를 인식하는 것은 불충분하기 때문에 유용한 정보를 인식하는 것은 더욱 어렵게 된다. 본 논문에서는 기업들에게 유용한 패턴을 제공할 수 있는 독자적인 분류 방법을 사용하여 기존 고객의 보존력을 높일 수 있는 높은 정확도를 가지는 소형 트리를 구축할 수 있었다.

  • PDF

Linux 플랫폼 상에서의 대용량 로그 처리 기법에 대한 연구 (A study for Technique of a large log processing on Linux platform)

  • 문세광;윤한경
    • 한국정보전자통신기술학회논문지
    • /
    • 제1권3호
    • /
    • pp.61-67
    • /
    • 2008
  • 네트워크 보안 장비에서 발생되는 대용량 로그를 syslog-ng을 이용하여 파일로 저장하도록 구현하고, 파일로 저장된 로그 메시지를 데이터베이스로 저장하기 위해 gcc를 이용하여 쓰레드 프로그램을 개발하였으며, 이것을 서버스크립트 언어인 PHP를 이용해 로그의 내용을 파악하는 웹기반 뷰어를 개발하였다. 또한 방화벽에서 발생되는 로그 메시지를 처리하는 패키지 상품과의 비교를 통해 성능을 분석하였다.

  • PDF

확률 기반 악성댓글 판별 (Malicious Web Log Identification based on Probability)

  • 성대경;이현우;이창영;김아영;박성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.905-908
    • /
    • 2014
  • 악성댓글은 인터넷 상에서 상대방이 올린 글에 대한 비방, 험담 등을 하는 악의적인 댓글을 의미한다. 사용자에게 스마트 모바일 기기, 소셜 네트워크 서비스 등의 편리한 서비스를 제공함에 따라 악성댓글에 대한 피해도 꾸준히 증가하고 있다. 본 논문에서 제안하는 방법은 댓글로부터 간단한 형태소 분석과 패턴 추출 과정을 거쳐 단어장을 형성한다. 단어장을 바탕으로 댓글에 포함된 단어가 악성댓글과 비악성댓글에서 나타날 확률을 구하고 이를 기반으로 주어진 댓글이 악성댓글인지 아닌지를 판별한다. 실험결과를 통하여 본 논문에서 제안하는 악성댓글을 판별하는 방법을 평가한다.

클릭스트림 분석을 통한 확장된 웹 로그 처리 시스템 (Extended Web Log Processing System by using Click-Stream)

  • 강미정;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2798-2800
    • /
    • 2001
  • 인터넷 사용자가 급증하고, 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 맞춤 정보를 제공하는 퍼스널라이제이션이 인터넷 개발자 및 사용자들의 관심을 모으고 있다. 원투원 마케팅은 개별 고객의 성별, 나이, 소득 등 인구 통계 정보와 고객의 취미, 레저 등에 관한 정보 및 구매 패턴을 DB화하여 고객에게 가장 적절한 상품, 정보, 광고를 제공하는 것이다. 원투원 마케팅을 기본으로 개인과의 끊임없는 상호교류를 통해 고객에게 맞춤 서비스를 제공할수 있다. 본 논문에서는 맞춤 서비스 제공을 위한 전처리과정으로 클릭스트림 분석을 통한 확장된 웹 로그 정보를 통해서 고객들의 성향을 분석하였다. 그리고 이 웹 로그서버는 웹사이트로부터 얻은 로그정보를 분류하고 저장하여 관리자가 확장된 웹 로그 정보를 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO 기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤 서비스에 대한 사용자 프로파일을 구축 할 수 있다.

  • PDF

웹 로그에 대한 온라인 연관 규칙 기법 (Online Association Rule Technique for Web Access Log)

  • 박은주;권혜련;김은주;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.333-336
    • /
    • 2001
  • 본 논문에서는 웹에서 온라인상으로 발생되는 기록 데이터들의 연관 규칙을 구성할 수 있는 효과적인 기법을 제안하고 있다. 기본적으로, 온라인상에서 연관 규칙을 추출하는 방법은 Carma 알고리즘을 바탕으로 하였기 때문에 최대 데이터의 scan 회수를 2회로 유지하였다. 각 사용자가 방문한 웹 사이트의 수에 대하여 정규 분포를 따르는 가중치를 Phase I 알고리즘의 지지도 관련 변수에 영향을 줌으로써, lattice 의 크기를 조절하는 요소로 사용하여 처리 시간을 단축시키고 있다. 기존의 Carma 알고리즘과 제안하는 W-Carma(Weighted-Carma) 알고리즘과 처리 시간을 비교하였으며, 대량의 데이터일 경우 좋은 성능을 보이고 있다.

  • PDF

인터넷 비즈니스 기반의 고객관계관리(CRM)을 위한 웹 로그 분석에 관한 연구 (A Study on Web-log Analysis for CRM based on Internet Business)

  • 김재형;노효원;김남호;정정화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.10-15
    • /
    • 2000
  • 개별화 웹 마케팅은 본질적으로 고객지향의 패러다임이다. 즉, 개별 고객의 특수한 니즈를 개별적으로 파악해서 각각의 고객에게 차별화된 서비스를 제공하는 것이 그 핵심이다. 웹 서버의 로그파일에 데이터마이닝의 연관규칙 기술을 이용하게 되면 고객행동 패턴의 파악 및 예측을 위한 기법으로 활용할 수 있다. 본 연구에서는 웹 사용자의 교차 판매를 위한 원투원 마케팅에 필요한 접근패턴을 분석하고자 하며, 이는 웹서버 로그파일 분석을 통하여 이루어진다. 분석하고자 하는 웹서버 로그파일은 기존의 데이터웨어하우스의 원천 데이터들과는 다르게 비정형적인 데이터 구조를 가지고있다. 이들 비정형 데이터 처리와 교차판매 지원을 위한 데이터마이닝 모델링, 이를 통한 원투원 마케팅 모델 제시, 그리고 이의 활용이 고객관계관리(CRM)에 미치는 효과를 제시한다.

  • PDF

사용자 생성 로그를 이용한 웹 분석시스템 설계 및 구현 (Design and Implementation of Web Analyzing System based on User Create Log)

  • 고영대;이언배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.264-267
    • /
    • 2007
  • 인터넷 사이트가 증가하면서 서비스 제공자는 사용자의 요구나 행동패턴을 파악하기 위하여 웹 마이닝 기법을 활용한다. 하지만 서버에 저장된 웹 로그 정보를 활용한 마이닝 기법은 전처리 과정에 많은 노력이 필요하고 사용자의 행동패턴이나 요구를 정확하게 파악하는데 한계가 있다. 이를 극복하기 위해 본 논문에서는 사용자 생성 로그정보를 이용한 방법을 제안한다. 제안 방법은 기존 서버에 저장되는 로그파일이 아닌 사용자의 행동에 의해 웹 페이지가 로딩될 때 마다 웹 마이닝에 필요한 정보를 수집하여 DB 에 저장하는 방법을 사용하였다. 이때 기존 로그파일에 로딩시간과 조회시간, 파라메타 정보를 추가하여 보다 사실적으로 사용자의 행동패턴을 파악하고자 하였다. 이렇게 생성된 로그파일을 기 등록된 메뉴정보, 쿼리정보와 조합하면 웹 마이닝에 필수적인 데이터정제, 사용자식별, 세션식별, 트랜잭션 식별등 전처리 과정의 효율성을 향상시키고 사용자의 행동패턴파악을 위한 정보 수집을 용이하게 해준다.

CMS의 사용자 로그를 이용한 패턴 분석 방법 연구 (A Study on the Pattern Analysis Method using the User Log on the CMS)

  • 문동열;박구락;김동현;정진영
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.275-281
    • /
    • 2016
  • 급속히 발전하고 있는 현대사회에서는 다양한 스마트 디바이스의 출현으로 원하는 정보의 획득이 용이해졌으며, 웹을 기반으로 하는 콘텐츠를 이용하는 빈도가 급속히 성장하고 있다. 또한 기업들은 웹 기반 하에서 CMS를 이용하여 콘텐츠를 생산, 수정하는 형태로 바뀌고 있고, 사용자에게 콘텐츠를 제공하는데 있어 매우 중요한 부분이라 할 수 있다. 현재 웹 서비스는 각종 디바이스에 맞게 UI를 설계하고 제공하고 있으며, 이용 편이성을 향상하기 위하여 설문 조사 및 전체 사용자 패턴을 분석하여 서비스를 개선하고 있는 실정이다. 즉 UX를 고려하지 않고 기술적인 측면에서 설계되는 경향이 대부분이라 할 수 있다. 이에 본 논문에서는 전체 사용자의 패턴 분석으로 웹 서비스에 적용하는 한계를 탈피하여 개인 사용자의 이동 패턴 및 사용 패턴을 기반으로 애니메이션을 통하여 비주얼화 하는 시스템을 제안한다. 이러한 융복합을 통하여 웹 관리자 및 기획연구자 측면에서 UX를 사용자 중심으로 변화시킬 수 있을 것으로 기대된다.

구글 애널리틱스를 활용한 웹 사이트의 개선방안 연구 : 앱팩토리를 대상으로 (Research in the Direction of Improvement of the Web Site Utilizing Google Analytics)

  • 김동림;임영환
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.553-572
    • /
    • 2014
  • 인터넷을 이용한 서비스와 정보제공이 활성화 되면서 사용자들은 서비스 품질 및 컨텐츠 품질에 대해 관심 갖기 시작했으며 이러한 변화에 따라 서비스 제공자 또한 사용자의 욕구를 만족 시키는 서비스 및 다수의 사용자가 참여하는 사이트 활성화를 목적으로 하게 되었다. 사용자에게 최상의 서비스를 제공하기 위해 대부분의 서비스 제공자는 이용자 피드백 분석 및 운영시스템 분석 등 자료 분석에 노력하지만 제한된 이용자와의 커뮤니케이션과 자료 수집 및 분석에 상당한 시간과 비용을 들임으로써 사용자들에게 개선된 서비스 제공까지 너무 많은 시간이 소요된다. 본 논문에서는 이러한 이유로 특정 웹 사이트(www.appbelt.net)의 운영현황 분석을 위해 웹 마이닝 기법을 적용한 로그 파일 분석 방식을 채택하였는데 로그 데이터를 가져와 분석하고 별도의 리포트를 만들어 판단하는 번거로움 없이 구글 애널리틱스 툴을 활용하여 정량평가를 시행하였다. 또한 웹 표준 평가(Coolcheck)서비스를 이용한 웹 사이트의 전반적인 품질평가를 통해 해당 웹 사이트의 문제점을 진단하고 개선 방안을 연구하였다. 로그분석이란 사용자가 웹 사이트 이용하면 이에 대한 기록이 로그라는 형태로 흔적이 남게 되는데 이 데이터를 기반으로 사용자가 웹 사이트를 방문하여 행동하는 다양한 정보를 추출해 내는 것이라 할 수 있다. 또한 로그 분석을 통하여 대다수 이용자의 전반적인 이용행태를 분석할 수 있으므로 로그 분석방법은 이용자 계층이 다양하고 이질적인 웹 검색 분야의 연구에 적합한 방법이라고 할 수 있다. 본 논문에서는 로그분석 방법으로 구글 애널리틱스 로그 추적 코드를 웹사이트에 직접 삽입하여 데이터를 수집, 데이터 평가, 리포트 분석 단계를 거쳐 전반적인 웹 사이트의 운영현황을 진단하고 평가한 후 웹 사이트에서 예상하는 사용자의 행동패턴과 실제 방문자의 경로가 일치 하는지 판단하여 문제점 및 개선사항을 도출하였다. 이 판단은 곧 기업의 목표 값 도달 경로의 우선순위(중요도)에 영향을 미치고 사용성이 너무 낮을 경우 경로 설정의 부적절함 등을 웹 사이트의 개선 요소에 포함시키게 된다. 이러한 연구방법은 기업에서 하고자 하는 비즈니스의 방향이 제대로 설정되었는지, 사용자의 요구 및 행태와 일치하는지 분석하여 향 후 비즈니스 방향 재설정 및 웹 사이트 개선에 도움이 될 것으로 보인다.

대화형 통신 순서열 패턴의 마이닝을 위한 효율적인 알고리즘 (An Efficient Algorithm for Mining Interactive Communication Sequence Patterns)

  • 함덕민;송지환;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.169-179
    • /
    • 2009
  • 통신 기록 데이타는 이메일이나 인스턴스 메시지를 주고 받거나, 웹사이트에 접속하는 것과 같은 통신 이벤트들로 구성된다. 미국과 유럽연합을 포함한 여러 나라에서는 인터넷을 사용한 범죄의 조사와 발견을 위해서 통신 서비스 제공자에게 이런 데이타를 보관하도록 규정하고 있다. 보관되는 통신 기록 데이타의 크기가 매우 크기 때문에 치안당국이 이 데이타를 사용하기 위해서는 필요한 정보만을 효과적으로 추출해내는 방법이 필요하다. 본 논문에서는 발신자, 수신자, 통신발생시각의 세 가지 정보만 포함하는 통신 이벤트가 주어질 때, 의미 있는 정보 중 하나인 대화형 통신 순서열 패턴과 이러한 패턴의 마이닝 문제를 정의하고 것을 해결하기 위해 Fast Discovering Interactive Communication Sequence Patterns (FDICSP)라 불리는 알고리즘을 제안한다. FDICSP는 길이가 짧은 대화형 통신 순서열을 조합하여 길이가 긴 대화형 통신 순서열을 생성 해나가는데, 대화형 통신 순서열의 특성에 초점을 맞춘 작업을 통해 효율적으로 대화형 통신 순서열 패턴을 찾는다.