• 제목/요약/키워드: web mining

검색결과 542건 처리시간 0.02초

Web Server Log Visualization

  • Kim, Jungkee
    • International journal of advanced smart convergence
    • /
    • 제7권4호
    • /
    • pp.101-107
    • /
    • 2018
  • Visitors to a Web site leave access logs documenting their activity in the site. These access logs provide a valuable source of information about the visitors' access patterns in the Web site. In addition to the pages that the user visited, it is generally possible to discover the geographical locations of the visitors. Web servers also records other information such as the entry into the site, the URL, the used operating system and the browser, etc. There are several Web mining techniques to extract useful information from such information and visualization of a Web log is one of those techniques. This paper presents a technique as well as a case a study of visualizing a Web log.

문서 유사도 기반의 웹 마이닝 시스템 개발 (Development of A Web Mining System Based On Document Similarity)

  • 이강찬;민재홍;박기식;임동순;우훈식
    • 한국전자거래학회지
    • /
    • 제7권1호
    • /
    • pp.75-86
    • /
    • 2002
  • In this study, we proposed design issues and structure of a web mining system and develop a system for the purpose of knowledge integration under world wide web environments resulted from our developing experiences. The developed system consists of three main functions: 1) gathering documents utilizing a search agent; 2) determining similarity coefficients between any two documents from term frequencies; 3) clustering documents based on similarity coefficients. It is believed that the developed system can be utilized for discovery of knowledge in relatively narrow domains such as news classification, index term generation in knowledge management.

  • PDF

가상상점에서 고객 행위 연관성 분석을 위한 데이터 마이닝 기법 (A Data Mining Technique for Customer Behavior Association Analysis in Cyber Shopping Malls)

  • 김종우;이병헌;이경미;한재룡;강태근;유관종
    • 한국전자거래학회지
    • /
    • 제4권1호
    • /
    • pp.21-36
    • /
    • 1999
  • Using user monitoring techniques on web, marketing decision makers in cyber shopping malls can gather customer behavior data as well as sales transaction data and customer profiles. In this paper, we present a marketing rule extraction technique for customer behavior analysis in cyber shopping malls, The technique is an application of market basket analysis which is a representative data mining technique for extracting association rules. The market basket analysis technique is applied on a customer behavior log table, which provide association rules about web pages in a cyber shopping mall. The extracted association rules can be used for mall layout design, product packaging, web page link design, and product recommendation. A prototype cyber shopping mall with customer monitoring features and a customer behavior analysis algorithm is implemented using Java Web Server, Servlet, JDBC(Java Database Connectivity), and relational database on windows NT.

  • PDF

A Major DNA Marker Mining of BM4311 Microsatellite Loci in Hanwoo Chromosome 6

  • Lee, Jea-Young;Kim, Mun-Jung;Lee, Yong-Won
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권4호
    • /
    • pp.759-772
    • /
    • 2003
  • K-Means and Web mining modelling have been tried for finding major DNA marker of BM4311 microsatellite loci in Hanwoo Chromosome 6 linkage map. Furthermore, a major DNA mining by bootstrap simulations(BCa) has been applied.

  • PDF

웹 사용 정보 마이닝 기반의 동적 사용자 프로파일 생성 (Generator of Dynamic User Profiles Based on Web Usage Mining)

  • 안계순;고세진;정준;이필규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.389-390
    • /
    • 2002
  • 동적 웹 컨텐츠 제공에서 고객을 위한 추천서비스에 이르는 인터넷 기반의 전자상거래 애플리케이션에서는 고객이 어떤 성향을 가지고 있는가에 대한 정보를 획득하는 것이 중요하다. 웹 개인화의 대표적인 기술인 협력적 석과는 사용자의 정보를 정적인 프로파일 형태로 저장하여 사용자의 성향 변화를 빨리 획득할 수 없다. 또한 사용자의 명시적 평가 의존성, 확장성 부족, 다차원 공간 데이터에 대한 적용 어려움 둥의 문제점을 가지고 있다. 이와 같은 단점을 해결하기 위한 해결 방안으로 웹 사용 정보 마이닝(web usage mining)이 쓰이고 있다. 웹 사용 정보 마이닝은 서버에 축적된 웹 사용 데이터(web usage data)를 이용하여 패턴을 발견하는 기술이다. 특히 연관 규칙 생성 알고리즘으로 웹 사용 패턴(web usage pattern)을 찾고 패턴을 클러스터링하는 기술이 사용되고 있다. 그러나 연관 규칙 생성 알고리즘은 많은 수의 패턴들을 찾고 또 유용하지 못한 패턴을 발견하는 단점이 있다. 본 논문에서는 검증된 웹 사용 패턴을 이용한 동적 사용자 프로파일 생성 방법을 제안한다. 먼저 패턴 발견을 위해 연관 규칙 생성 알고리즘인 Apriori를 이용하고 사용자 프로파일을 위한 클러스터를 생성하기 위해 ARHP를 채택하였다. 클러스터를 생성하기 전에 Dempster-Shafer 이론을 이용하여 유용하지 못한 패턴을 제거하는 패턴 검증 과정을 수행한다. 검증된 패턴을 이용하여 클러스터를 생성하고 사용자의 현재 활성화된 세션에 따라 동적으로 사용자 프로파일이 생성된다

Mining Parallel Text from the Web based on Sentence Alignment

  • Li, Bo;Liu, Juan;Zhu, Huili
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.285-292
    • /
    • 2007
  • The parallel corpus is an important resource in the research field of data-driven natural language processing, but there are only a few parallel corpora publicly available nowadays, mostly due to the high labor force needed to construct this kind of resource. A novel strategy is brought out to automatically fetch parallel text from the web in this paper, which may help to solve the problem of the lack of parallel corpora with high quality. The system we develop first downloads the web pages from certain hosts. Then candidate parallel page pairs are prepared from the page set based on the outer features of the web pages. The candidate page pairs are evaluated in the last step in which the sentences in the candidate web page pairs are extracted and aligned first, and then the similarity of the two web pages is evaluate based on the similarities of the aligned sentences. The experiments towards a multilingual web site show the satisfactory performance of the system.

  • PDF

대용량 웹 로그 마이닝 및 공격탐지를 위한 B-트리 인덱스 벡터 기반 고속 검색 기법 (High-Speed Search Mechanism based on B-Tree Index Vector for Huge Web Log Mining and Web Attack Detection)

  • 이형우;김태수
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1601-1614
    • /
    • 2008
  • 최근 대부분의 인터넷 환경이 쳅 기반 시스템으로 발전하면서 웹 서비스 사용자 수는 꾸준히 증가하고 있다. 따라서 일반 사용자가 대형 포털 사이트 웹 서버 접속시 생성되는 로그 정보를 분석하여 웹 서버에 대한 공격을 탐지하거나 웹 마이닝 기술과 접목하기 위해서는 대용량의 웹 로그 정보에 대한 효율적인 분석 기법이 필요하다. 기존 웹 로그 전처리 기법은 로그 문자열의 순차적인 탐색을 수행하므로 대용량의 웹 로그 고속화 처리에 적합하지 않다. 본 연구에서는 대용량 웹 로그 정보에 대해 B-트리 인덱싱 벡터 구조를 이용하여 필드별 분류 및 고속 검색 알고리즘을 개발하였다 이를 통해 효율적으로 대용량 로고로부터 효율적인 세션 분석 기능과 개선된 검색 성능을 제공할 수 있었으며 웹 서버에 대한 공격 탐지에도 활용할 수 있었다.

  • PDF

개인화 된 추천정보 소기를 위한 Web Usage Mining 알고리즘 (Web Usage Mining Algorithm for Personalized Recommender System)

  • 이은영;곽미라;염선희;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 추계학술대회 논문집 학회본부 D
    • /
    • pp.827-829
    • /
    • 2000
  • 오늘날 인터넷 사용자들은 정보의 홍수 속에 놓여있다. 웹사이트에 들어가면 대부분은 자신과 관련 없는 정보들이 쏟아진다. 따라서 인터넷 사용자들의 관심에 맞는 내용을 제 공해주어 시간의 절약과 동시에 사용자에게 가치 있는 정보를 제공할 수 있게 하는 서비스가 필요하다. 이러한 개인화 된 서비스를 제공해주기 위해 사용자에 대한 정확한 분석을 바탕으로 사용자에게 효율적인 서비스를 제공하여야 할 것이다. 따라서 본 논문에서는 사용자 프로파일 및 웹 로그 등을 토대로 각 고객의 성향과 패턴을 정확하게 분석하여, 사용자 각 개인에게 적합하며 효율적인 서비스를 제공해 줄 수 있는 Web Usage Mining 을 통한 사용자 패턴 추출 알고리즘을 개발하고자 한다. 본 논문에서 연구한 Web Usage Mining 알고리즘은 사용자의 웹 사용 습관을 토대로 데이터 마이닝의 과정을 거쳐 사용자의 성향과 관심을 결정하고, 이를 바탕으로 사용자에게 알맞은 내용을 제공할 수 있도록 할 것이다. 이때, 사용자의 정보는 웹 내에서의 행동 중에서 중요하게 사용되는 특정한 페이지를 보는 시간, 웹 서핑 패턴, 전자 상거래 사이트의 경우에는 구매한 상품과 쇼핑 카트에 넣은 상품 등의 관찰된 정보를 기반으로 하며, 개인의 사생활을 침해하지 않는 범위 내에서 이루어지도록 했다.

  • PDF

다차원 연관 분석을 이용한 인터넷 이용자의 특징 분석 (Analysis of Internet User Features using Multi-dimensional Association Analysis)

  • 이수은;정용규
    • 서비스연구
    • /
    • 제1권1호
    • /
    • pp.61-69
    • /
    • 2011
  • 데이터 마이닝은 대용량의 데이터베이스로부터 기존에 알려지지 않은, 즉 단순한 질의어로 추출할 수 없는 형태의 '유용한' 정보를 찾아내고 이를 바탕으로 데이터에 대한 통찰(insight)을 얻는 것으로 정의할 수 있다. 본 논문에서는 웹에서 발생하거나 웹 사이트에 저장한 데이터를 대상으로 유용한 패턴을 찾아내기 위하여 인터넷을 이용하는 이용자의 특징을 분석하기 위해 시도되었다. 즉 인터넷 사용자에 대한 일반적인 통계 정보 데이터에 연관성 분석을 적용하여 인터넷 사용 시간에 영향을 미치는 인터넷 이용자의 특징을 분석하였다. 실험을 통하여 데이터로부터의 연관 규칙을 추출 해내었으며, 최적의 결과를 도출하기위한 데이터 전처리 및 알고리즘을 적용하여 웹 마이닝을 위한 인터넷 사용자의 특징을 분석한 결과 그 유용성을 확인할 수 있었다.

  • PDF

인터넷 쇼핑몰을 위한 데이터마이닝 기반 개인별 상품추천방법론의 개발 (Development of a Personalized Recommendation Procedure Based on Data Mining Techniques for Internet Shopping Malls)

  • Kim, Jae-Kyeong;Ahn, Do-Hyun;Cho, Yoon-Ho
    • 지능정보연구
    • /
    • 제9권3호
    • /
    • pp.177-191
    • /
    • 2003
  • 상품추천시스템은 고객들에게 추천 상품 리스트를 만들어 고객들이 구매 가능성이 있는 상품을 쉽게 찾도록 도와주는 개인화 된 정보필터링 기술이다 협업 필터링(collaborative filtering)이 가장 성공적인 상품추천 기법으로 알려져 있으며 많이 이용되고 있다. 그러나, 인터넷 쇼핑몰에서 관리하는 상품과 고객의 수가 급속히 증가하면서 협업필터링에 기반 한 상품추천 시스템은 입력데이터의 희박성(Sparsity) 문제와 시스템 확장성(Scalability) 문제가 노출되고 있다. 따라서 본 연구에서는 협업필터링 기반 상품추천시스템의 상품추천 효과 및 성능을 개선하기 위해 웹 마이닝과 군집분석 기법에 기반을 둔 개인별 상품추천 방법론을 개발한다. 또한 실제 인터넷 쇼핑몰에서 개인별로 상품을 추천할 때 개발된 상품추천 방법론을 적용하여 다른 기존 상품추천 방법론과 실험적으로 비교함으로써 개발 방법론의 효과 및 성능을 검증한다.

  • PDF