• 제목/요약/키워드: web data mining

검색결과 408건 처리시간 0.026초

웹 데이터 마이닝과 지식경영 프레임웍을 통한 지식-기반 디자인 패러다임 구축 (The Knowledge-Based Design Paradigm through Web Data Mining and Knowledge Management Framework)

  • 양종열
    • 디자인학연구
    • /
    • 제15권4호
    • /
    • pp.159-168
    • /
    • 2002
  • 세계는 지식정보사회(knowledge information society)에 돌입하였다. 정보기술은 지식경영을 등장시킨 요인중의 하나이며 지식경영발전을 가속화시키는 원동력이라고 볼 수 있다. 그리고 최근 정보기술과 인터넷은 눈부신 발전을 해오고 있다. 따라서 본 연구는 급변하는 디지털 환경하의 방대한 인터넷 데이터에서 웹 데이터 마이닝을 통해 고객에 대한 숨겨진 지식을 창출하고, 그 지식을 지식경영프레임웍에 적용한 지식-기반디자인 패러다임을 구축하여 디지털 환경에서 실시간에 고객에 대한 유용한 지식을 창출하여 고객의 욕구를 충족시키는 디자인을 개발 할 수 있도록 하는데 목적이 있다. 연구의 목적을 달성하기 위해 먼저 이론적 고찰에서 지식경영프로세스와 웹 데이터 마이닝에 관련된 다양한 사전 연구들을 살펴보고 지식경영프로세스와 웹 데이터 마이닝을 결합하여 새로운 지식-기반 디자인 패러다임(본 연구에서는 웹 데이터 마이닝과 지식경영프로세스가 통합하여 구현된 진정한 의미의 eCRM을 지식-기반 디자인패러다임이라 칭한다)을 제안한다.

  • PDF

웹 마이닝을 위한 입력 데이타의 전처리과정에서 사용자구분과 세션보정 (User Identification and Session completion in Input Data Preprocessing for Web Mining)

  • 최영환;이상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.843-849
    • /
    • 2003
  • 웹 이용 마이닝은 거대한 웹 로그들을 이용하여 웹 사용자의 이용 패턴을 분석하는 데이타 마이닝 기술이다. 이러한 웹 이용 마이닝 기술을 사용하기 위해서는 전처리 과정 중의 사용자와 세션을 정확하게 구분해야 하는데, 표준 웹 로그 형식의 로그 파일만으로는 완전히 구분할 수 없다. 사용자와 세션을 구분하기 위해서는 로컬캐시, 방화벽, ISP, 사용자 프라이버시, 쿠키 등과 같은 많은 문제들이 있지만, 이 문제를 해결하기 위한 명확한 방법은 아직 없다. 특히, 로컬캐시 문제는 웹 마이닝 시스템의 입력으로 사용되는 사용자 세션을 구분하는데 가장 어려운 문제이다 본 연구에서는 참조 로그와 에이전트 로그, 그리고 액세스 로그 둥의 서버측 클릭스트림 데이타만을 이용하여 로컬캐시 문제를 해결하고, 사용자 세션을 구분하고 세션을 보정하는 휴리스틱 방법을 제안한다.

클레멘타인 데이터마이닝 솔루션을 이용한 웹 로그 분석 (Analysis of Web Log Using Clementine Data Mining Solution)

  • 김재경;이건창;정남호;권순재;조윤호
    • 경영정보학연구
    • /
    • 제4권1호
    • /
    • pp.47-67
    • /
    • 2002
  • 1990년대 중반 이후 기업들은 인터넷상에서 사용자의 행동에 대한 관심이 높아짐에 따라, 인터넷상에서 사용자의 웹 사이트 클릭 정보가 남아 있는 웹 로그파일에 대한 관심 역시 높아지고 있다. 웹 로그파일에는 사용자 IP, 사용시간, 방문한 주소, 참조주소, 쿠키 파일 등 다양한 정보가 남기 때문에 이것을 이용하면 사용자의 웹 사이트 행위를 구체적으로 분석할 수 있다. 또한, 특정한 유형의 사용자와 관련된 웹 사이트를 찾아 효과적인 마케팅 전략을 수립할 수도 있다. 본 연구에서는 SPSS사의 데이터마이닝 도구인 클레멘타인을 이용하여 웹 마이닝을 할 수 있는 방법론을 소개하고, 실제 인터넷 허브 사이트의 로그화일을 대상으로 분석을 수행하였다.

가상상점에서 고객 행위 연관성 분석을 위한 데이터 마이닝 기법 (A Data Mining Technique for Customer Behavior Association Analysis in Cyber Shopping Malls)

  • 김종우;이병헌;이경미;한재룡;강태근;유관종
    • 한국전자거래학회지
    • /
    • 제4권1호
    • /
    • pp.21-36
    • /
    • 1999
  • Using user monitoring techniques on web, marketing decision makers in cyber shopping malls can gather customer behavior data as well as sales transaction data and customer profiles. In this paper, we present a marketing rule extraction technique for customer behavior analysis in cyber shopping malls, The technique is an application of market basket analysis which is a representative data mining technique for extracting association rules. The market basket analysis technique is applied on a customer behavior log table, which provide association rules about web pages in a cyber shopping mall. The extracted association rules can be used for mall layout design, product packaging, web page link design, and product recommendation. A prototype cyber shopping mall with customer monitoring features and a customer behavior analysis algorithm is implemented using Java Web Server, Servlet, JDBC(Java Database Connectivity), and relational database on windows NT.

  • PDF

다차원 연관 분석을 이용한 인터넷 이용자의 특징 분석 (Analysis of Internet User Features using Multi-dimensional Association Analysis)

  • 이수은;정용규
    • 서비스연구
    • /
    • 제1권1호
    • /
    • pp.61-69
    • /
    • 2011
  • 데이터 마이닝은 대용량의 데이터베이스로부터 기존에 알려지지 않은, 즉 단순한 질의어로 추출할 수 없는 형태의 '유용한' 정보를 찾아내고 이를 바탕으로 데이터에 대한 통찰(insight)을 얻는 것으로 정의할 수 있다. 본 논문에서는 웹에서 발생하거나 웹 사이트에 저장한 데이터를 대상으로 유용한 패턴을 찾아내기 위하여 인터넷을 이용하는 이용자의 특징을 분석하기 위해 시도되었다. 즉 인터넷 사용자에 대한 일반적인 통계 정보 데이터에 연관성 분석을 적용하여 인터넷 사용 시간에 영향을 미치는 인터넷 이용자의 특징을 분석하였다. 실험을 통하여 데이터로부터의 연관 규칙을 추출 해내었으며, 최적의 결과를 도출하기위한 데이터 전처리 및 알고리즘을 적용하여 웹 마이닝을 위한 인터넷 사용자의 특징을 분석한 결과 그 유용성을 확인할 수 있었다.

  • PDF

A Big Data Study on Viewers' Response and Success Factors in the D2C Era Focused on tvN's Web-real Variety 'SinSeoYuGi' and Naver TV Cast Programming

  • Oh, Sejong;Ahn, Sunghun;Byun, Jungmin
    • International Journal of Advanced Culture Technology
    • /
    • 제4권2호
    • /
    • pp.7-18
    • /
    • 2016
  • The first D2C-era web-real variety show in Korea was broadcast via tvN of CJ E&M. The web-real variety program 'SinSeoYuGi' accumulated 54 million views, along with 50 million views at the Chinese portal site QQ. This study carries out an analysis using text mining that extracts portal site blogs, twitter page views and associative terms. In addition, this study derives viewers' response by extracting key words with opinion mining techniques that divide positive words, neutral words and negative words through customer sentiment analysis. It is found that the success factors of the web-real variety were reduced in appearance fees and production cost, harmony between actual cast members and scenario characters, mobile TV programing, and pre-roll advertising. It is expected that web-real variety broadcasting will increase in value as web contents in the future, and be established as a new genre with the job of 'technical marketer' growing as well.

웹 마이닝과 의사결정나무 기법을 활용한 개인별 상품추천 방법 (A personalized recommendation methodology using web usage mining and decision tree induction)

  • 조윤호;김재경
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.342-351
    • /
    • 2002
  • A personalized product recommendation is an enabling mechanism to overcome information overload occurred when shopping in an Internet marketplace. Collaborative filtering has been known to be one of the most successful recommendation methods, but its application to e-commerce has exposed well-known limitations such as sparsity and scalability, which would lead to poor recommendations. This paper suggests a personalized recommendation methodology by which we are able to get further effectiveness and quality of recommendations when applied to an Internet shopping mall. The suggested methodology is based on a variety of data mining techniques such as web usage mining, decision tree induction, association rule mining and the product taxonomy. For the evaluation of the methodology, we implement a recommender system using intelligent agent and data warehousing technologies.

  • PDF

데이터마이닝을 기반으로 한 웹 전자상거래 서비스 설계 (Design of E-Commerce Service on The Web Based on Data Mining)

  • 천린;김철원
    • 한국전자통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.703-708
    • /
    • 2020
  • 전자상거래의 추진력은 점점 강해지고 있으며 전자 상거래 간의 경쟁은 더욱 치열 해지고 있다. 이러한 데이터를 효과적으로 분석하고 합리적으로 사용하는 방법은 다양한 전자상거래 회사의 경쟁에서 중요한 포인트가 되었다. 본 논문에서는 데이터 마이닝 기술을 사용하여 대규모 웹 데이터베이스에서 중복 데이터를 필터링하고 유용한 데이터를 추출한 다음 다양한 관점에서 분석하여 이 데이터를 전자 상거래 웹 사이트에 합리적이고 효과적으로 적용한다.

웹 사이트 이용 고객의 행동 정보를 기반으로 한 고객 선호지수 산출 방법 (Method for Preference Score Based on User Behavior)

  • 서동렬;김두진;윤정기;김재훈;문강식;오재훈
    • CRM연구
    • /
    • 제4권1호
    • /
    • pp.55-68
    • /
    • 2011
  • 최근 웹 서비스의 발달과 함께 웹 컨텐츠를 다양하게 활용함으로써, 사용자의 경험을 기반으로 한 개인화 분석이 주목 받고 있다. 기존의 개인화 분석은 주로 데이터베이스의 데이터를 활용한 규칙 및 통계 모형을 기준으로 수행되고 있다. 이에 시장조사 소요기간에 따른 적시성을 반영하는데 어려움이 있었으며, 데이터베이스 적재 데이터가 고객 행동에 대한 결과였기 때문에 고객의 이용 특성을 반영하는데 한계가 지적되어 왔다. 그러나, 최근 고객의 사이트 방문에서부터 방문을 종료할 때까지의 모든 행동을 추적하고 분석하여 개인화된 서비스를 제공하기 위한 많은 연구와 상용화된 기술 개발이 진행되었다. 본 연구에서는 온라인상에서의 고객 행동을 웹 로그 분석을 이용하여 분석함으로써 고객의 행동정보를 U-Score(Usage Score, 이용지수), P-Score(Preference Score, 선호지수), M-Score(Mania Score, 마니아지수) 등 다양한 고객 선호지수를 도출하였다. 이러한 고객의 선호지수를 통해 웹 컨텐츠에 대한 고객의 선호정보를 파악함으로써, 고객에 대한 심도 있는 리포팅과 고객관계관리가 가능하며 개인화 추천 서비스에 유용하게 사용할 수 있다.

  • PDF

상품간 연관 규칙의 효율적 탐색 방법에 관한 연구 : 인터넷 쇼핑몰을 중심으로 (A Fast Algorithm for Mining Association Rules in Web Log Data)

  • 오은정;오상봉
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.621-626
    • /
    • 2003
  • Mining association rules in web log files can be divided into two steps: 1) discovering frequent item sets in web data; 2) extracting association rules from the frequent item sets found in the previous step. This paper suggests an algorithm for finding frequent item sets efficiently The essence of the proposed algorithm is to transform transaction data files into matrix format. Our experimental results show that the suggested algorithm outperforms the Apriori algorithm, which is widely used to discover frequent item sets, in terms of scan frequency and execution time.

  • PDF