• 제목/요약/키워드: web usage

검색결과 560건 처리시간 0.025초

웹 사용 마이닝에서의 데이터 수집 전략과 그 응용에 관한 연구 (Research on Data Acquisition Strategy and Its Application in Web Usage Mining)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.231-241
    • /
    • 2019
  • 웹 사용 마이닝 (WUM)은 웹 마이닝과 데이터 마이닝 기술의 응용 중의 하나다. 웹 마이닝 기술은 사용자가 웹 사이트에 액세스 할 때 웹 사용자가 생성 한 웹 서버 로그 데이터를 사용하여 사용자의 액세스 패턴을 식별하고 분석하는데 사용된다. 따라서 우선 데이터 마이닝 기술을 적용하여 웹 로그에서 사용자 액세스 패턴을 발견하기 전에 합리적인 방법으로 데이터를 수집해야 한다. 데이터 수집의 중요한 일은 사용자의 웹 사이트 방문 과정에서 사용자의 자세한 클릭 동작을 효율적으로 얻는 것이다. 이 논문은 주로 데이터 수집 전략 및 필드 추출 알고리즘과 같은 웹 사용 마이닝 데이터 프로세스의 첫 단계 이전의 데이터 수집 단계에 중점을 둔다. 필드 추출 알고리즘은 로그 파일에서 필드를 분리하는 프로세스를 수행하며 대용량의 사용자 데이터에 대한 실제 응용에도 사용된다.

모바일 애플리케이션 전략: 모바일 쇼핑 앱 사용 효과 실증 연구 (A Mobile App Strategy: An Empirical Study on the Effect of the Mobile Shopping App Usage)

  • 최진선;김승현
    • 지식경영연구
    • /
    • 제20권4호
    • /
    • pp.169-183
    • /
    • 2019
  • The growth of mobile commerce (m-commerce) has been accelerated around the world. Why do e-retailers have to put a great deal of effort for the distribution of their mobile apps? The literature has paid little attention to the influence of the introduction of an e-commerce app on shopping behaviors of consumers. By analyzing the dataset of 2,342 users in Korea, this study aims to broaden our understanding of mobile shopping app usage across competing e-retailers and different channels. We found that a user's prior usage of a specific e-commerce mobile app increases her subsequent usage of its website through a mobile web browser. Thus, mobile apps do not cannibalize the mobile web channel, and there could be a complementary relationship. We also found that a user's usage of competitors' apps is positively associated with her subsequent usage of a specific e-commerce app. Because many consumers search products and compare prices across multiple e-retailers, having a mobile app helps an e-retailer be exposed to more potential consumers. This study is among the first to study the role of mobile apps in e-commerce by showing the dynamics of cross-channel and cross-vendor usage by a user.

웹 게시판에서 비속어사용실태와 문제 해결 방안의 제시 (Usage Analysis of Swearing Words on Web Board and Proposal of Problems Resolution Method)

  • 조동욱
    • 한국콘텐츠학회논문지
    • /
    • 제3권4호
    • /
    • pp.1-10
    • /
    • 2003
  • 최근 인터넷상의 웹 자유게시판에 쓰여지는 글들이 비속어를 많이 사용함으로써 인터넷 역기능의 대표적인 문제로 대두되고 있다. 이를 위해 본 연구에서는 웹 게시판에서 사용되는 비속어에 대한 실태 파악을 통해 비속어가 쓰여진 단어나 문장을 기술적으로 차단하는 방법론을 개발하고자 한다. 이는 크게 세 단계로 나누어 개발이 진행된다. 첫째가 비속어 사용 실태 및 이를 차단키 위한 알고리즘의 개발, 둘째가 비속어의 정도 차이를 파악키 위한 구체적이고 방대한 설문조사의 수행, 셋째가 이를 프로그램하여 실제 웹 상에서 비속어가 어느 정도 효과적으로 차단이 가능한지에 대한 시스템 구현 등으로 나누어진다. 본 논문은 이 같은 전체 시스템 중 첫째 단계인 웹 게시판에서의 비속어 사용 실태와 이를 해결키 위한 알고리즘 개발 부분에 대해 다루고자 한다.

  • PDF

A Clustering Algorithm Considering Structural Relationships of Web Contents

  • Kang Hyuncheol;Han Sang-Tae;Sun Young-Su
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.191-197
    • /
    • 2005
  • Application of data mining techniques to the world wide web, referred to as web mining, has been the focus of several recent researches. With the explosive growth of information sources available on the world wide web, it has become increasingly necessary to track and analyze their usage patterns. In this study, we introduce a process of pre-processing and cluster analysis on web log data and suggest a distance measure considering the structural relationships between web contents. Also, we illustrate some real examples of cluster analysis for web log data and look into practical application of web usage mining for eCRM.

지속 사용 행동이 실 사용량에 끼치는 영향: 모바일 웹을 중심으로 (The Impact of Continued Behavior on Real Usage: Focusing on Mobile Web)

  • 최훈;유성열
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.27-38
    • /
    • 2008
  • 정보 기술의 급격한 발달로 인해 다양한 상품과 서비스가 출시되고 있다. 하지만 지속적으로 사용을 계속하는 상품이나 서비스는 많지 않은 것이 현실이다. 새로운 사용자를 유치하는 것보다 기존 사용자를 지속시키는 것은 기업의 효율적인 측면에서 매우 중요하다. 하지만, 기존의 정보 기술과 관련한 연구들은 새로운 사용자를 유치하는데 초점이 맞추어져 왔다. 따라서 기존 사용자를 지속적으로 유지하기 위한 연구는 매우 미미한 실정이다. 본 연구에서는 모바일 웹 사용자를 대상으로 모바일 웹의 지속적 사용을 위한 지속 사용 모델을 개발하였고, 이러한 지속 사용 행동이 실제 사용량에 어떠한 영향을 끼쳤는지 파악하고자 하였다. 이를 위해 모바일 웹의 지속적 사용에 중요한 영향을 끼치는 요인을 발굴하였고, 이를 실증적으로 검증하고자 하였다. 연구 결과, 사후 기대인 사후 유용성, 사후 사용 편의성, 사후 즐거움, 사후 지각된 가치가 사용자의 만족, 사용 지속의도에 유의하게 영향을 끼쳤으며, 사용자의 사용지속의도 역시 모바일 웹의 실 사용량에 유의하게 영향을 끼쳤다. 본 연구 결과와 더불어, 만족과 사용 지속의도에 중요하게 끼치는 영향은 서로 다르게 나타나 만족과 사용 지속의도를 높이는 전략이 서로 다르게 해야 함을 시사하고 있다. 마지막으로 본 연구는 연구의 한계점과 실증적 시사점에 대하여 제시하고 있다.

러프 셋 이론을 이용한 시퀀스 데이터의 클러스터링 알고리즘 (A Clustering Algorithm for Sequence Data Using Rough Set Theory)

  • 오승준;박찬웅
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.113-119
    • /
    • 2008
  • 월드 와이드 웹에는 거대한 양의 하이퍼링크들과 웹 사용 정보들을 포함하고 있는 동적인 페이지들이 모여 있다. 이러한 구조화되어 있지 않은 웹 데이터들과 온라인 정보들의 폭발적인 증가로 인해 효율적인 웹 데이터 마이닝 툴이 필요로 하게 되었다. 최근에는 웹 사용자들의 특성을 자동적으로 발견하기 위한 Web usage mining 분야에서 많은 연구가 진행되고 있다. 본 연구에서는 웹 사용자들의 방문 기록, 단백질 시퀀스, 소매점 거래 데이터 등과 같은 시퀀스 데이터를 분석하는 방법에 대하여 연구한다. 러프 셋 이론을 이용하여 시퀀스 데이터들을 클러스터링 하는 방법을 제안하고, 간단한 예제를 통하여 제안하는 절차를 소개하고 splice 데이터셋과 합성 데이터셋을 통한 실험 결과를 제시한다.

  • PDF

웹 마이닝을 위한 입력 데이타의 전처리과정에서 사용자구분과 세션보정 (User Identification and Session completion in Input Data Preprocessing for Web Mining)

  • 최영환;이상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.843-849
    • /
    • 2003
  • 웹 이용 마이닝은 거대한 웹 로그들을 이용하여 웹 사용자의 이용 패턴을 분석하는 데이타 마이닝 기술이다. 이러한 웹 이용 마이닝 기술을 사용하기 위해서는 전처리 과정 중의 사용자와 세션을 정확하게 구분해야 하는데, 표준 웹 로그 형식의 로그 파일만으로는 완전히 구분할 수 없다. 사용자와 세션을 구분하기 위해서는 로컬캐시, 방화벽, ISP, 사용자 프라이버시, 쿠키 등과 같은 많은 문제들이 있지만, 이 문제를 해결하기 위한 명확한 방법은 아직 없다. 특히, 로컬캐시 문제는 웹 마이닝 시스템의 입력으로 사용되는 사용자 세션을 구분하는데 가장 어려운 문제이다 본 연구에서는 참조 로그와 에이전트 로그, 그리고 액세스 로그 둥의 서버측 클릭스트림 데이타만을 이용하여 로컬캐시 문제를 해결하고, 사용자 세션을 구분하고 세션을 보정하는 휴리스틱 방법을 제안한다.

웹 이용자의 접속 정보 분석을 통한 웹 활용 그래프의 구성 및 분석 (An analysis on the web usage pattern graph using web users' access information)

  • 김후곤
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2005년도 추계학술대회 및 정기총회
    • /
    • pp.422-440
    • /
    • 2005
  • There are many kinds of research on web graph, most of them are focus on the hyperlinked structure of the web graph. Well known results on the web graph are rich-get-richer phenomenon, small-world phenomenon, scale-free network, etc. In this paper, we define a new directed web graph, so called the Web Usage Pattern Graph (WUPG), that nodes represent web sites and arcs between nodes represent a movement between two sites by users' browsing behavior. The data to constructing the WUPG, approximately 56,000 records, are gathered in the Kyungsung University. The results analysing the data summarized as follows: (i) extremely rich-get-richer phenomenon (ii) average path length between sites is significantly less than the previous one (iii) less external hyperlinks, more internal hyperlinks

  • PDF

Extraction of ObjectProperty-UsageMethod Relation from Web Documents

  • Pechsiri, Chaveevan;Phainoun, Sumran;Piriyakul, Rapeepun
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1103-1125
    • /
    • 2017
  • This paper aims to extract an ObjectProperty-UsageMethod relation, in particular the HerbalMedicinalProperty-UsageMethod relation of the herb-plant object, as a semantic relation between two related sets, a herbal-medicinal-property concept set and a usage-method concept set from several web documents. This HerbalMedicinalProperty-UsageMethod relation benefits people by providing an alternative treatment/solution knowledge to health problems. The research includes three main problems: how to determine EDU (where EDU is an elementary discourse unit or a simple sentence/clause) with a medicinal-property/usage-method concept; how to determine the usage-method boundary; and how to determine the HerbalMedicinalProperty-UsageMethod relation between the two related sets. We propose using N-Word-Co on the verb phrase with the medicinal-property/usage-method concept to solve the first and second problems where the N-Word-Co size is determined by the learning of maximum entropy, support vector machine, and naïve Bayes. We also apply naïve Bayes to solve the third problem of determining the HerbalMedicinalProperty-UsageMethod relation with N-Word-Co elements as features. The research results can provide high precision in the HerbalMedicinalProperty-UsageMethod relation extraction.

사용자 웹 로그를 이용한 적응형 웹 검색 (Adaptive Web Search based on User Web Log)

  • 윤태복;이지형
    • 한국산학기술학회논문지
    • /
    • 제15권11호
    • /
    • pp.6856-6862
    • /
    • 2014
  • 웹 사용 마이닝은 웹 사용자의 로그 정보를 기반으로 의미 있는 패턴을 추출하는 방법이다. 하지만 기존의 웹 사용 마이닝을 이용한 패턴 추출에는 사용자들의 다양한 성향을 고려하지 않은 개별적인 모델을 생성하는데 주를 이루고 있다. 웹에서 사용된 사용자들의 검색 키워드는 그들의 검색 의도나 배경지식에 따라 다양한 의미를 가질 수 있고, 그런 개개인의 검색의도에 맞는 검색 서비스가 제공할 수 있는 기술이 요구된다. 본 논문은 사용자 검색 키워드에 대한 웹 페이지 사용 행위 정보 및 방문한 웹 페이지 리스트를 수집하고 분석하여 웹 사용자의 패턴을 추출한다. 웹 사용자 패턴은 사용자들의 검색 키워드에 대해 가질 수 있는 다양한 검색 의도에 따른 방문 웹 페이지 연결망을 생성한다. 또한, 웹 사용자 패턴은 웹 페이지 추천을 위하여 유용하게 사용할 수 있으며, 실험을 통하여 제안하는 방법의 유효함을 확인하였다.