• 제목/요약/키워드: web usage pattern

검색결과 46건 처리시간 0.021초

점진적인 웹 마이닝을 위한 효율적인 후보패턴 저장 트리구조 및 알고리즘 (An Efficient Candidate Pattern Storage Tree Structure and Algorithm for Incremental Web Mining)

  • 강희성;박병준
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.3-5
    • /
    • 2006
  • Recent advances in the internet infrastructure have resulted in a large number of huge Web sites and portals worldwide. These Web sites are being visited by various types of users in many different ways. Among all the web page access sequences from different users, some of them occur so frequently that may need an attention from those who are interested. We call them frequent access patterns and access sequences that can be frequent the candidate patterns. Since these candidate patterns play an important role in the incremental Web mining, it is important to efficiently generate, add, delete, and search for them. This thesis presents a novel tree structure that can efficiently store the candidate patterns and a related set of algorithms for generating the tree structure adding new patterns, deleting unnecessary patterns, and searching for the needed ones. The proposed tree structure has a kind of the 3 dimensional link structure and its nodes are layered.

  • PDF

사용자 이용패턴을 이용한 모바일웹 컨텐츠 자동 생성에 관한 연구 (Mobile Web Automatic Generation using the Web users usage pattern)

  • 고희애;김종근;심근호;조미화;윤창익;임영환
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권4호
    • /
    • pp.583-590
    • /
    • 2008
  • 최근 가장 화두가 되고 있는 모바일 웹 풀브라우징 시대를 맞이하여 웹컨텐츠를 모바일 디바이스에 모두 디스플레이되는 것이 아니라 다양한 서비스를 사용자가 취사 선택하여 새롭게 만들 수 있는 플랫폼인 모바일 웹 저작툴을 제공한다. 이때 모바일웹을 저작하는 방식으로는 웹사용자 이용패턴을 이용하여 모바일 웹을 자동 생성하는 방법을 제시한다. 누구도 데이터를 소유하지 않고도, 이곳을 모든 사람이 사용할 수 있으며, 누구나 변경할 수 있는 데이터를 다양한 사용자가 새롭게 콘텐츠를 창조하여, 그 콘텐츠를 유통시키는 플랫폼으로 정착하는 모바일 웹 생성툴인 모빌더라고 하는 툴을 개발하여 모바일 웹 페이지를 구현한다. 구현하기에 앞서, 웹사용자가 웹페이지의 종류에 따라 다른 이용패턴을 보임을 이용하여 모바일 웹을 구현하여 보도록 한다. 웹페이지의 이용패턴을 분석하여 보고 이에 따라 모바일 웹을 자동생성하도록 하는 툴을 개발함으로서 Web 2.0의 시대에 맞는 플랫폼을 구현하고 서비스만 사용자가 취사 선택할 수 있도록 한다.

  • PDF

웹 로그에서의 Apriori 알고리즘 기반 사용자 액세스 패턴 발견 (User Access Patterns Discovery based on Apriori Algorithm under Web Logs)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.681-689
    • /
    • 2019
  • 웹 사용 패턴 발견은 웹 로그 데이터를 사용하는 고급 수단이며 웹 로그 데이터 마이닝에 데이터 마이닝 기술을 적용한 특정 응용이다. 교육 분야에서 데이터 마이닝 (DM)은 데이터 마이닝 기술을 교육 데이터 (대학의 웹 로그, e-러닝, 적응형 하이퍼미디어 및 지능형 튜터링시스템 등)에 적용한다. 따라서 교육 연구 문제를 해결하기 위해 이러한 유형의 데이터를 분석하는 것이 목표이다. 본 논문에서는 대학의 웹 로그 데이터가 데이터 마이닝의 연구 대상으로 사용되어 진다. 데이터베이스 OLAP 기술을 사용하여 웹 로그 데이터가 데이터 마이닝에 사용될 수 있는 데이터 형식으로 사전 처리되고 그 처리 결과가 MSSQL에 저장된다. 동시에 처리 된 웹 로그 레코드를 기반으로 기본 데이터 통계 및 분석이 완료된다. 또한 웹 사용 패턴 마이닝의 Apriori Algorithm 및 구현 프로세스를 소개하고 Python 개발 환경에서 Apriori Algorithm 프로그램을 개발했다. 그런 다음 Apriori Algorithm의 성능을 보이고 웹 사용자 액세스 패턴의 마이닝을 실현했다. 이 연구 결과는 교육 시스템 개발에 패턴을 적용하는데 중요한 이론적 의미를 갖는다. 다음 연구로는 분산 컴퓨팅 환경에서 Apriori Algorithm의 성능 향상을 연구하는 것이다.

웹사이트 구조와 사용패턴 분석을 통한 CSRF 공격 탐지 (Detecting CSRF through Analysis of Web Site Structure and Web Usage Patterns)

  • 최재영;이혁준;민병준
    • 융합보안논문지
    • /
    • 제11권6호
    • /
    • pp.9-15
    • /
    • 2011
  • CSRF(Cross Site Request Forgery)는 정상적인 자격을 부여받은 사용자의 요청을 변조하여 웹서버로 보내는 공격으로 정상적인 요청과 공격 요청을 구별하기 어렵다. CSRF 방지를 위해 비밀 토큰, 커스텀 헤더, 프록시, 정책 모델, CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart), 사용자 재인증 등이 연구되고 이용되고 있다. 그러나 무력화시킬 수 있는 공격 기법이 존재하며, CAPTCHA나 사용자 재인증의 남용은 웹사이트의 사용 편의성을 저하시킨다. 본 논문에서는 웹사이트의 구조와 웹사이트 사용 패턴을 분석하여 CSRF 공격을 탐지하는 방법을 제안한다. CSRF 공격 대상 후보를 선출하고 웹사이트 구조에 따른 패턴과 사이트 사용 로그를 분석한다. 정상적인 사용패턴을 추출하여, CSRF 공격을 탐지한다. 제안한 방법을 적용하여 CSRF 방지를 위해 정상 요청 시에도 사용자 개입을 요구하여 CAPTCHA를 입력하는 불편을 해소하고 이상 요청패턴을 탐지 시에만 사용자가 개입하도록 하여 CSRF를 방어하며 사용 편의성을 유지할 수 있음을 확인하였다.

웹 데이터에서의 사용자 탐색 패턴 발견 및 추천 (Discovery and Recommendation of User Search Patterns from Web Data)

  • 구흠모;양재영;홍광희;최중민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.287-296
    • /
    • 2002
  • 웹 사용 마이닝은 데이터마이닝을 바탕으로 사용자의 로그 파일 정보를 이용하여 웹이 이용되는 패턴을 발견한다. 이를 이용하여 웹을 개선하여 사용자들이 보다 빨리 원하는 내용을 검색할 수 있도록 할 수 있으며 시스템 관리자에게는 효율적인 웹 구조를 인한 정보를 제공할 수 있다. 웹 사용 마이닝에서 사용하는 데이터는 성형화되어 있지 않으며 웹 사용 패턴을 분석하는데 방해가 되는 잡음 데이터까지 포함하고 있다. 이것은 기존에 개발된 여러 데이터마이닝 기법을 적용하는데 어려움으로 작용한다. 이러한 어려움을 해결하기 위해 본 논문에서는 새로운 방법을 도입한 SPMiner을 .제안한다. SPMiner는 웹의 구조를 이용하여 로그 파일의 전처리 과정을 줄이며 사용자의 탐색 패턴 분석을 효율적으로 수행 할 수 있는 시스템이다. SPMiner는 WebTree 에이전트를 이용하여 웹 사이트 구조를 분석하여 WebTree를 생성하고 사용자 로그 파일을 분석하여 각 웹 페이지의 사용빈도에 대한 정보를 추출한다. WebTree와 로그 파일에서 추출된 웹 페이지에 대한 정보는 SPMiner에 의해 패턴을 분석할 퍼 이용될 수 있는 형태인 WebTree$^{+}$로 병합된다 WebTree$^{+}$는 패턴 발견을 쉽게 해주며 사용자에게 추천할 정보나 웹 페이지를 능동적으로 추천할 수 있게 만들어 준다.

  • PDF

웹 기반 미디어 콘텐츠를 위한 맞춤형 데이터 서비스 (Targeting Data Service for Web-Based Media Contents)

  • 박성주;정광수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권12호
    • /
    • pp.1154-1164
    • /
    • 2010
  • 타겟팅 서비스는 다양한 미디어 서비스 환경에서 사용자 프로파일, 선호도 및 사용 내역 등을 기반으로 사용자의 취향에 가장 적합한 서비스를 추천 및 제공함으로써, 서비스의 만족도와 이용량을 향상 시키는 주요한 응용서비스로서 주로 방송분야에서 연구되어 왔다. 타겟팅 서비스는 방송 콘렌츠에서 interstitial 콘텐츠로, 고정형 TV단말에서 모바일 단말로 서비스의 영역이 확대되고 있으며, 단순한 방송 데이터에서 광고 데이터, 쿠폰 및 관련 미디어 콘텐츠 정보 등으로 데이터의 종류가 다양해지고 있다. 본 논문에서는 사용자 정보를 기반으로 기사, 광고 및 방송정보에 대한 타겟팅 데이터 서비스를 설계, 구현하고자 한다. 이를 위해 웹 기반의 미디어 콘텐츠에 적용할 수 있도록 사용자 프로파일, 선호도 및 사용 내역 정보를 기존 TV-Anytime Forum의 사용자 메타데이터 및 OpenSocial의 사용자 정보를 기반으로 새롭게 정의하였다. 또한, 사용자 정보와 콘텐츠 정보간 유사도 및 사용 내역을 기반으로 사용자 선호도 정보 및 행동 패턴 정보를 생성하여 타겟팅 데이터 서비스를 구현하였다. 성능평가를 통해서 제안하는 타겟팅 데이터 서비스 기술이 기존의 방송 서비스뿐만 아니라, 웹 기반의 미디어 콘텐츠에서도 적용 가능 하다는 것을 확인하였다.

Web1.0과 프로슈밍기반 Web2.0 서비스 가치생태계 비교 (Value Ecosystems of Web Services : Benefits and Costs of Web as a Prosuming Service Platform)

  • 김도훈
    • 한국경영과학회지
    • /
    • 제36권4호
    • /
    • pp.43-61
    • /
    • 2011
  • We first develop a value ecosystem framework to model the SDP(Service Delivery Process) of web services. Since the web service has been evolving from the basic web architecture (e.g., traditional world wide web) to a prosuming platform based on virtualization technologies, the proposed framework of the value ecosystem focuses on capturing the key characteristics of SDP in each type of web services. Even though they share the basic elements such as PP(Platform Provider), CA(Customization Agency) and user group, the SDP in the traditional web services (so-called Web1.0 in this paper) is quite different from the most recent one (so-called Web2.0). In our value ecosystem, users are uniformly distributed over (0, ${\Delta}$), where ${\Delta}$��represents the variety level of users' preference on the web service level. PP and CA provide a standard level of web service(s) and prosuming service package, respectively. CA in Web1.0 presents a standard customization package($s_a$) at flat rate c, whereas PP and CA collaborate and provide customization service with a usage-based scheme. We employ a multi-stage game model to analyze and compare the SDPs in Web1.0 and Web2.0. Our findings through analysis and numerical simulations are as follows. First, the user group is consecutively segmented, and the pattern of the segmentations varies across Web1.0 and Web2.0. The standardized service level s (from PP) is higher in Web1.0, whereas the amount of information created in the value ecosystem is bigger in Web2.0. This indicates the role of CA would be increasingly critical in Web2.0: in particular, for fulfilling the needs of prosuming and service customization.

협력적 북마킹의 태킹 행태 분석 (Analysis of the usage Pattern of Tagging in Collaborative Bookmarking)

  • 최준연;김용수
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.193-201
    • /
    • 2009
  • 웹문서의 특성을 표현하기 위해 키워드 형태로 부여하는 태깅의 이용이 다양한 웹서비스에서 확산되고 있다. 온라인 즐겨찾기 서비스라고 말할 수 있는 협력적 북마킹 서비스에서도 태깅이 중요한 역할을 수행하는데, 사용자가 부여한 태그는 자신의 북마크를 손쉽게 검색하고 타사용자의 웹문서 검색을 정교하게 만들어준다. 본 연구에서는 사용자들의 태깅 데이터를 분석하여 웹문서와 사용자의 태그 수에 영향을 주는 요인이 무엇인가를 탐색하였다. 웹문서의 태그 수에는 웹문서의 특성보다 사용자의 특성에 따라 더 큰 편차를 보였으며, 이것은 사용자의 성향이 태그의 다양성에 더 큰 영향을 미친다는 것을 의미한다. 또한 추종적 사용자보다는 가장 먼저 웹문서를 북마킹하는 선도적 사용자들이 더 많은 태그를 생성하는데 기여하는 것으로 나타났다. 풍부하고 다양한 태깅을 통해 서비스의 품질을 향상시키기 위해서는 선도적 사용자들에 대한 보상과 인센티브를 통해 더 많은 지식을 생성할 수 있도록 해야 한다는 시사점을 제공한다.

웹 사용 데이타와 하이퍼링크 구조를 통합한 웹 네비게이션 마이닝 (Web Navigation Mining by Integrating Web Usage Data and Hyperlink Structures)

  • 구흠모;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.416-427
    • /
    • 2005
  • 웹 네비게이션 마이닝은 웹 접근 로그 데이타를 분석하여 웹을 항해하는 패턴을 발견하는 기법이다. 하지만 사용자들은 웹을 항해할 때 정상적인 계층적 경로를 따르지 않는 경우가 많기 때문에 웹 접근 로그 데이타에는 웹 항해 패턴 발견에 장애가 되는 잡음 정보가 많이 포함된다. 결과적으로 웹 접근 로그 데이타만을 이용한 기존의 웹 네비게이션 마이닝은 이런 잡음을 해결하기 위한 전처리 과정의 복잡성 등으로 인하여 웹 항해 패턴을 효율적으로 발견하는 데 좋은 성능을 보여주지 못했다. 이런 문제를 해결하기 위해 본 논문에서는 웹 접근 로그 데이타 외에 웹의 하이퍼링크 구조 정보를 함께 이용하여 웹 네비게이션 패턴을 효율적으로 발견하는 기법을 제시하였다. 웹 사이트의 계층적인 하이퍼링크 구조로부터 생성된 WebTree라 불리는 구조를 이용하여 웹 접근 로그 데이타에 포함된 비정상적인 경로에 대한 잡음을 효율적으로 제거하였다. 이 기법을 이용해 구현된 SPMiner(Sequence Pattern Miner) 시스템은 로그 데이타와 하이퍼링크 계층구조를 함께 이용함으로써 전처리의 오버헤드를 현저히 감소시켰고 결과적으로 효율적으로 네비게이션 패턴을 찾아주고 이를 추천에 이용할 수 있는 기반을 제시하였다.

사회 네트워크 분석에 기반한 도서관 학술DB 이용 패턴 연구: K대학도서관 학술DB 이용 사례 (A Usage Pattern Analysis of the Academic Database Using Social Network Analysis in K University Library)

  • 최일영;이용성;김재경
    • 정보관리학회지
    • /
    • 제27권1호
    • /
    • pp.25-40
    • /
    • 2010
  • 본 연구는 사회 네트워크 분석 기법을 통하여 K대학도서관의 학술DB 이용현황을 분석하고 이용자의 요구에 적합한 서비스를 개발 및 제공하고자 하는데 그 목적을 두고 있다. 이를 위하여 K대학 도서관의 학술DB 로그 데이터를 이용하여 학문분야별, 신분별, 학문분야 및 신분별 학술DB 네트워크를 구성하고 실증 분석하였다. 본 연구의 결과, 전임교원의 학술DB 네트워크와 박사과정의 학술DB 네트워크는 특화된 학술DB를 중심으로 강한 결속력을 보이고 있으며 다른 신분의 학술DB 네트워크보다 밀도, 연결정도 집중도 및 연결정도 중심성이 높게 나타났다.