• 제목/요약/키워드: pattern discovery

검색결과 149건 처리시간 0.022초

웹 사용 정보 마이닝 기반의 동적 사용자 프로파일 생성 (Generator of Dynamic User Profiles Based on Web Usage Mining)

  • 안계순;고세진;정준;이필규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.389-390
    • /
    • 2002
  • 동적 웹 컨텐츠 제공에서 고객을 위한 추천서비스에 이르는 인터넷 기반의 전자상거래 애플리케이션에서는 고객이 어떤 성향을 가지고 있는가에 대한 정보를 획득하는 것이 중요하다. 웹 개인화의 대표적인 기술인 협력적 석과는 사용자의 정보를 정적인 프로파일 형태로 저장하여 사용자의 성향 변화를 빨리 획득할 수 없다. 또한 사용자의 명시적 평가 의존성, 확장성 부족, 다차원 공간 데이터에 대한 적용 어려움 둥의 문제점을 가지고 있다. 이와 같은 단점을 해결하기 위한 해결 방안으로 웹 사용 정보 마이닝(web usage mining)이 쓰이고 있다. 웹 사용 정보 마이닝은 서버에 축적된 웹 사용 데이터(web usage data)를 이용하여 패턴을 발견하는 기술이다. 특히 연관 규칙 생성 알고리즘으로 웹 사용 패턴(web usage pattern)을 찾고 패턴을 클러스터링하는 기술이 사용되고 있다. 그러나 연관 규칙 생성 알고리즘은 많은 수의 패턴들을 찾고 또 유용하지 못한 패턴을 발견하는 단점이 있다. 본 논문에서는 검증된 웹 사용 패턴을 이용한 동적 사용자 프로파일 생성 방법을 제안한다. 먼저 패턴 발견을 위해 연관 규칙 생성 알고리즘인 Apriori를 이용하고 사용자 프로파일을 위한 클러스터를 생성하기 위해 ARHP를 채택하였다. 클러스터를 생성하기 전에 Dempster-Shafer 이론을 이용하여 유용하지 못한 패턴을 제거하는 패턴 검증 과정을 수행한다. 검증된 패턴을 이용하여 클러스터를 생성하고 사용자의 현재 활성화된 세션에 따라 동적으로 사용자 프로파일이 생성된다

웹 개인화를 위한 웹사용자 클러스터링 알고리즘에 관한 연구 (A Study on Web-User Clustering Algorithm for Web Personalization)

  • 이해각
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2375-2382
    • /
    • 2011
  • 웹사이트 운영이 비즈니스 모델로서의 성공을 거두기 위한 가장 중요한 요소 중 하나는 웹사용자의 성향을 분석하여 이를 효율적으로 이용하는 것이다. 사용자 분석을 통하여 사용자들에게 웹사이트의 가치를 효율적으로 전달하고 이를 통하여 운영자는 충분한 수익을 거둘 수 있다. 이러한 점에서 웹 사이트를 이용하는 사용자들의 취향과 행동방식을 얻어내려는 웹 방문 패턴 발견으로써의 사용자 클러스터링은 매우 중요하다. 또한 얻어진 사용자의 클러스터링 정보는 웹 개인화나 웹 사이트를 재구성하는데 필수적이다. 본 논문에서는 사용자 웹 방문 데이터를 정제하고 분류하여 그 특성에 따라 사용자들을 몇 개의 그룹으로 클러스터링 하기 위한 알고리즘이 제안된다. 알고리즘은 2단계로 구성되는데 첫 번째 단계는 초기해를 구하는 단계로서, 패스의 사이각을 이용하여 유사도를 측정하고 이 유사도에 따라 K개의 사용자 그룹으로 분류하여 초기해를 구한다. 두번째 단계는 첫 번째 단계에서 구한 초기해를 개선하여 최적해를 찾는 과정으로서 하이퍼플레인을 이용하여 클러스터링하는 개량된 K-평균알고리즘을 제안한다. 또한 실험을 통하여 기존의 방법과 비교하여 제안된 알고리즘의 효율성과 패스 특성이 보다 정확하게 계산된 클러스터링이 구현됨을 확인할 수 있다.

Discovery of Urinary Biomarkers in Patients with Breast Cancer Based on Metabolomics

  • Lee, Jeongae;Woo, Han Min;Kong, Gu;Nam, Seok Jin;Chung, Bong Chul
    • Mass Spectrometry Letters
    • /
    • 제4권4호
    • /
    • pp.59-66
    • /
    • 2013
  • A metabolomics study was conducted to identify urinary biomarkers for breast cancer, using gas chromatography-mass spectrometry (GC-MS) and liquid chromatography-mass spectrometry (LC-MS), analyzed by principal components analysis (PCA) as well as a partial least squares-discriminant analysis (PLS-DA) for a metabolic pattern analysis. To find potential biomarkers, urine samples were collected from before- and after-mastectomy of breast cancer patients and healthy controls. Androgens, corticoids, estrogens, nucleosides, and polyols were quantitatively measured and urinary metabolic profiles were constructed through PCA and PLS-DA. The possible biomarkers were discriminated from quantified targeted metabolites with a metabolic pattern analysis and subsequent screening. We identified two biomarkers for breast cancer in urine, ${\beta}$-cortol and 5-methyl-2-deoxycytidine, which were categorized at significant levels in a student t-test (p-value < 0.05). The concentrations of these metabolites in breast cancer patients significantly increased relative to those of controls and patients after mastectomy. Biomarkers identified in this study were highly related to metabolites causing oxidative DNA damage in the endogenous metabolism. These biomarkers are not only useful for diagnostics and patient stratification but can be mapped on a biochemical chart to identify the corresponding enzyme for target identification via metabolomics.

데이터 스트림에서 가중치 지지도 기반 빈발 패턴 추출 방법 (An Efficient Method for Mining Frequent Patterns based on Weighted Support over Data Streams)

  • 김영희;김원영;김응모
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1998-2004
    • /
    • 2009
  • 다양한 저장 장치의 발달과 네트워크의 발전은 대용량의 데이터를 연속적으로 빠르게 생성한다. 데이터 스트림에서의 데이터 마이닝은 처리 시간 및 메모리 사용에 제한적이다. 또한 생성된 데이터를 한 번의 스캔으로 유용한 패턴을 발견할 수 있어야 하고 정보 변화 가능성이 큰 데이터 속성을 갖는 경우 최근의 정보를 반영한 빠른 분석이 가능해야 한다. 기존의 지지도 기반 마이닝 방법들은 일정 기간 동안 미리 정의된 지지도 이상의 빈발 항목에 대하여만 고려하므로 중요도가 높은 항목들을 간과하는 문제점을 가지고 있다. 본 논문에서는 시간의 변화에 따른 가변성을 고려하여 가중치 지지도를 갖는 데이터 항목들에 대하여 보다 의미 있는 정보를 제공하기 위한 효율적인 빈발패턴 추출 방법을 제안하고자 한다. 제안된 WSFI-Mine(Weighted Support Frequent Itemsets Mine) 방법은 DCT(Data Stream Closed Pattern Tree) 데이터 구조를 이용하여 패쇄 빈발 항목을 탐사한다. 제안된 알고리즘은 DSM-FI와 THUI-Mine 알고리즘과 지지도 변화에 따른 성능을 비교하였고 그 결과 비교 알고리즘 보다 수행 시간이 우수함을 보였고, 빈발 항목을 생성하는 후보 항목의 수를 줄이므로 메모리 사용량을 효율적으로 사용할 수 있음을 보였다.

사용자 행동 패턴 선호도 학습을 위한 퍼지 귀납 학습 시스템 (Fuzzy Inductive Learning System for Learning Preference of the User's Behavior Pattern)

  • 이형욱;김용휘;박광현;김용수;정진우;조준면;김민경;변증남
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.175-178
    • /
    • 2005
  • 스마트 홈과 같은 유비쿼터스 환경은 다양한 센서 및 제어 네트워크가 밀집되어 있는 복잡한 시스템이다. 본 논문에서는 이러한 환경하에서 복잡한 인터페이스의 사용에 대한 사용자의 인지 부담(cognitive load)를 줄이고 개인화된(personalized) 서비스를 자율적으로 제공하기 위한 사용자 행동 패턴 선호도 학습 기법을 제안한다. 이를 위해 지식 발견(Knowledge Discovery)을 위한 평생 학습(life-long learning)의 관점에서 퍼지 귀납(Fuzzy Inductive)학습 방법론을 제안하며, 이것은 수치 데이터로부터 입력 공간에 대한 효율적인 퍼지 분할(fuzzy partition)을 얻어내고 일관성있는(consisitent) 퍼지 상관 룰(fuzzy association rule)을 얻어내도록 한다.

  • PDF

유비쿼터스 컴퓨팅에서 컨텍스트 패턴을 이용한 프로액티브 검색 기법 (Proactive Retrieval Method Using Context Patterns in Ubiquitous Computing)

  • 김성림;권준희
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1017-1024
    • /
    • 2004
  • 유비쿼터스 시스템은 컨텍스트에 프로액티브하게 반응할 수 있는 지능적인 환경과 시스템이 필요하다. 본 논문은 컨텍스트 패턴을 이용한 프로액티브 검색 기법을 제안한다. 사용자의 컨텍스트 값이 변경될 때마다 그에 맞는 새로운 정보가 프로액티브하게 사용자에게 전송된다. 프로액티브 검색을 위해 데이터마이닝 기법 중에서 순차 패턴 기법과 연관 규칙 기법을 이용하여 컨텍스트 패턴을 추출하고, 추출된 패턴을 사용하여 가까운 미래에 사용하게 될 정보만을 저장함으로써 유비쿼터스 컴퓨팅에서 많이 사용되는 모바일 장치에서의 저장 공간의 제약과 데이터 전송 속도의 제약을 극복한다. 제안한 기법에 관한 알고리즘을 제시하고, 이에 대한 예를 보이고, 본 논문에서 제안하는 기법의 효율성을 몇 가지 실험을 통하여 평가한다.

  • PDF

스트림 데이터에서 회귀분석에 기반한 빈발항목 예측 (Frequent Items Mining based on Regression Model in Data Streams)

  • 이욱현
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.147-158
    • /
    • 2009
  • 최근 스트림데이터 환경의 데이터 모델은 데이터의 양이 아주 크고 연속적이며 무한하다. 이에 반해 제한된 용량의 디스크나 메모리 등을 이용해서 질의 처리나 데이터 분석을 처리한다. 이러한 환경에서 트랜잭션 데이터베이스에 대한 전통적인 빈발패턴탐사는 불가능하다고 할 수 있다. 왜냐하면, 연속적으로 들어오는 스트림 데이터에 대해 어떤 항목집합이 빈발항목인지 아닌지에 대한 정보를 계속적으로 유지 관리하기가 어렵기 때문이다. 본 논문에서는 연속적으로 들어오는 스트림 데이터에 회귀모델을 적용하여 빈발 항목들을 예측할 수 있는 방법을 제안한다. 스트림 데이터로부터 회귀모델을 생성함으로써 불확실한 항목들에 대한 예측 모델로 사용할 수 있다. 다양한 실험을 통하여 제안하는 방법이 스트림 데이터 환경의 데이터에 효율적으로 사용될 수 있음을 보인다.

Structural Change in Transmembrane Region of Syndecan-4 by Mutation

  • Choi, Sung-Sub;Kim, Ji-Sun;Jeong, Ji-Ho;Kim, Yongae
    • 한국자기공명학회논문지
    • /
    • 제20권4호
    • /
    • pp.129-137
    • /
    • 2016
  • Transmembrane(TM) proteins are closely related to transport, channel formation, signaling, cell to cell interaction, so they are the crucial target of modern medicinal drugs. In order to study the structure and function of these TM proteins, it is important to prepare reasonable amounts of proteins. However, their preparation is seriously difficult and time-consuming due to insufficient yields and low solubility of TM proteins. We tried to produce large amounts of Syndecan-4 containing TM domain(SDC4-TM) that is related to the wound healing and tumor. Also, mutated SDC4-TM was studied to investigate structural change by modification of dimerization motif. We performed the structure determination by the Polarity Index at Slanted Angle (PISA) wheel pattern analysis based on $^{15}N-^1H$ 2D SAMPI-4 solid-state NMR of SDC4-TM and computational modeling using Discovery Studio 2016.

The Influence of Learning Styles on a Model of IoT-based Inclusive Education and Its Architecture

  • Sayassatov, Dulan;Cho, Namjae
    • Journal of Information Technology Applications and Management
    • /
    • 제26권5호
    • /
    • pp.27-39
    • /
    • 2019
  • The Internet of Things (IoT) is a new paradigm that is revolutionizing computing. It is intended that all objects around us will be connected to the network, providing "anytime, anywhere" access to information. This study introduces IoT with Kolb's learning style in order to enhance the learning experience especially for inclusive education for primary and secondary schools where delivery of knowledge is not limited to physical, cognitive disabilities, human diversity with respect to ability, language, culture, gender, age and of other forms of human differences. The article also emphasizes the role of learning style as a discovery process that incorporates the characteristics of problem solving and learning. Kolb's Learning Style was chosen as it is widely used in research and in practical information systems applications. A consistent pattern of finding emerges by using a combination of Kolb's learning style and internet of things where specific individual differences, learning approach differences and IoT application differences are taken as a main research framework. Further several suggestions were made by using this combination to IoT architecture and smart environment of internet of things. Based on these suggestions, future research directions are proposed.

A Campus Community-based Mobility Model for Routing in Opportunistic Networks

  • Pan, Daru;Fu, Min;Sun, Jiajia;Zou, Xin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1034-1051
    • /
    • 2016
  • Mobility models are invaluable for determining the performance of routing protocols in opportunistic networks. The movement of nodes has a significant influence on the topological structure and data transmission in networks. In this paper, we propose a new mobility model called the campus-based community mobility model (CBCNM) that closely reflects the daily life pattern of students on a real campus. Consequent on a discovery that the pause time of nodes in their community follows a power law distribution, instead of a classical exponential distribution, we abstract the semi-Markov model from the movement of the campus nodes and analyze its rationality. Then, using the semi-Markov algorithm to switch the movement of the nodes between communities, we infer the steady-state probability of node distribution at random time points. We verified the proposed CBCNM via numerical simulations and compared all the parameters with real data in several aspects, including the nodes' contact and inter-contact times. The results obtained indicate that the CBCNM is highly adaptive to an actual campus scenario. Further, the model is shown to have better data transmission network performance than conventional models under various routing strategies.