• Title/Summary/Keyword: 패턴 발견

검색결과 587건 처리시간 0.027초

FP-Tree를 기반으로 한 웹 사용 패턴에 대한 순차적 연관성 탐색 기법 . (A Sequential Association Rules Searching Methods for Web-Usage Patterns Based On Frequent-Pattern Tree)

  • 김영희;강우준;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.25-27
    • /
    • 2004
  • 대용량 웹 데이터베이스로부터 필요한 관련 정보를 탐색하고, 다양한 형태의 정보로부터 지식을 창출하는 일은 매우 어려운 일이다. 본 논문은 복잡하고 다양한 형태의 패턴이 존재하고, 연속된 입력을 갖는 웹 데이터베이스에서 발생되는 빈발 패턴들을 효과적으로 저장할 수 있는 FP-Tree를 기반으로 하여 변화된 정보들을 능동적으로 유지하고 새로운 정보들에 U해 FP-Tree를 재구성하여 웹 페이지에 대한 유용한 패턴 정보와 사용자의 웹 사용 패턴 분석을 용이하게 한다. 그 결과 새로이 발견된 웹 사용 패턴들을 통해 웹 페이지의 구조적 정보와 구조적 연판 정보를 효과적으로 얻을 수 있다.

  • PDF

생의학 학술 문헌의 불확실성 기반 지식 동향 분석에 관한 연구 (Knowledge Trend Analysis of Uncertainty in Biomedical Scientific Literature)

  • 허고은;송민
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.175-199
    • /
    • 2019
  • 불확실성이란 정보의 합의나 현존하는 지식 부족으로 인해 명제의 지식이 불완전한 상태를 의미한다. 과학적 지식의 불확실성을 연구하는 학술문헌의 양은 시간이 흐름에 따라 기하급수적으로 증가하고 있으며, 이에 따라 새로운 지식이 발견되고 연구가 발전하고 있다. 이처럼 시간의 흐름은 지식의 불확실성의 패턴을 발견하는데 중요한 요인이 될 수 있음에도 불구하고 기존의 연구들은 불확실성 단어의 단순 출현 빈도를 기반으로 특정 학문 영역에서 불확실성의 특성을 파악해왔다. 따라서, 본 연구에서는 구축한 불확실성 단어를 생의학 영역의 불확실성 연구에 적용하여 시간의 흐름에 따른 불확실성의 변화와 패턴을 파악하고자 한다. 시간의 흐름에 따른 생의학 지식의 패턴을 분석하기 위해 대표 개체 페어, 동사 유형, 대표 개체의 패턴을 살펴보았으며 선형회귀 분석을 통해 유의성 검증을 수행했다. 개체 페어 분석에서는 17건 중 7건의 개체 페어가 유의하게 감소하는 패턴을 보였다. 10개의 대표적인 동사 유형은 모두 시간이 흐름에 따라 유의하게 감소했다. 대표 개체의 연도별 상대적 중요도 분석에서는 유의하게 상승과 하강 패턴을 보이는 개체들의 불확실성 증감을 분석했다.

Non-negative matrix factorization 을 이용한 마이크로어레이 데이터의 클러스터링 (Clustering gene expression data using Non -Negative matrix factorization)

  • Lee, Min-Young;Cho, Ji-Hoon;Lee, In-Beum
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.117-123
    • /
    • 2004
  • 마이크로어레이 (microarray) 기술이 개발된 후로 연관된 유전자 클러스터 (cluster)를 찾는 문제는 깊이 연구되어왔다. 이 문제는 핵심적인 과제 중 하나는 생물학적으로 타당한 클러스터의 수를 결정하는 데 있다. 본 논문은 최적의 클러스터 수를 결정하는 기준을 제시하고, non-negative factorization (NMF)를 이용해 클러스터 centroid의 패턴을 찾는 방법을 제안한다. NMF에 의해 발견된 각각의 패턴은 생물학적 프로세스의 특정 부분으로 해석될 수 있다. NMF는 factor matrix의 entity를 non-negative로 제약 (constraint)하고, 이 제약은 오직 additive combination만 허용하기 때문에 이러한 부분적인 패턴을 찾아낼 수 있다. NMF의 유용성은 이미지 분석과 텍스트 분석에서 이미 입증되어 있다. 본 논문에서 제안한 방법에 의해 위의패턴과 유사한 발현 패턴을 갖는 유전자를 모을 수 있었다. 제안된 방법은 human fibroblast데이터와 yeast cell cycle 데이터에 적용해 성능을 입증하였다.

  • PDF

발생 관련 유전자의 DNA 메틸화 모티프 패턴 분석 (Analysis of DNA Methylation Motif Patterns for Development Related Genes)

  • 이현재;류제운;김학용
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.355-356
    • /
    • 2012
  • 후성유전은 DNA 염기 서열이 변화하지 않고 DNA의 메틸화(methyaltion) 및 히스톤 단백질의 변형(modification)등의 후천적 과정에 의해 유전자 발현이 조절되는 현상이다. 특히 DNA 메틸화 정도에 대한 패턴 분석은 후성유전을 이해하는 중요한 접근방법중 하나이다. DNA 메틸화 패턴 분석을 위해 발생에 관련된 123개 유전자들의 -5000bp ~ +200bp사이에 있는 DNA 염기 서열 정보를 추출하였다. 추출한 염기 서열 정보를 기반으로 기존에 알려진 메틸화 경향성 모티프와 메틸화 저항성 모티프를 모니터링 함으로써 발생관련 유전자들의 메틸화 모티프 패턴을 분석하였다. 결과적으로 메틸화 저항 모티프만이 발견되었고 따라서 메틸화 저항 모티프 패턴과 발생관련 유전자들의 상관관계를 분석하였다.

  • PDF

점진적인 순차 패턴 갱신 알고리즘 (An Incremental Updating Algorithm of Sequential Patterns)

  • 김학자;황환규
    • 전자공학회논문지CI
    • /
    • 제43권5호
    • /
    • pp.17-28
    • /
    • 2006
  • 본 논문에서는 데이터베이스에 새로운 트랜잭션이 추가되었을 때 순차 패턴을 갱신하는 문제를 연구하였다. 트랜잭션이 순차적으로 증가되는 환경에서 기존에 발견된 빈발 시퀸스를 재사용하여 순차패턴을 갱신하는 효율적인 알고리즘을 제안한다. 본 논문에서 제안한 방법은 후보 집합의 개수를 효율적으로 줄임으로써 AprioriAll이나 PrefixSpan 알고리즘보다 좋은 성능을 보임을 실험으로 확인하였다.

EP-tree 마이닝을 이용한 단백질 DISORDER/ORDER 지역 분류 (Classification of Protein DISORDER/ORDER Region Using EP-tree Mining)

  • 박홍규;이헌규;이미정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1274-1277
    • /
    • 2011
  • 단백질 1차 서열로부터 DISORDER와 ORDER지역을 예측하기 위해서 이 논문에서는 EP-tree에 기반한 출현패턴 발견 알고리즘을 제안하였다. EP-tree 알고리즘을 적용함으로서 기존의 단백질 특징 추출을 통한 방법과 달리 서열 자체에서 발견되는 출현패턴만을 이용하여 분류 모델을 생성하므로 기존의 신경망이나 SVM 보다 분류모델 생성 및 예측 속도가 빠르다. 또한 Disprot 4.9과 CASP7 테스트 데이터로 DISORDER/ORDER 지역을 예측한 결과, 73.4%의 높은 정확성을 보였다.

최적화에 기반을 둔 LAD의 패턴 생성 기법 (Optimization-Based Pattern Generation for LAD)

  • 장인용;류홍서
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.11-18
    • /
    • 2006
  • LAD(Logical Analysis of Data)는 Boolean-logic에 기반을 둔 데이터 마이닝 방법론이다. LAD에 의한 데이터 분석 시 중요한 과정은 데이터 집합에 숨겨진 구조적 정보를 패턴의 형식으로 발견해내는 패턴 생성 단계이다. 기존의 패턴 생성 방법은 열거법에 기반을 두고 있어 높은 차수의 패턴을 생성하는 것은 실질적으로 불가능하였다. 본 논문에서는 최적화에 기반을 둔 패턴 생성 방법론을 제안하고 혼합 정수 선형 모형과 SCP(Set Covering Problem)의 두 가지 모형을 제안한다. 기계학습 분야에서 널리 쓰이는 데이터 집합에 대해 제안된 패턴 생성 방법을 이용한 분석 실험을 통하여 기존의 패턴 생성 방법으로는 생성될 수 없는 패턴을 쉽게 생성하는 효율성을 입증하였다.

  • PDF

프로세스 마이닝 기법을 활용한 고장 수리 프로세스 분석 (Analysis of a Repair Processes Using a Process Mining Tool)

  • 최상현;한관희;임건훈
    • 한국콘텐츠학회논문지
    • /
    • 제13권4호
    • /
    • pp.399-406
    • /
    • 2013
  • 최근 기업의 비즈니스 프로세스를 혁신하고 효율화하기 위한 다양한 연구가 활발히 진행되고 있는 가운데, 의미 있는 비즈니스 프로세스 모델을 생성하고 분석하는 프로세스 마이닝 연구 분야가 주목받고 있다. ERP (Enterprise Resource Planning) 시스템이나 BPM (Business Process Management) 시스템에서 발생되는 업무 처리 내역이나 이벤트 로그를 분석하여 의미 있는 정보나 규칙을 발견해 낼 수 있는 프로세스 마이닝 기법은 다양한 분야에서 적용되고 있다. 본 연구에서는 프로세스 마이닝 도구인 ProM 시스템을 실제 고장 수리 사례에 적용하여 고장 수리 프로세스를 분석하고 제품의 주요 고장 패턴을 발견하는 방법을 제시한다. 고장 수리 프로세스 분석 결과 단순 통계 분석 결과에서 발견할 수 없었던 연결된 흐름의 빈도 분석이 가능하였으며, 연결된 흐름들 중에서 문제가 되는 프로세스에 대한 업무 향상 방안을 제시할 수 있었다.

사용자 행동 패턴 선호도 학습을 위한 퍼지 귀납 학습 시스템 (Fuzzy Inductive Learning System for Learning Preference of the User's Behavior Pattern)

  • 이형욱;김용휘;박광현;김용수;정진우;조준면;김민경;변증남
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.175-178
    • /
    • 2005
  • 스마트 홈과 같은 유비쿼터스 환경은 다양한 센서 및 제어 네트워크가 밀집되어 있는 복잡한 시스템이다. 본 논문에서는 이러한 환경하에서 복잡한 인터페이스의 사용에 대한 사용자의 인지 부담(cognitive load)를 줄이고 개인화된(personalized) 서비스를 자율적으로 제공하기 위한 사용자 행동 패턴 선호도 학습 기법을 제안한다. 이를 위해 지식 발견(Knowledge Discovery)을 위한 평생 학습(life-long learning)의 관점에서 퍼지 귀납(Fuzzy Inductive)학습 방법론을 제안하며, 이것은 수치 데이터로부터 입력 공간에 대한 효율적인 퍼지 분할(fuzzy partition)을 얻어내고 일관성있는(consisitent) 퍼지 상관 룰(fuzzy association rule)을 얻어내도록 한다.

  • PDF

대전시 공공 자전거(타슈) 공개 데이터 시각화 및 분석 (Visualization and Analysis of Public Bicycle Rental Data in Daejeon(Tashu))

  • 문현수;이영석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권6호
    • /
    • pp.253-267
    • /
    • 2016
  • 세계 주요 도시는 대중교통이 가지고 있는 문제를 보완하기 위해 공공 대여 자전거 시스템을 운영하고 있다. 대전시에서 최근에 대여 이력 데이터를 공개하여 새로운 분석 가능성을 열었다. 본 연구는 시각화를 이용해서 데이터의 의미를 파악할 수 있는 분석 방법을 제안한다. 실험 결과 이용률에 따른 정류장의 위치적 특징을 발견하였고, 시간/요일/월에 따라서 달라지는 자전거 이용 패턴을 알 수 있었다. 한편 이동 경로 분석을 통해서 정류장간 이용 패턴을 발견하였으며, 각 정류장별 목적지 비율 분석을 통해 이용 목적을 파악할 수 있었다. 이러한 데이터를 기반으로 대전시 공공 대여 자전거 시스템 발전 방향을 제시한다.