• 제목/요약/키워드: pattern discovery

검색결과 149건 처리시간 0.027초

A review of drug knowledge discovery using BioNLP and tensor or matrix decomposition

  • Gachloo, Mina;Wang, Yuxing;Xia, Jingbo
    • Genomics & Informatics
    • /
    • 제17권2호
    • /
    • pp.18.1-18.10
    • /
    • 2019
  • Prediction of the relations among drug and other molecular or social entities is the main knowledge discovery pattern for the purpose of drug-related knowledge discovery. Computational approaches have combined the information from different sources and levels for drug-related knowledge discovery, which provides a sophisticated comprehension of the relationship among drugs, targets, diseases, and targeted genes, at the molecular level, or relationships among drugs, usage, side effect, safety, and user preference, at a social level. In this research, previous work from the BioNLP community and matrix or matrix decomposition was reviewed, compared, and concluded, and eventually, the BioNLP open-shared task was introduced as a promising case study representing this area.

IMPLEMENTATION OF SUBSEQUENCE MAPPING METHOD FOR SEQUENTIAL PATTERN MINING

  • Trang, Nguyen Thu;Lee, Bum-Ju;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.627-630
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

  • PDF

Implementation of Subsequence Mapping Method for Sequential Pattern Mining

  • Trang Nguyen Thu;Lee Bum-Ju;Lee Heon-Gyu;Park Jeong-Seok;Ryu Keun-Ho
    • 대한원격탐사학회지
    • /
    • 제22권5호
    • /
    • pp.457-462
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

CLAM 에이전트 기반 Directory Facilitator를 위한 효율적인 서비스 디스커버리 프로토콜 구현 (Implementation of an Efficient Service Discovery Protocol for Directory Facilitator Based on CALM Agent)

  • 이승현;신동렬;장경수
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.275-282
    • /
    • 2011
  • 현재, UPnP, Jini, SLP와 같은 서비스 디스커버리 프로토콜은 서비스의 표현과 기술, 그리고 메시지 교환 패턴과 같은 기본적인 서비스 디스커버리 기능만 제공한다. 이것은 서비스 디스커버리 프로토콜 사이에 서비스의 상호운영성을 저해하는 요소로 작용한다. 따라서, 본 논문에서는 이기종 서비스간의 상호운영성을 높일 수 있도록 CLAM (Component-based Autonomic Layered Middleware) 에이전트 플랫폼을 구성하고, 플랫폼 내의 DF (Directory Facilitator)의 기능을 확장하여 효율적인 서비스가 가능하도록 DF 에이전트를 설계하고 구현한다. 또한 DF 에이전트에서 확장성과 상호운영성을 보장하기 위해 DHT-Chord 알고리즘을 이용한 효율적인 서비스 디스커버리 메커니즘을 제안한다.

시공간 지식탐사를 위한 3계층 프레임워크 (A 3-Layered Framework for Spatiotemporal Knowledge Discovery)

  • 이준욱;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.205-218
    • /
    • 2004
  • 시공간 데이타관리를 위한 데이타베이스 기술이 발전함에 따라 방대한 시공간 데이타 집합으로부터 의미 있는 시공간 지식 탐사를 필요로 하는 시공간 응용 서비스가 증대되고 있다. 이 논문에서는 시공간 지식 탐사 기법 개발을 지원하기 위하여 시공간 3계층 지식탐사 프레임워크를 제안하였다. 프레임 워크에서는 시공간 지식 탐사 문제 정의를 위한 기반 모델을 제시하여 시공간 지식에 대한 정의 및 관계를 표현할 수 있도록 하였다. 또한 시공간 지식 탐사 시스템의 구성요소 및 구현 모델을 제시하였다. 이 논문에서 제안한 시공간 지식 탐사를 위한 프레임워크는 앞으로 새로운 유형의 시공간 지식 탐사 기법 개발에 적용될 수 있는 특징을 포함하고 있다. 제안한 프레임워크는 시공간 이동 패턴과 같은 새로운 유형의 지식 탐사 기법 개발 지원에 있어 시공간 데이타 집합, 정보 및 지식에 대한 관계 규정과 각 요소에 대한 표현 모델을 제공함으로써 지식 탐사 문제를 형식화하고 단순화할 수 있다.

Lexical Discovery and Consolidation Strategies of Proficient and Less Proficient EFL Vocational High School Learners

  • Chon, Yuah Vicky;Kim, You-Hee
    • 영어어문교육
    • /
    • 제17권3호
    • /
    • pp.27-56
    • /
    • 2011
  • The analysis on the use of lexical discovery and consolidation strategies that have been researched within the area of vocabulary learning strategies (VLS) have not sufficiently drawn the interest of EFL practitioners with regard to vocational high school learners. The results, however, are expected to have implications for the design of vocabulary tasks and instructional materials for EFL learners. The present study investigates EFL vocational high school learners' use of lexical discovery and consolidation strategies with questionnaires, where the use of the learners' lexical discovery strategies were further validated with the think-aloud methodology by asking samples of proficient and less proficient learners to report on their reading process while reading L2 texts that had not been exposed to the learners. The results indicated that there were significant differences between the two groups of learners in the employment of 11 of the strategies which were in the categories of determination, social, memory, and metacognitive strategies, but not for cognitive strategies. The pattern of strategies indicated that different lexical discovery and consolidation strategies were employed relatively more by one proficiency group than another. The study suggests some implications for how strategy-based instruction can be implemented in EFL classrooms.

  • PDF

Artificial Intelligence and Pattern Recognition Using Data Mining Algorithms

  • Al-Shamiri, Abdulkawi Yahya Radman
    • International Journal of Computer Science & Network Security
    • /
    • 제21권7호
    • /
    • pp.221-232
    • /
    • 2021
  • In recent years, with the existence of huge amounts of data stored in huge databases, the need for developing accurate tools for analyzing data and extracting information and knowledge from the huge and multi-source databases have been increased. Hence, new and modern techniques have emerged that will contribute to the development of all other sciences. Knowledge discovery techniques are among these technologies, one popular technique of knowledge discovery techniques is data mining which aims to knowledge discovery from huge amounts of data. Such modern technologies of knowledge discovery will contribute to the development of all other fields. Data mining is important, interesting technique, and has many different and varied algorithms; Therefore, this paper aims to present overview of data mining, and clarify the most important of those algorithms and their uses.

주가 예측을 위한 규칙 탐사 및 매칭 (Rule Discovery and Matching for Forecasting Stock Prices)

  • 하유민;김상욱;원정임;박상현;윤지희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.179-192
    • /
    • 2007
  • 본 논문에서는 주식 데이타베이스로부터 과거 주가 변화 패턴에 대한 규칙을 탐사함으로써 투자자에게 주식 투자 유형을 추천해 주는 방안에 관하여 논의한다. 먼저, 본 논문에서는 주식 투자 유형의 추천을 위한 새로운 규칙 모델을 정의한다. 제안된 모델에서는 빈번하게 발생하는 주가 변화 패턴의 이후의 주가 변화 경향이 투자자의 투자 조건과 매치하는 경우, 이 종목에 대한 투자 유형을 추천하도록 하는 방식을 사용한다. 이때, 빈번하게 발생하는 패턴을 규칙의 헤드로 간주하며, 이후의 주가 변화 경향을 규칙의 바디로 간주한다. 본 연구에서는 규칙 헤드는 투자자의 특성에 별다른 영향을 받지 않는 반면, 규칙 바디에 대한 조건은 투자자마다 다르다는 점에 착안하여 규칙 탐사 과정에서 전체 규칙이 아닌 규칙 헤드들만을 탐사하여 저장해 두는 새로운 방식을 제안한다. 이 결과, 투자자 별로 달라질 수 있는 규칙 바디에 대한 조건을 유연하게 정의하는 것을 허용하며, 규칙의 수를 줄임으로써 전체 규칙 탐사 성능을 개선할 수 있다. 효율적인 규칙 탐사와 매칭을 위하여 빈번 패턴들을 효과적으로 탐사하는 방법, 빈번 패턴 베이스를 구축하는 방법, 그리고 이들을 인덱싱 하는 방법을 제안한다. 또한, 투자자의 질의가 발생하는 경우, 빈번 패턴 베이스로부터 이와 매치되는 규칙을 발견하고, 이 결과를 이용하여 투자자에게 투자 유형을 추천해 주는 방법을 제안한다. 실제 주식 데이타를 이용한 다양한 실험을 통하여 제안된 기법의 우수성을 규명한다.

Prefix-트리를 이용한 동적 가중치 빈발 패턴 탐색 기법 (Efficient Dynamic Weighted Frequent Pattern Mining by using a Prefix-Tree)

  • 정병수
    • 정보처리학회논문지D
    • /
    • 제17D권4호
    • /
    • pp.253-258
    • /
    • 2010
  • 지금까지의 빈발 패턴(Frequent Pattern) 마이닝에서는 각 항목들의 중요도(Weight)는 모든 같은 값으로 다루어 왔으나 실 환경에서는 각 항목들의 중요도가 다르게 적용되는 경우가 많이 있고 또 같은 항목이라도 시간에 따라 다른 중요도 값으로 다루어져야 할 경우가 있다. 비즈니스 데이터 분석 환경이나 웹 클릭 데이터 분석 환경과 같은 응용에서도 동적으로 변하는 중요도를 고려하여야 한다. 지금까지 항목의 중요도를 고려하는 여러 패턴 마이닝 기법들이 제안되고 있으나 동적으로 변하는 항목의 중요도를 고려하는 연구는 발표되지 않고 있다. 본 논문에서는 처음으로 동적인 항목들의 중요도(혹은 가중치)를 고려하는 빈발 패턴 마이닝 알고리즘을 제안한다. 제안하는 기법은 단 한번의 데이터베이스 스캔으로 처리되므로 스트림 데이터를 분석할 수 있다. 여러 실험을 통하여 제안하는 기법은 매우 효과적이며 확장성이 좋은 것임을 보인다.

분산형 FP트리를 활용한 병렬 데이터 마이닝 (Parallel Data Mining with Distributed Frequent Pattern Trees)

  • 조두산;김동승
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 V
    • /
    • pp.2561-2564
    • /
    • 2003
  • Data mining is an effective method of the discovery of useful information such as rules and previously unknown patterns existing in large databases. The discovery of association rules is an important data mining problem. We have developed a new parallel mining called Distributed Frequent Pattern Tree (abbreviated by DFPT) algorithm on a distributed shared nothing parallel system to detect association rules. DFPT algorithm is devised for parallel execution of the FP-growth algorithm. It needs only two full disk data scanning of the database by eliminating the need for generating the candidate items. We have achieved good workload balancing throughout the mining process by distributing the work equally to all processors. We implemented the algorithm on a PC cluster system, and observed that the algorithm outperformed the Improved Count Distribution scheme.

  • PDF