• 제목/요약/키워드: Top-down Clustering

검색결과 23건 처리시간 0.026초

콜러스터링 분기를 이용한 다중 서열 정렬 알고리즘 (A Multiple Sequence Alignment Algorithm using Clustering Divergence)

  • 이병일;이종연;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 다중 서열 정렬(multiple sequence alignment, MSA)은 단백질과 핵산 서열들의 분석에 필요한 가장 중요한 도구이다. 생물학적인 서열들은 그들 사이의 유사성과 차이점을 보여주기 위하여 각각의 서열들을 수직적으로 정렬한다. 본 논문에서는 클러스터링 분기를 이용하여 두 그룹의 서열들 사이에서 정렬을 수행하는 효율적인 그룹 정렬 방법을 제안하였다. 제안한 알고리즘(Multiple Sequence Alignment using Clustering Divergence : CDMS)은 하향식 발견 방법인 트리 형태의 병합을 위해 클러스터링 방법으로 구축하였다. 클러스터링 방법은 가장 긴 거리를 가지는 서열을 두 개의 클러스터로 나눌 수 있다는 것에 기초하였다. 제안한 새로운 서열 정렬 알고리즘은 기존의 Clustal W알고리즘 보다 질적 향상과 처리 시간 단축 O($n^{3} L^{2}$)이 기대된다.

  • PDF

거리 사상 함수 및 RBF 네트워크의 2단계 알고리즘을 적용한 서류 레이아웃 분할 방법 (A Two-Stage Document Page Segmentation Method using Morphological Distance Map and RBF Network)

  • 신현경
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.547-553
    • /
    • 2008
  • 본 논문에서는 2 단계 서류 레이아웃 분할 방법을 제안한다. 서류 분할의 1 차 단계는 top-down 계열의 영역 추출로서 모폴로지 기반의 거리 함수를 사용하여 주어진 영상 데이타를 사각형 영역들로 분할한다. 거리 사상 함수를 통한 예비 결과는 성능 개선을 위한 2 차 단계의 입력 변수로 작용한다. 서류 분할의 2차 단계로서 기계 학습 이론을 적용한다. 통계 모델을 따르는 RBF 신경망을 선택하였고, 은닉 층의 설계를 위해 코호넨 네트워크의 자기 조직화 성격을 활용한 데이타 군집화 기법을 기반으로 하였다. 본 논문에서는 300개의 영상에서 추출된 영역 데이타를 통해 학습된 신경망이 1차 단계에서 도출된 예비 결과를 개선함을 연구 결과로 제시하였다.

A Knowledge-based Interactive Idea Categorizer for Electronic Meeting Systems

  • Kim, Jae-Kyeong;Lee, Jae-Kwang
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.333-340
    • /
    • 2000
  • Research on group decisions and electronic meeting systems have been increasing rapidly according to the widespread of Internet technology. Although various issues have been raised in empirical research, we will try to solve an issue on idea categorizing in the group decision making process of electronic meeting systems. Idea categorizing used at existing group decision support systems was performed in a top-down procedure and mostly b participants; manual work. This resulted in tacking as long in idea categorizing as it does for idea generating clustering an idea in multiple categories, and identifying almost similar redundant categories. However such methods have critical limitation in the electronic meeting systems, we suggest an intelligent idea categorizing methodology which is a bottom-up approach. This method consists of steps to present idea using keywords, identifying keywords' affinity, computing similarity among ideas, and clustering ideas. This methodology allows participants to interact iteratively for clear manifestation of ambiguous ideas. We also developed a prototype system, IIC (intelligent idea categorizer) and evaluated its performance using the comparision experimetn with other systems. IIC is not a general purposed system, but it produces a good result in a given specific domain.

  • PDF

A Knowledge based Interaction idea Categorizer for Electronic Meeting Systems

  • Kim, Jae-Kyeong;Lee, Jae-Kwang
    • 지능정보연구
    • /
    • 제6권2호
    • /
    • pp.63-76
    • /
    • 2000
  • Research on group decisions and electroinc meeting systems have been increasing rapidly according to the widespread of Internet technology. Although various issues have been raised in empirical research, we will try to solve an issue on idea categorizing in the group decision making process of elecronic meeting systems. Idea categorizing used at existing group decision support systems was performed in a top-down procedure and mostly participants\` by manual work. This resulted in tacking as long in idea categorizing as it does for idea generating, clustering an idea in multiple categories, and identifying almost similar redundant categories. However such methods have critical limitation in the electronic meeting systems, we suggest an intelligent idea categorizing methodology which is a bottom-up approach. This method consists of steps to present idea using keywords, identifying keywords\` affinity, computing similarity among ideas, and clustering ideas. This methodology allows participants to interact iteratively for clear manifestation of ambiguous ideas. We also developed a prototype system, IIC (intelligent idea categorizer) and evaluated its performance using the comparision experimetn with other systems. IIC is not a general purposed system, but it produces a good result in a given specific domain.

  • PDF

온라인 계층적 군집화 기법을 활용한 양방향 헬스케어 프레임워크 (An Interactive e-HealthCare Framework Utilizing Online Hierarchical Clustering Method)

  • ;정석호;신동문;이경민;이동규;손교용;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.399-400
    • /
    • 2009
  • As a part of the era of human centric applications people started to care about their well being utilizing any possible mean. This paper proposes a framework for real time on-body sensor health-care system, addresses the current issues in such systems, and utilizes an enhanced online divisive agglomerative clustering algorithm (EODAC); an algorithm that builds a top-down tree-like structure of clusters that evolves with streaming data to rationally cluster on-body sensor data and give accurate diagnoses remotely, guaranteeing high performance, and scalability. Furthermore it does not depend on the number of data points.

적응적 격자기반 다차원 데이터 스트림 클러스터링 방법 (An Adaptive Grid-based Clustering Algorithm over Multi-dimensional Data Streams)

  • 박남훈;이원석
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.733-742
    • /
    • 2007
  • 데이터 스트림이란, 빠른 속도로 지속적으로 생성되는 무한한 크기의 방대한 양의 데이터 집합으로 정의된다. 무한한 데이터 스트림에 비해 주어진 메모리 공간은 유한하게 한정되어 있어, 이러한 제약조건을 충족시키는 범위 내에서 일정 한도내의 정확도 오차를 허용하기도 한다. 또한, 변화하는 데이터 스트림 내의 최신 클러스터를 찾기 위해서는 데이터 객체의 저장없이 오래된 데이터 스트림 내의 정보들을 비중을 감소시킬 수 있어야 한다. 본 연구에서는 데이터 스트림 분석을 위한 데이터 스트림 격자 기반 클러스터링 기법을 제시한다. 주어진 초기 격자셀에 대해, 데이터 객체의 빈도가 높은 범위를 반복적으로 보다 작은 크기의 격자셀로 분할하여 최소 크기의 격자셀, 단위 격자셀을 생성한다. 격자 셀에서는 데이터 객체들의 분포에 대한 통계값만을 저장하여, 기존의 클러스터링 기법에 비해 데이터 객체에 대한 탐색없이 효율적으로 클러스터를 찾을 수 있다. 또한, 가용 메모리 공간에 따라 단위 격자셀의 크기를 조절하여 클러스터의 정확도를 최대화할 수 있어, 주어진 메모리 공간에 맞게 적응적으로 성능을 조절할 수 있다.

Abnormal Behavior Recognition Based on Spatio-temporal Context

  • Yang, Yuanfeng;Li, Lin;Liu, Zhaobin;Liu, Gang
    • Journal of Information Processing Systems
    • /
    • 제16권3호
    • /
    • pp.612-628
    • /
    • 2020
  • This paper presents a new approach for detecting abnormal behaviors in complex surveillance scenes where anomalies are subtle and difficult to distinguish due to the intricate correlations among multiple objects' behaviors. Specifically, a cascaded probabilistic topic model was put forward for learning the spatial context of local behavior and the temporal context of global behavior in two different stages. In the first stage of topic modeling, unlike the existing approaches using either optical flows or complete trajectories, spatio-temporal correlations between the trajectory fragments in video clips were modeled by the latent Dirichlet allocation (LDA) topic model based on Markov random fields to obtain the spatial context of local behavior in each video clip. The local behavior topic categories were then obtained by exploiting the spectral clustering algorithm. Based on the construction of a dictionary through the process of local behavior topic clustering, the second phase of the LDA topic model learns the correlations of global behaviors and temporal context. In particular, an abnormal behavior recognition method was developed based on the learned spatio-temporal context of behaviors. The specific identification method adopts a top-down strategy and consists of two stages: anomaly recognition of video clip and anomalous behavior recognition within each video clip. Evaluation was performed using the validity of spatio-temporal context learning for local behavior topics and abnormal behavior recognition. Furthermore, the performance of the proposed approach in abnormal behavior recognition improved effectively and significantly in complex surveillance scenes.

클러스터링 기법을 활용한 중소기업 지원 지식서비스의 성과유형 분류: K 연구원 사례를 중심으로 (Classification of Performance Types for Knowledge Intensive Service Supporting SMEs Using Clustering Techniques: Focused on the Case of K Research Institute)

  • 이정우;김성진;김민관;유재영;한혁;박훈;한창희
    • 한국전자거래학회지
    • /
    • 제22권3호
    • /
    • pp.87-103
    • /
    • 2017
  • 많은 제조기반의 중소기업들은 프로세스나 제품을 혁신하기 위해 공공 및 사기업의 지식서비스를 아웃소싱하고 있다. 본 연구의 사례인 K 연구원은 여러 지식서비스를 다양한 조합형태로 제공하는데, 이러한 제공형태의 복잡성으로 인해 지식서비스 사업성과를 정확히 분석한다는 것이 어려운 상황이다. 본 연구는 기존에 성과평가 항목을 상향식으로 선정하는 방식이 아닌 하향식 관점에서 성과항목을 도출하였다. K 연구원 지식서비스 수혜기업인 82개 기업사례에서 74개의 성과항목이 도출되었고, 최종적으로 17개 항목으로 정제하였다. 이후 사례-성과 행렬을 구조화하여 기업별 성과의 유무를 조사하여 이진 데이터로 입력하였다. K-means 클러스터링 분석을 통해 3개의 군집을 각각 '핵심 경쟁력 강화(제품 및 특허)', '국내 및 해외시장 확대', '운영 효율성 제고'로 식별할 수 있었다.

계층적 영상구조에서 통계적 방법에 의한 영상분할 (A Statistical Image Segmentation Method in the Hierarchical Image Structure)

  • 최성진
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.165-175
    • /
    • 1996
  • 본 논문에서는 영상분할에 이용되는 대부분의 기존방법들에서의 문제점을 해결하기 위해 입력 영상으로부터 형성된 계층적 피라밋 영상구조를 이용하여 영상을 분할하는 방법을 제안하였다. 제안된 방법은 통계적 방식에 의한 물체검출 및 묘사과정으로 이루어져 있다. 물체검출 방법에서는 계층적 영상구조에서 발생하는 클러스터링의 유효성 문제를 해결하기 위해 통계적 IFSVR 알고리듬과 FSVR 알고리듬을 제안하였고, 이를 이용하여 관심대상 화소를 검출하였다. 물체묘사 방법은 고해상도 레벨로 검출된 최적 물체화소를 투사하고 처리하기 위해 톱다운 추적방식인 반복 알고리듬을 제안하였다. 시뮬레이션을 통하여 2진 영상과 실영상 모두에서 제안된 분할방법을 분석하였고, 그 결과 계층적 피라밋구조에 기초를 둔 접근방법이 영상분할에 대한 유용한 특성을 가지고 있음을 입증하였으며, 병렬처리기에서 처리된다면 각 알고리듬이 n${\times}$n 영상에 대해 0(log n)의 계산량이 요구된다.

  • PDF

Differentially Expressed Genes in Metastatic Advanced Egyptian Bladder Cancer

  • Zekri, Abdel-Rahman N;Hassan, Zeinab Korany;Bahnassy, Abeer A;Khaled, Hussein M;El-Rouby, Mahmoud N;Haggag, Rasha M;Abu-Taleb, Fouad M
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권8호
    • /
    • pp.3543-3549
    • /
    • 2015
  • Background: Bladder cancer is one of the most common cancers worldwide. Gene expression profiling using microarray technologies improves the understanding of cancer biology. The aim of this study was to determine the gene expression profile in Egyptian bladder cancer patients. Materials and Methods: Samples from 29 human bladder cancers and adjacent non-neoplastic tissues were analyzed by cDNA microarray, with hierarchical clustering and multidimensional analysis. Results: Five hundred and sixteen genes were differentially expressed of which SOS1, HDAC2, PLXNC1, GTSE1, ULK2, IRS2, ABCA12, TOP3A, HES1, and SRP68 genes were involved in 33 different pathways. The most frequently detected genes were: SOS1 in 20 different pathways; HDAC2 in 5 different pathways; IRS2 in 3 different pathways. There were 388 down-regulated genes. PLCB2 was involved in 11 different pathways, MDM2 in 9 pathways, FZD4 in 5 pathways, p15 and FGF12 in 4 pathways, POLE2 in 3 pathways, and MCM4 and POLR2E in 2 pathways. Thirty genes showed significant differences between transitional cell cancer (TCC) and squamous cell cancer (SCC) samples. Unsupervised cluster analysis of DNA microarray data revealed a clear distinction between low and high grade tumors. In addition 26 genes showed significant differences between low and high tumor stages, including fragile histidine triad, Ras and sialyltransferase 8 (alpha) and 16 showed significant differences between low and high tumor grades, like methionine adenosyl transferase II, beta. Conclusions: The present study identified some genes, that can be used as molecular biomarkers or target genes in Egyptian bladder cancer patients.