• 제목/요약/키워드: Self organizing map

검색결과 424건 처리시간 0.023초

MCL 알고리즘을 사용한 유전자 발현 데이터 클러스터링 (Clustering Gene Expression Data by MCL Algorithm)

  • 손호선;류근호
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.27-33
    • /
    • 2008
  • 유전자 발현 데이터의 분석 기법 중 무감독 학습 기반의 클러스터링 기법은 생물학적 변화와 진의 발현 정도를 이해하는데 자주 사용되는 방법이다. 생명공학 연구에 있어서 그래프 기반의 MCL 알고리즘은 그래프 내의 노드들을 클러스터링 하는 알고리즘으로 빠르고 효과적이다. 우리는 기존의 MCL 알고리즘을 개선하여 마이크로어레이 데이터에 적용시켰다. MCL 알고리즘 수행 시 inflation과 대각선 항의 두 요인을 조정하는 시뮬레이션을 실행하였으며, 마코브 행렬을 이용하여 변환하였다. 또한 개선된 MCL 알고리즘에서는 더 명확한 클래스를 구분하기 위하여 각 열의 평균을 구한 후 그 값을 임계치로 사용하였다. 따라서 수정된 알고리즘은 기존의 알고리즘들보다 정확도를 높일 수 있었다. 즉, 실제 실험 결과 기존에 알려진 클래스와 비교했을 때 평균 70%의 정확도를 보였다. 또한, 다른 클러스터링 기법, K-means 알고리즘, 계층적 클러스터링 그리고 SOM 알고리즘을 비교 분석하였으며, 그 결과 MCL 알고리즘이 다른 클러스터링 기법보다 더 좋은 결과를 보임을 알 수 있다.

신경망을 사용한 사상체질 진단검사 개발 연구 (Development of Sasang Type Diagnostic Test with Neural Network)

  • 채한;황상문;엄일규;김병철;김영인;김병주;권영규
    • 동의생리병리학회지
    • /
    • 제23권4호
    • /
    • pp.765-771
    • /
    • 2009
  • The medical informatics for clustering Sasang types with collected clinical data is important for the personalized medicine, but it has not been thoroughly studied yet. The purpose of this study was to examine the usefulness of neural network data mining algorithm for traditional Korean medicine. We used Kohonen neural network, the Self-Organizing Map (SOM), for the analysis of biomedical information following data pre-processing and calculated the validity index as percentage correctly predicted and type-specific sensitivity. We can extract 12 data fields from 30 after data pre-processing with correlation analysis and latent functional relationship analysis. The profile of Myers-Briggs Type Inidcator and Bio-Impedance Analysis data which are clustered with SOM was similar to that of original measurements. The percentage correctly predicted was 56%, and sensitivity for So-Yang, Tae-Eum and So-Eum type were 56%, 48%, and 61%, respectively. This study showed that the neural network algorithm for clustering Sasang types based on clinical data is useful for the sasang type diagnostic test itself. We discussed the importance of data pre-processing and clustering algorithm for the validity of medical devices in traditional Korean medicine.

다중 클래스 아다부스트를 이용한 엘리베이터 내 군집 밀도 추정 (Crowd Density Estimation with Multi-class Adaboost in elevator)

  • 김대훈;이영현;구본화;고한석
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.45-52
    • /
    • 2012
  • 본 논문에서는 다중 클래스 아다부스트 기반의 분류기를 이용하여 엘리베이터 내 군집 밀도를 추정하는 방법을 제안한다. SOM을 사용하는 기존의 방법은 재현성이 떨어지며 충분한 성능을 내지 못한다. 제안한 방법은 GLDM(Grey-Level Dependency Matrix)과 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징과 다중 클래스 아다부스트 기반의 분류기를 통해 실내 군집 밀도를 추정한다. 다중 클래스를 분류하기 위해 기존의 아다부스트 알고리즘에서 웨이트 업데이트 식을 변형하여 더 높은 성능의 약한 분류기를 생성하도록 하였다. 군집 밀도는 인원수에 따라 0명, 1~2명, 3~4명, 5명 이상 등 네 가지 클래스로 구분하였다. 엘리베이터 내 영상을 이용한 모의 실험 결과 제안된 방법은 기존의 방법보다 약 20% 정도의 검출률 향상을 나타내었다.

SOFM의 적용에 의한 영산강 수질 및 유량자료의 시.공간적 패턴분류 특성 (Characteristics of Spatio-temporal Pattern Classification for Water Quality and Runoff Data in the Yeongsan River by the Application of SOFM)

  • 박성천;송자섭;진영훈;노경범
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.189-193
    • /
    • 2011
  • 유역관리 및 수질 향상을 위해 다양한 환경정책이 시행되고 있으며, 최근 수질오염총량관리제의 시행으로 인해 보다 집중적인 유역관리와 수질 향상을 위한 노력이 배가되고 있다. 이러한 노력의 일환으로 현재 환경부 국립환경과학원에서는 수질오염총량관리를 위하여 단위유역의 말단지점에서 수질 및 유량자료에 대한 정기적인 측정을 8일 간격으로 시행하고 있으며, 데이터 베이스 및 웹시스템을 통하여 자료를 공개하고 있다(이호열, 2009). 이와 같은 자료의 측정과 축적은 그 분석을 통해 수질 개선을 위한 우선 관리 대상지점의 파악 등과 같이 수질오염총량관리제의 시행과 평가를 위해 사용될 수 있을 뿐만 아니라 새로운 환경정책의 수립에도 활용될 수 있을 것으로 기대된다. 그러나 현재 소수의 연구들에서만 상기의 자료를 단순히 활용한 결과를 찾을 수 있으며, 특히 측정된 수질 및 유량자료를 분석하여 발표한 연구결과 역시 소수에 지나지 않는다(김철겸 등, 2009). 측정 자료에 대한 분석 및 이에 따른 자료의 활용성 제고를 위해서 다양한 자료 분석 기법의 개발과 적용이 절실하다. 이러한 자료 분석 기법의 개발 및 적용에 관한 연구의 일환으로 최근 패턴분류를 위해 다양한 분야에서 활용되고 있는 자기조직화 특성 지도(Self Organizing Feature Map: SOFM)를 상기의 측정 자료에 적용한 연구 결과가 보고된 바 있다(진영훈 등, 2009; 2010). 본 연구에서는 수질오염총량관리제를 위해 측정되고 있는 수질 및 유량자료를 수집하여 자료에 내재되어 있는 시 공간적 특성을 분석하고자 하였다. 영산강 유역을 대상으로 하여, 본 유역 내의 단위유역들 중 황룡_A, 지석_A, 영본_A, 영본_B, 영본_C, 영본_D의 말단지점에서 측정되고 있는 BOD (Biochemical Oxygen Demand), TOC (Total Organic Carbon), T-N (Total Nitrogen), T-P (Total Phosphorus), SS (Suspended Solids) 수질농도 및 유량자료를 대상으로 연구를 진행하였다.

  • PDF

한국어 파열음 인식을 위한 피쳐 셉 입력 인공 신경망 모델에 관한 연구 (A STUDY ON THE IMPLEMENTATION OF ARTIFICIAL NEURAL NET MODELS WITH FEATURE SET INPUT FOR RECOGNITION OF KOREAN PLOSIVE CONSONANTS)

  • 김기석;김인범;황희융
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1990년도 하계학술대회 논문집
    • /
    • pp.535-538
    • /
    • 1990
  • The main problem in speech recognition is the enormous variability in acoustic signals due to complex but predictable contextual effects. Especially in plosive consonants it is very difficult to find invariant cue due to various contextual effects, but humans use these contextual effects as helpful information in plosive consonant recognition. In this paper we experimented on three artificial neural net models for the recognition of plosive consonants. Neural Net Model I used "Multi-layer Perceptron ". Model II used a variation of the "Self-organizing Feature Map Model". And Model III used "Interactive and Competitive Model" to experiment contextual effects. The recognition experiment was performed on 9 Korean plosive consonants. We used VCV speech chains for the experiment on contextual effects. The speech chain consists of Korean plosive consonants /g, d, b, K, T, P, k, t, p/ (/ㄱ, ㄷ, ㅂ, ㄲ, ㄸ, ㅃ, ㅋ, ㅌ, ㅍ/) and eight Korean monothongs. The inputs to Neural Net Models were several temporal cues - duration of the silence, transition and vot -, and the extent of the VC formant transitions to the presence of voicing energy during closure, burst intensity, presence of asperation, amount of low frequency energy present at voicing onset, and CV formant transition extent from the acoustic signals. Model I showed about 55 - 67 %, Model II showed about 60%, and Model III showed about 67% recognition rate.

  • PDF

Temporal Dynamics and Patterning of Meiofauna Community by Self-Organizing Artificial Neural Networks

  • Lee, Won-Cheol;Kang, Sung-Ho;Montagna Paul A.;Kwak Inn-Sil
    • Ocean and Polar Research
    • /
    • 제25권3호
    • /
    • pp.237-247
    • /
    • 2003
  • The temporal dynamics of the meiofauna community in Marian Cove, King George Island were observed from January 22 to October 29 1996. Generally, 14 taxa of metazoan meiofauna were found. Nematodes were dominant comprising 90.12% of the community, harpacticoid 6.55%, and Kinorhynchs 1.54%. Meiofauna abundance increased monthly from January to May 1996, while varying in abundance after August 1996. Overall mean abundance of metazoan meiofauna was $2634ind./10cm^2$ during the study periods, which is about as high as that found in temperate regions. Nematodes were most abundant representing $2399ind./10cm^2$. Mean abundance of harpacticoids, including copepodite and nauplius was $131ind./10cm^2$ by kinorhynchs $(26ind./10cm^2)$. The overall abundance of other identified organisms was $31ind./10cm^2$ Other organisms consisted of a total of 11 taxa including Ostracoda $(6ind./10cm^2)$, Polycheata $(7ind./10cm^2)$, Oligochaeta $(8ind./10cm^2)$, and Bivalvia $(6ind./10cm^2)$. Additionally, protozoan Foraminifera occurred at the study area with a mean abundance of $263ind./10cm^2$. Foraminiferans were second in dominance to nematodes. The dominant taxa such as nematodes, harpacticoids, kinorhynchs and the other tua were trained and extensively scattered in the map through the Kohonen network. The temporal pattern of the community composition was most affected by the abundance dynamics of kinorhynchs and harpacticoids. The neural network model also allowed for simulation of data that was missing during two months of inclement weather. The lowest meiofauna abundance was found in August 1996 during winter. The seasonal changes were likely caused by temperature and salinity changes as a result of meltwater runoff, and the physical impact by passing icebergs.

CLUSTERING DNA MICROARRAY DATA BY STOCHASTIC ALGORITHM

  • Shon, Ho-Sun;Kim, Sun-Shin;Wang, Ling;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.438-441
    • /
    • 2007
  • Recently, due to molecular biology and engineering technology, DNA microarray makes people watch thousands of genes and the state of variation from the tissue samples of living body. With DNA Microarray, it is possible to construct a genetic group that has similar expression patterns and grasp the progress and variation of gene. This paper practices Cluster Analysis which purposes the discovery of biological subgroup or class by using gene expression information. Hence, the purpose of this paper is to predict a new class which is unknown, open leukaemia data are used for the experiment, and MCL (Markov CLustering) algorithm is applied as an analysis method. The MCL algorithm is based on probability and graph flow theory. MCL simulates random walks on a graph using Markov matrices to determine the transition probabilities among nodes of the graph. If you look at closely to the method, first, MCL algorithm should be applied after getting the distance by using Euclidean distance, then inflation and diagonal factors which are tuning modulus should be tuned, and finally the threshold using the average of each column should be gotten to distinguish one class from another class. Our method has improved the accuracy through using the threshold, namely the average of each column. Our experimental result shows about 70% of accuracy in average compared to the class that is known before. Also, for the comparison evaluation to other algorithm, the proposed method compared to and analyzed SOM (Self-Organizing Map) clustering algorithm which is divided into neural network and hierarchical clustering. The method shows the better result when compared to hierarchical clustering. In further study, it should be studied whether there will be a similar result when the parameter of inflation gotten from our experiment is applied to other gene expression data. We are also trying to make a systematic method to improve the accuracy by regulating the factors mentioned above.

  • PDF

휴먼 보행 동작 구조 분석을 위한 통계적 모델링 방법 (Statistical Modeling Methods for Analyzing Human Gait Structure)

  • 신봉기
    • 스마트미디어저널
    • /
    • 제1권2호
    • /
    • pp.12-22
    • /
    • 2012
  • 최근 비디오 감시, 로봇 시각 휴대폰 등 무수히 많은 카메라가 생활 속에 파고들면서 휴먼 동작 인식은 컴퓨터 시각 분야의 새로운 붐을 일으키고 있다. 자체로 그다지 흥미 있는 동작은 아니지만 걸음걸이 또는 보행은 가장 보편적으로 많이 관찰되는, 의심할 여지없이 사람의 대표적인 동작이다. 그리 오래되지 않은 과거에 보행자 인식의 관점에서 반짝 연구가 있었지만 관심의 길이가 짧은 만큼 보행 동작에 관한 체계적인 분석과 이해 없이 이루어졌었다. 본 연구에서는 일련의 점진적인 모델을 이용하여 보행 동작의 구조를 체계적으로 분석하고자 한다. 입력 영상 신호의 다양한 변형과 불완전성을 극복할 수 있는 동적 베이스망 기반의 보행자 모델과 보행 모델을 제시한다. 그리고 이변량 폰 미제스 분포의 조건부 밀도 함수를 기반으로 마르코프 체인의 이산 상태 공간을 연속 공간으로 확장하는 방법을 제안한다. 제안된 모형화 프레임워크를 이용한 일련의 시험, 분석에서 보행자를 91.67% 인식하며 보행 동작을 보행 방향과 보행 자세의 두 가지 독립적인 성분으로 분리 해석할 수 있었다.

  • PDF

진보된 다단계 특징벡터 기반의 분류기 모델 (Advanced Multistage Feature-based Classification Model)

  • 김재영;박동철
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.36-41
    • /
    • 2010
  • 본 논문에서는 다단계 특성벡터 기반의 분류기 모델(Multistage Feature-based Classification Model: MFCM)의 성능을 향상시킨 진보된 형태의 MFCM (Advanced MFCM: AMFCM)을 제안하는데, AMFCM은 MFCM과 같이 주어진 데이터에서 추출된 전체의 특징벡터를 연결하여 이용하지 않고, 같은 성질의 특징벡터들끼리 모아서, 각각의 국지적 학습기를 통하여 분류에 이용한다. 그러나, AMFCM은 MFCM에서 사용되는 각각의 국지적 분류기를 위한 각 특징벡터의 분류기여도를 더욱 섬세하게 조정하여 최종적인 분류의 정확도를 높이는 방안을 제안한다. 제안된 AMFCM의 성능을 검증하기 위하여, 음악장르 분류의 문제에 대한 실험을 진행하였다. 또한, 국지적 분류기로 Self-Organizing Map과 중심 신경망을 사용하여 실험을 수행하였는데, 제안된 AMFCM은 사용된 국지적 분류기의 종류와 사용된 군집의 개수에 따라 기존의 MFCM에 비해 평균 8% - 15% 이상의 성능향상을 보여 준다.

사용자 특성을 고려한 장애인 및 노령 인구를 위한 보조 소프트웨어의 개발 - 작업용 특수 전동의자를 위한 통합 사용자 인터페이스 (Development of Assistive Software for Disabled and Aged People Based on User Characteristics - Unified User Interface for Special Work Chair)

  • 김상철;전문진;이상완;박광현;변증남
    • 전자공학회논문지SC
    • /
    • 제44권4호통권316호
    • /
    • pp.8-14
    • /
    • 2007
  • 사회제도가 개선되고 기술이 발전함에 따라 고령인구와 장애인의 사회 참여가 지속적으로 증가하고 있다. 지능 로봇 및 지능형 주거공간 등의 여러 시스템들의 이들의 사회 참여를 돕기 위해 개발되었고, 실제 고령 인구와 장애인의 독립적인 생활 영위에 많은 기여를 하고 있다. 그러나 상기의 시스템들을 구축하기 위해서는 대부분 고가의 특별한 하드웨어가 요구된다. 실제 시스템을 사용하게 될 계층의 경제적 어려움을 고려하면 기존의 노트북 컴퓨터와 같은 일반적 하드웨어를 사용하는 소프트웨어 기반의 시스템의 개발이 요구된다. 한편 이러한 소프트웨어는 컴퓨터 사용에 익숙하지 않으며 신체의 움직임이 부자유스러운 사용자 계층을 위해 특수하게 제작되어야 한다. 본 논문에서는 이러한 요건들을 만족시키는 소프트웨어 기반의 보조 시스템의 관련 이론을 포함한 개발 과정을 소개하고 결과물을 제시한다.