• 제목/요약/키워드: Hierarchical neural network

검색결과 127건 처리시간 0.031초

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

Anomalous Trajectory Detection in Surveillance Systems Using Pedestrian and Surrounding Information

  • Doan, Trung Nghia;Kim, Sunwoong;Vo, Le Cuong;Lee, Hyuk-Jae
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권4호
    • /
    • pp.256-266
    • /
    • 2016
  • Concurrently detected and annotated abnormal events can have a significant impact on surveillance systems. By considering the specific domain of pedestrian trajectories, this paper presents two main contributions. First, as introduced in much of the work on trajectory-based anomaly detection in the literature, only information about pedestrian paths, such as direction and speed, is considered. Differing from previous work, this paper proposes a framework that deals with additional types of trajectory-based anomalies. These abnormal events take places when a person enters prohibited areas. Those restricted regions are constructed by an online learning algorithm that uses surrounding information, including detected pedestrians and background scenes. Second, a simple data-boosting technique is introduced to overcome a lack of training data; such a problem particularly challenges all previous work, owing to the significantly low frequency of abnormal events. This technique only requires normal trajectories and fundamental information about scenes to increase the amount of training data for both normal and abnormal trajectories. With the increased amount of training data, the conventional abnormal trajectory classifier is able to achieve better prediction accuracy without falling into the over-fitting problem caused by complex learning models. Finally, the proposed framework (which annotates tracks that enter prohibited areas) and a conventional abnormal trajectory detector (using the data-boosting technique) are integrated to form a united detector. Such a detector deals with different types of anomalous trajectories in a hierarchical order. The experimental results show that all proposed detectors can effectively detect anomalous trajectories in the test phase.

Impurity profiling and chemometric analysis of methamphetamine seizures in Korea

  • Shin, Dong Won;Ko, Beom Jun;Cheong, Jae Chul;Lee, Wonho;Kim, Suhkmann;Kim, Jin Young
    • 분석과학
    • /
    • 제33권2호
    • /
    • pp.98-107
    • /
    • 2020
  • Methamphetamine (MA) is currently the most abused illicit drug in Korea. MA is produced by chemical synthesis, and the final target drug that is produced contains small amounts of the precursor chemicals, intermediates, and by-products. To identify and quantify these trace compounds in MA seizures, a practical and feasible approach for conducting chromatographic fingerprinting with a suite of traditional chemometric methods and recently introduced machine learning approaches was examined. This was achieved using gas chromatography (GC) coupled with a flame ionization detector (FID) and mass spectrometry (MS). Following appropriate examination of all the peaks in 71 samples, 166 impurities were selected as the characteristic components. Unsupervised (principal component analysis (PCA), hierarchical cluster analysis (HCA), and K-means clustering) and supervised (partial least squares-discriminant analysis (PLS-DA), orthogonal partial least squares-discriminant analysis (OPLS-DA), support vector machines (SVM), and deep neural network (DNN) with Keras) chemometric techniques were employed for classifying the 71 MA seizures. The results of the PCA, HCA, K-means clustering, PLS-DA, OPLS-DA, SVM, and DNN methods for quality evaluation were in good agreement. However, the tested MA seizures possessed distinct features, such as chirality, cutting agents, and boiling points. The study indicated that the established qualitative and semi-quantitative methods will be practical and useful analytical tools for characterizing trace compounds in illicit MA seizures. Moreover, they will provide a statistical basis for identifying the synthesis route, sources of supply, trafficking routes, and connections between seizures, which will support drug law enforcement agencies in their effort to eliminate organized MA crime.

소프트 컴퓨팅에 의한 지능형 주행 판단 시스템 (A Judgment System for Intelligent Movement Using Soft Computing)

  • 최우경;서재용;김성현;유성욱;전홍태
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.544-549
    • /
    • 2006
  • 본 논문은 인간의 보조 역할을 하기 위해 자율적인 명령을 내리고 사용자가 직접 제어할 수 있는 지능형 주행 판단 시스템(Judgment System for Intelligent Movement; JSIM)에 대한 연구이다. 본 논문에서는 제어 대상은 이동 로봇으로 한정한다. 이동 로봇은 지능형 주행 판단 모듈을 휴대한 사용자에게 영상정보와 초음파 센서 정보를 제공하고 가이드 역할을 수행한다. 그리고 PDA와 센서박스로 구성된 지능형 주행 판단 시스템은 이동로봇으로부터 얻은 정보와 사용자 명령을 입력으로 사용하는 소프트 컴퓨팅 기법을 이용하여 이동로봇의 속도와 방향을 결정하고 다양한 기능을 수행하도록 로봇을 원격으로 제어한다. 본 논문에서는 몸에 착용하고 주변장치들과 통신을 하며 지능적 판단을 할 수 있는 지능형 주행 판단시스템을 구성하고 실제 환경에서 지능적 판단 알고리즘 적용과 이동로봇을 제어하는 시스템을 구현하여 제안한 시스템의 실현 가능성을 검증한다. 지능 알고리즘은 계층적 퍼지 구조와 신경망을 융합한 구조이다.

광학영상에서의 해빙종류 분류 연구 (Sea Ice Type Classification with Optical Remote Sensing Data)

  • 지준화;김현철
    • 대한원격탐사학회지
    • /
    • 제34권6_2호
    • /
    • pp.1239-1249
    • /
    • 2018
  • 광학 위성영상은 레이더 영상에 비해 시각적으로 친숙한 영상을 제공한다. 하지만해빙종류에 대한 구분은 분광학적으로 쉽지 않아 기존 기계학습에서 주로 사용하는 분광정보를 이용한 분류기법을 이용했을 경우 광학영상에서 해빙종류의 구분은 매우 어렵다. 본 연구에서는 분광정보 기반의 분류모델이 아닌 딥러닝 기반 분류기법인 semantic segmentation을 이용하여 계층적, 공간적 패턴을 학습하여 해빙종류 분류를 수행하였다. 또한 주기적으로 획득되는 광학위성자료에 비해 감독분류에서 매우 중요한 양질의 레이블 자료는 수집하는데 있어 높은 시간 및 노동 비용이 소모된다. 본 연구에서는 부족한 레이블 자료로 인해 어려운 다중영상에 대한 감독분류 문제를 준지도학습과 능동학습의 결합을 통해 해결을 시도 하였다. 이를 통해 레이블 되지 않은 새로운 영상자료로부터 추가적인 레이블을 스스로 학습하여 분류모델을 강화할 수 있었으며, 이는 향후 광학영상 기반의 운영 가능한 해빙종류 산출물 개발에도 적용될 수 있을 것으로 기대된다.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

셋톱박스 오디언스 타겟팅을 위한 세션 기반 개인화 추천 시스템 개발 (Personalized Session-based Recommendation for Set-Top Box Audience Targeting)

  • 차지수;정구섭;김우영;양재원;백상덕;이원준;장서호;박태준;정찬우;김우주
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.323-338
    • /
    • 2023
  • 셋톱박스 오디언스(TV 시청자) 타겟팅의 핵심은 오디언스의 시청패턴을 분석하여 광고의 효과성이 높을 것으로 예상되는 오디언스에게 맞춤형 광고를 내보내는 것이다. 세션 기반 추천 시스템은 인터넷 광고 추천, 유저 검색 기록 기반 추천 등에 많이 이용되고 있지만, TV 광고의 측면에서 셋톱박스 데이터 수집의 어려움을 이유로 연구하기에 어려움이 있었다. 또한 오디언스 개인의 식별정보가 있는 데이터에서, 오디언스의 선호가 반영되는 시청 패턴을 모델링하는 데 한계가 있었다. 따라서 본 연구에서는 한국방송광고진흥공사(KOBACO)와 방송3사(SKB, KT, LGU+)와의 협업을 통해 익명화된 오디언스 4,847명의 6개월간 시청 데이터를 확보하여 연구를 진행하였으며, 유저-세션-아이템의 계층적 구조를 가지는 개인화 세션 기반 추천 시스템을 개발하여 성능 검증을 진행하였다. 그 결과, 셋톱박스 오디언스 데이터셋과 그 외 검증을 위한 2개의 데이터셋에서 제안된 모델이 비교 대상 모델보다 높은 성능을 보이는 것을 확인하였다.