• Title/Summary/Keyword: Generative Topographic Mapping

Search Result 8, Processing Time 0.02 seconds

Pattern Classification by Using Bayesian GTM (베이지안 GTM을 이용한 패턴 분류)

  • 최준혁;김중배;김대수;임기욱
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.287-290
    • /
    • 2001
  • Bishop이 제안한 generative Topographic Mapping(GTM)은 Kohonen이 제안한 자율 학습 신경망인 Self Organizing Maps(SOM)의 확률적 버전이다. 본 논문에서는 이러한 GTM 모형에 베이지안 추론을 결합하여 작은 오분류율을 가지는 분류 알고리즘인 베이지안 GTM(Bayesian GTM)을 제안한다. 이 방법은 기존의 GTM의 빠른 계산 처리 능력과 베이지안 추론을 이용하여 기존의 분류 알고리즘보다 우수한 결과가 나타남을 실험을 통하여 확인하였다.

  • PDF

Bayesian Model for Probabilistic Unsupervised Learning (확률적 자율 학습을 위한 베이지안 모델)

  • 최준혁;김중배;김대수;임기욱
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.9
    • /
    • pp.849-854
    • /
    • 2001
  • GTM(Generative Topographic Mapping) model is a probabilistic version of the SOM(Self Organizing Maps) which was proposed by T. Kohonen. The GTM is modelled by latent or hidden variables of probability distribution of data. It is a unique characteristic not implemented in SOM model, and, therefore, it is possible with GTM to analyze data accurately, thereby overcoming the limits of SOM. In the present investigation we proposed a BGTM(Bayesian GTM) combined with Bayesian learning and GTM model that has a small mis-classification ratio. By combining fast calculation ability and probabilistic distribution of data of GTM with correct reasoning based on Bayesian model, the BGTM model provided improved results, compared with existing models.

  • PDF

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2001.10a
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

Learning Graphical Models for DNA Chip Data Mining

  • Zhang, Byoung-Tak
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2000.11a
    • /
    • pp.59-60
    • /
    • 2000
  • The past few years have seen a dramatic increase in gene expression data on the basis of DNA microarrays or DNA chips. Going beyond a generic view on the genome, microarray data are able to distinguish between gene populations in different tissues of the same organism and in different states of cells belonging to the same tissue. This affords a cell-wide view of the metabolic and regulatory processes under different conditions, building an effective basis for new diagnoses and therapies of diseases. In this talk we present machine learning techniques for effective mining of DNA microarray data. A brief introduction to the research field of machine learning from the computer science and artificial intelligence point of view is followed by a review of recently-developed learning algorithms applied to the analysis of DNA chip gene expression data. Emphasis is put on graphical models, such as Bayesian networks, latent variable models, and generative topographic mapping. Finally, we report on our own results of applying these learning methods to two important problems: the identification of cell cycle-regulated genes and the discovery of cancer classes by gene expression monitoring. The data sets are provided by the competition CAMDA-2000, the Critical Assessment of Techniques for Microarray Data Mining.

  • PDF

Extrapolation of Hepatic Concentrations of Industrial Chemicals Using Pharmacokinetic Models to Predict Hepatotoxicity

  • Yamazaki, Hiroshi;Kamiya, Yusuke
    • Toxicological Research
    • /
    • v.35 no.4
    • /
    • pp.295-301
    • /
    • 2019
  • In this review, we describe the absorption rates (Caco-2 cell permeability) and hepatic/plasma pharmacokinetics of 53 diverse chemicals estimated by modeling virtual oral administration in rats. To ensure that a broad range of chemical structures is present among the selected substances, the properties described by 196 chemical descriptors in a chemoinformatics tool were calculated for 50,000 randomly selected molecules in the original chemical space. To allow visualization, the resulting chemical space was projected onto a two-dimensional plane using generative topographic mapping. The calculated absorbance rates of the chemicals based on cell permeability studies were found to be inversely correlated to the no-observed-effect levels for hepatoxicity after oral administration, as obtained from the Hazard Evaluation Support System Integrated Platform in Japan (r = -0.88, p < 0.01, n = 27). The maximum plasma concentrations and the areas under the concentration-time curves (AUC) of a varied selection of chemicals were estimated using two different methods: simple one-compartment models (i.e., high-throughput toxicokinetic models) and simplified physiologically based pharmacokinetic (PBPK) modeling consisting of chemical receptor (gut), metabolizing (liver), and central (main) compartments. The results obtained from the two methods were consistent. Although the maximum concentrations and AUC values of the 53 chemicals roughly correlated in the liver and plasma, inconsistencies were apparent between empirically measured concentrations and the PBPK-modeled levels. The lowest-observed-effect levels and the virtual hepatic AUC values obtained using PBPK models were inversely correlated (r = -0.78, p < 0.05, n = 7). The present simplified PBPK models could estimate the relationships between hepatic/plasma concentrations and oral doses of general chemicals using both forward and reverse dosimetry. These methods are therefore valuable for estimating hepatotoxicity.

Design and Implementation of MPEG-21 Testbed (MPEG-21 Testbed의 설계 및 구현)

  • 손정화;권혁민;손현식;조영란;김만배
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.139-143
    • /
    • 2002
  • 1990 년대 후반부터 다양한 디지털 통신망을 이용하여 멀티미디어 컨텐츠 서비스가 가능하게 되었다. 하지만, 멀티미디어 컨텐츠의 전달 및 이용을 위한 기반 구조들의 독자적 발전 및 다양한 통합적 관리 체계 시스템으로 인해, 멀티미디어 컨텐츠 표현 방식의 호환성 문제, 혼재하는 네트워크 전달 방식과 단말 방식의 호환성 문제 등의 잠재적인 문제점이 발생한다. 이런 문제의 대안으로 현재 존재하는 기술 및 기반 구조들 사이의 연동을 통한 큰 프레임워크인 MPEG-21이 진행 중이다. MPEG-21 의 목표는 표준화 목표를 구체화하는 것부터 진행하여, 최종적으로 “다양한 네트워크 환경과 단말기에 있어서, 투명하고 통합적으로 멀티미디어 자원의 이용을 가능하게 하는 것”이다. 본 논문에서는 현재 표준화 작업이 진행 중인 MPEG-21 을 기반으로 하는 Testbed를 제안한다. Testbed는 server, client, DIA(Digital Item Adaptation) 의 세 모듈로 구성된다. Server 의 역할은 멀티미디어 컨텐츠를 Digital Item(DI)으로 생성하고, client 가 DI를 요구할 경우 DIA 모듈을 통해서 변환된 DI를 client 에게 제공한다. DIA 모듈은 server 에서 동작되며 client로부터 요청된 DI를 분석하고 client로부터 전송된 환경 정보를 이용하여 client 환경에 적합하게 변환된 (adapted) DI를 생성하는 것이 주 기능이다. Client 는 server 에 저장되어 있는 DI를 선택하고 user preference, terminal capability 등의 필요한 정보를 server로 전송한다. Testbed 에서는 스포츠 경기의 동영상, 정지 영상, 경기 내용 역사를 기록한 파일 등의 DI를 이용한다. 표현 언어는 XML이며, HTTP 기반의 Web 환경에서 구동되도록 설계된다.스템 사이에 의미 있는 데이터 전송, 지식 획득을 위해 정보 기술 분야에서 활용해야 할 영역으로 XML Web Services, Multi-agent Systems, 전문가 컴뮤니티를 위한 그룹웨어 연구 개발에 관해 사례 중심으로 발표한다.다 신선한 공기를 넣어 주었을 때는 배의 발달이 많이 늦어져 배양 3주째에 다른 처리보다 배의 수가 훨씬 적었다. 체세포배가 발달하는 동안에는 산소를 많이 요구하지 않으나 성숙하는 동안에는 산소를 많이 요구하는 것으로 생각된다.적인 것으로 나타났다. 다만, 곡선형은 물론 직선형에서도 열교환 튜브의 배치밀도, 튜브 길이 및 두께 등의 변화에 따른 최적화 연구가 수반되어야 할 것으로 판단된다.에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.x factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.0$\mu$M이 적당하며, 초기배발달을 유기할 때의 효과적인 cysteamine의 농도는 25~50$\mu$M인 것으로 판단된다.N)A(N)/N을 제시하였다(A(N)=N에 대한 A값). 위의 실험식을 사용하여 헝가리산 Zempleni 시료(15%$S_{XRD}$)의 기본입자분포로부터 %$S_{XRD}$를 계산한 결과, 16%$S_{XRD}$의 결과값을 얻을 수 있었다. 따라서, 본 연구에서 도출한 관계식들이 유효함을 확인할 수 있었다.계식들이 유효함을 확인할 수 있었다.할 때 약간의 증가

  • PDF

Effect of Soil Heating on Lateral Shooting in White Spined Cucumber. (지중가온이 백침계 오이의 측지 발생에 미치는 영향)

  • 이상규;성기철;김광용;고관달
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 2001.04b
    • /
    • pp.71-72
    • /
    • 2001
  • 최근 수출오이의 재배 면적이 계속증가 추세에 있어 '99년 현재 143ha에 달하고 있다. 그러나 수출오이는 국내 오이와 재배방법이 상당히 달라 국내 오이는 주지착과형이지만 수출오이는 측지착과형으로 측지의 발생여부에 따라 수확량의 차이가 심하다. 따라서 수출오이의 성공여부는 측지발생을 어느정도 시키느냐에 달려 있다고 해도 과언이 아니다. 그런데 수출오이의 재배시기는 우리나라에서 재배환경이 가장 불량한 겨울철(10-2월)로, 저온 및 투광량 부족 등으로 인하여 측지발생율이 매우 저조하다. 따라서 본 시험은 수출오이의 측지 발생율을 높이고자 지중가온기 설치 여부에 따른 효과를 구명하고자 실시하였다. 그 결과, 생육(Table 1)은 접수의 줄기 직경이 지중가온 처리시 10.22mm로, 무가온의 8.64mm보다 굵었고, 엽장과 엽폭에 있어서도 지중가온 처리가 무가온 처리보다 좋았다. 곡과 발생수에 있어서도 지중가온 처리는 주당 0.73개가 발생하였으나, 무가온은 1.26개가 발생되어 지중가온 처리시 무가온에 비해서 생육이 좋아지고, 곡과 발생이 적었다. 주당 측지발생수(Table 2)는 지중가온구가 13.7개였고, 무가온구는 11.7개로 지중가온을 하면 측지발생수가 증가함을 알수 있었다. 또한 상품수확과수에 있어서도 지중가온구는 주당 45개인데 반해 지중무가온구는 38개였으며 따라서 전체적인 수량이 10a당 8,100kg으로, 무가온구의 6,840kg보다 18%의 증수효과가 있었다. 따라서 수출오이재배시 지중가온을 하면, 측지발생수가 증가하고 특히 장측지(Fig. 1)가 다수 발생하여 측지 수확과수가 증가하며, 곡과 등 기형과 발생이 감소하여 상품수량이 증가되므로써 기존 지중 무가온 재배에 비해 14% 소득향상 효과를 기대할 수 있다.시 생장이 둔화되었다. 밀폐시킨 삼각플라스크에서 자라는 Cell은 상태도 좋지 않고 전반적인 증식량도 적었다. Cell은 환기정도에 민감한 것으로 판단되며 삼각플라스크에서 약 35일 정도의 생장 주기를 가지는 것으로 사료된다. 배양 3주까지는 플라스틱 뚜껑으로 밀폐시킨 bottle에서 가장 많은 체세포배를 얻었다. Air filter를 달아 2일 마다 신선한 공기를 넣어 주었을 때는 배의 발달이 많이 늦어져 배양 3주째에 다른 처리보다 배의 수가 훨씬 적었다. 체세포배가 발달하는 동안에는 산소를 많이 요구하지 않으나 성숙하는 동안에는 산소를 많이 요구하는 것으로 생각된다.적인 것으로 나타났다. 다만, 곡선형은 물론 직선형에서도 열교환 튜브의 배치밀도, 튜브 길이 및 두께 등의 변화에 따른 최적화 연구가 수반되어야 할 것으로 판단된다.에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.x factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.0$\mu$M이 적당하며, 초기배발달을 유기할 때의 효과적인 cysteamine의 농도는 25~50$\mu$M인 것으로 판단된다.N)A(N)/N을 제시하였다(A(N)=N에 대한 A값). 위의 실험식을 사용하여 헝가리산 Zempleni 시료(15%$S_{XRD}$)의 기본입자분포로부터 %$S_{XRD}

  • PDF

Modeling Nutrient Uptake of Cucumber Plant Based on EC and Nutrient Solution Uptake in Closed Perlite Culture (순환식 펄라이트재배에서 EC와 양액흡수량을 이용한 오이 양분흡수 모델링)

  • 김형준;우영회;김완순;조삼증;남윤일
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 2001.04b
    • /
    • pp.75-76
    • /
    • 2001
  • 순환식 펄라이트재배에서 배액 재사용을 위한 양분흡수 모델링을 작성하고자 EC 처리(1.5, 1.8, 2.1, 2.4, 2.7 dSㆍm-1)를 수행하였다. 생육 중기까지 EC 수준에 따른 양액흡수량은 차이가 없었지만 중기 이후 EC가 높을수록 흡수량이 감소되는 경항을 보였다(Fig. 1). NO$_3$-N, P 및 K의 흡수량은 생육기간 동안 처리간 차이를 유지하였는데 N과 K는 생육 중기 이후 일정 수준을 유지하였으나 P는 생육기간 동안 다소 증가되는 경향을 보였다. S의 흡수량은 생육 중기 이후 모든 처리에서 급격한 감소를 보였으며 생육 후기에는 처리간에 차이가 없었다(Fig. 2). 오이의 무기이온 흡수율에서와 같이 흡수량에서도 EC간 차이를 보여 EC를 무기이온 흡수량을 추정하는 요소로 이용할 수 있을 것으로 생각되었다. 무기이온 흡수량은 모든 EC 처리간에 생육 초기에는 차이를 보이지 않았으나 생육중기 이후에는 뚜렷한 차이를 보인 후 생육 후기의 높은 농도에서 그 차이가 다소 감소되는 경향을 보였다. 단위일사량에 따른 양액흡수량과 EC를 주된 변수로 한 오이의 이온 흡수량 예측 회귀식을 작성하였는데 모든 무기이온 흡수량 추정식의 상관계수는 S를 제외한 모든 이온에서 높게 나타났는데 특히 N, P, K 및 Ca에서 높았다. S이온에서의 상관계수는 0.47로 낮게 나타났으나 각 이온들의 회귀식에 대한 상관계수는 모두 1% 수준에서 유의성을 보여 위의 모델식을 순환식 양액재배에서 무기이온 추정식으로 사용이 가능할 것으로 생각되었다(Table 1). 이를 이용한 실측치와의 비교는 신뢰구간 1%내에서 높은 정의상관을 보여 실제적인 적용이 가능할 것으로 생각되었다(Fig 3)..ble 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.x factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.0$\mu$M이 적당하며, 초기배발달을 유기할 때의 효과적인 cysteamine의 농도는 25~50$\mu$M인 것으로 판단된다.N)A(N)/N을 제시하였다(A(N)=N에 대한 A값). 위의 실험식을 사용하여 헝가리산 Zempleni 시료(15%

  • PDF