• Title/Summary/Keyword: 상호예측

Search Result 1,753, Processing Time 0.029 seconds

A Parallel System for predicting protein-protein interactions (병렬 단백질 상호작용 예측 시스템)

  • 김세영;정유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.709-711
    • /
    • 2004
  • 최근 단백질간의 상호작용의 중요성의 이해와 함께 축적되어 가는 단백질 정보들 간의 상호작용을 예측하기 위하여 통계학적 모델인 Support Vector Machine(SVM)을 사용한 예측 실험이 활발하다. 하지만 이는 거대한 생물 데이터를 처리하기 위해 많은 연산시간을 필요로 한다. 즉, 방대하게 존재하는 데이터를 처리하기 위해 SVM을 통한 실험은 정확한 결과뿐만 아니라 빠른 처리속도를 요구하게 되었다. 따라서 본 논문에서는 SVM의 개선을 통해 빠른 처리속도로 데이터를 처리하는 incremental SVM과 이를 병렬화 하여 더욱 빠른 처리시간을 가지는 Parallel SVM(PSVM)을 소개하고 실험해 본다. 즉, 단백질 상호작용에 사용되어지는 데이터를 PSVM을 사용한 실험을 통하여 정확성과 처리속도를 측정, 비교함으로써 단백질 상호작용 예측에 적합한지를 검증해본다.

  • PDF

Prediction of Protein-Protein Interaction Sites Based on 3D Surface Patches Using SVM (SVM 모델을 이용한 3차원 패치 기반 단백질 상호작용 사이트 예측기법)

  • Park, Sung-Hee;Hansen, Bjorn
    • The KIPS Transactions:PartD
    • /
    • v.19D no.1
    • /
    • pp.21-28
    • /
    • 2012
  • Predication of protein interaction sites for monomer structures can reduce the search space for protein docking and has been regarded as very significant for predicting unknown functions of proteins from their interacting proteins whose functions are known. In the other hand, the prediction of interaction sites has been limited in crystallizing weakly interacting complexes which are transient and do not form the complexes stable enough for obtaining experimental structures by crystallization or even NMR for the most important protein-protein interactions. This work reports the calculation of 3D surface patches of complex structures and their properties and a machine learning approach to build a predictive model for the 3D surface patches in interaction and non-interaction sites using support vector machine. To overcome classification problems for class imbalanced data, we employed an under-sampling technique. 9 properties of the patches were calculated from amino acid compositions and secondary structure elements. With 10 fold cross validation, the predictive model built from SVM achieved an accuracy of 92.7% for classification of 3D patches in interaction and non-interaction sites from 147 complexes.

Fucntional Prediction Method for Proteins by using Modified Chi-square Measure (보완된 카이-제곱 기법을 이용한 단백질 기능 예측 기법)

  • Kang, Tae-Ho;Yoo, Jae-Soo;Kim, Hak-Yong
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.5
    • /
    • pp.332-336
    • /
    • 2009
  • Functional prediction of unannotated proteins is one of the most important tasks in yeast genomics. Analysis of a protein-protein interaction network leads to a better understanding of the functions of unannotated proteins. A number of researches have been performed for the functional prediction of unannotated proteins from a protein-protein interaction network. A chi-square method is one of the existing methods for the functional prediction of unannotated proteins from a protein-protein interaction network. But, the method does not consider the topology of network. In this paper, we propose a novel method that is able to predict specific molecular functions for unannotated proteins from a protein-protein interaction network. To do this, we investigated all protein interaction DBs of yeast in the public sites such as MIPS, DIP, and SGD. For the prediction of unannotated proteins, we employed a modified chi-square measure based on neighborhood counting and we assess the prediction accuracy of protein function from a protein-protein interaction network.

Estimation of Maximum Fresh Snow Depth using Regression Analysis (회귀분석을 이용한 최심신적설 추정식 개발)

  • Park, Heeseong;Chung, Gunhui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.205-205
    • /
    • 2016
  • 우리나라의 겨울철 자연재해 중 대설에 의한 피해가 발생하는 빈도가 증가하고 있는 가운데 그 피해를 예측하고 대비하기 위한 연구들이 다수 진행되고 있다. 강설은 일단위로 측정하며, 매일 새롭게 내린 강설의 양인 최심신적설과 기존에 녹지 않고 쌓여 있던 깊이까지를 고려한 최심적설로 구분된다. 우리나라의 경우에는 갑작스럽게 내린 폭설에 의한 피해가 대부분이므로 최심신적설량을 예측하는 것이 매우 중요하다. 이에 본 연구에서는 다중회귀분석을 이용해 우리나라의 최심신적설량을 추정하기 위한 식을 개발하였다. 다중회귀분석을 위한 독립변수로는 해당 일에 예측된 강수량, 일평균기온, 일최고기온, 일최저기온을 사용하였으며, 강수량과 일평균기온의 상호작용을 고려할 수 있도록 모형을 구성하였다. 모형의 개발에는 전국 74개 기상관측소의 최심신적설 자료를 관측소 단위로 전체 자료의 2/3을 무작위로 추출하여 이용하였으며, 추출되지 않고 남은 1/3의 자료를 이용해 모형에 대한 검증을 실시하였다. 그 결과 상호작용항이 포함되지 않은 다중선형회귀모형에 비해 상호작용을 고려한 다중회귀모형의 예측력이 훨씬 우수하게 나타났다. 강수량과 기온이 정확하게 예측된다면 개발된 추정식을 이용해 간편하게 최심신적설량을 예측할 수 있어, 폭설에 대한 대비에 활용할 수 있을 것으로 판단된다.

  • PDF

Prediction of Drug-Drug Interaction Based on Deep Learning Using Drug Information Document Embedding (약물 정보 문서 임베딩을 이용한 딥러닝 기반 약물 간 상호작용 예측)

  • Jung, Sun-woo;Yoo, Sun-yong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.276-278
    • /
    • 2022
  • All drugs have a specific action in the body, and in many cases, drugs are combinated due to complications or new symptoms during existing drug treatment. In this case, unexpected interactions may occur within the body. Therefore, predicting drug-drug interactions is a very important task for safe drug use. In this study, we propose a deep learning-based predictive model that learns using drug information documents to predict drug interactions that may occur when using multiple drugs. The drug information document was created by combining several properties such as the drug's mechanism of action, toxicity, and target using DrugBank data. And drug information document is pair with another drug documents and used as an input to a deep learning-based predictive model, and the model outputs the interaction between the two drugs. This study can be used to predict future interactions between new drug pairs by analyzing the differences in experimental results according to changes in various conditions.

  • PDF

Application on Prediction of Stream Flow using Artificial Neural Network with Mutual Information and Wavelet Transform (상호정보량기법과 웨이블렛변환을 적용한 인공신경망의 하천유량 예측 활용)

  • Ryu, Yong-Jun;Jung, Yong-Hun;Shin, Ju-Young;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.116-116
    • /
    • 2012
  • 하천유역 내의 인자를 이용하여 댐의 하천유량(stream flow)을 예측하는 일은 수문특성의 연구와 자연재해에 대한 대비 및 수공구조물과 방재시설의 설계 시 중요한 역할을 한다. 이러한 연구는 과거부터 활발히 이루어졌으며, 아직도 보다 높은 정확도의 결과를 얻기 위해 많은 연구들이 이루어지고 있다. 특히 기존의 유역 내 자료를 통해 비선형적 모델인 인공신경망(artificial neural network)을 이용한 하천유량을 예측하는 연구 역시 활발히 이루어지고 있다. 본 연구의 목적은 여러 유역인자들 중 하천유량에 가장 영향을 미치는 변수를 추출하고 보다 정확한 예측모델을 구축하는 것이다. 기존의 입력자료 선정기법중의 하나인 상호정보량(mutual information)과 수문기상자료의 비선형 동역학적 성분을 추출하는 웨이블렛 변환(wavelet transform)을 사용하여 인공신경망에 적용시켰다. 인공신경망을 적용하는 경우, 수문자료에 있어서 변수의 선택과 자료의 상태가 강우예측의 결과에 큰 영향을 미친다. 이러한 변수의 선택에 있어서 상호정보량을 바탕으로 한 인공신경망 입력변수 선택기법이 많이 사용되고 있다. 일반적으로 시계열자료는 경향성(trend), 주기성(periodicity) 및 추계학적 성분(stochastic component)의 선형조합으로 가정될 수 있으며, 특히 경향성과 주기성은 시계열 모형을 위해 제거되어야 할 결정론적 성분으로 취급한다. 즉. 수문 기상자료에 포함되어 있는 경향성과 주기성과 같은 비선형 동역학적 잡음(nonlinear dynamical noise)을 제거하고 입력자료의 카오스적 거동을 보이는 성분을 분리하기 위해 웨이블렛 변환을 사용하였다. 대상유역은 한강 유역에 포함되어 있는 충주댐으로 선택하였다. 유역 내 다양한 인자들과 하천유량사이의 상호정보량을 구해 영향력이 가장 큰 변수를 추출하고, 그 자료를 웨이블렛 변환을 적용하여 인공신경망의 입력자료로 사용하였다. 본 논문에서는 위와 같은 과정을 이용해 추정한 하천유량 결과와 기존의 방법인 상호정보량을 이용해 인공신경망을 적용한 결과를 실제자료와 비교하였다.

  • PDF

A Homology-Based Prediction of Biological Complexes in a Protein-Protein Interaction Network (단백질 상호작용 네트워크예서 상동성 기반 바이오 콤플렉스 예측)

  • Choi Jae-Hun;Park Jong-Min;Park Soo-Jun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.64-66
    • /
    • 2006
  • 본 논문에서는 생물학적 실험에 의해 추출된 이종의 단백질 콤플렉스를 통해 대상 종의 콤플렉스를 단백질 상호적용 네트워크에서 예측할 수 있는 방법을 제안한다. 이 예측은 먼저 이종사이에 단백질의 비교를 통해 상동성을 색인한 다음, 이 상동성을 이용하여 이종의 콤플렉스를 대상 종으로 변형하고 그 형태를 단백질 상호작용 네트워크에서 탐색하는 과정으로 수행된다. Swiss-Prot 데이터 베이스의 단백질들을 대상으로 상동성 색인을 색인하였으며, 콤플렉스 형태를 분석하기 위해 DIP의 단백질 상호작용 네트워크를 이용하였다.

  • PDF

Prediction of Implicit Protein - Protein Interaction Using Optimal Associative Feature Rule (최적 연관 속성 규칙을 이용한 비명시적 단백질 상호작용의 예측)

  • Eom, Jae-Hong;Zhang, Byoung-Tak
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.4
    • /
    • pp.365-377
    • /
    • 2006
  • Proteins are known to perform a biological function by interacting with other proteins or compounds. Since protein interaction is intrinsic to most cellular processes, prediction of protein interaction is an important issue in post-genomic biology where abundant interaction data have been produced by many research groups. In this paper, we present an associative feature mining method to predict implicit protein-protein interactions of Saccharomyces cerevisiae from public protein interaction data. We discretized continuous-valued features by maximal interdependence-based discretization approach. We also employed feature dimension reduction filter (FDRF) method which is based on the information theory to select optimal informative features, to boost prediction accuracy and overall mining speed, and to overcome the dimensionality problem of conventional data mining approaches. We used association rule discovery algorithm for associative feature and rule mining to predict protein interaction. Using the discovered associative feature we predicted implicit protein interactions which have not been observed in training data. According to the experimental results, the proposed method accomplished about 96.5% prediction accuracy with reduced computation time which is about 29.4% faster than conventional method with no feature filter in association rule mining.

G 단백질 연결 수용체계(GPCR system)에서의 정전기적 포텐셜(Electrostatic Potential)에 따른 효과를 고려한 단백질과 리간드의 상호작용 예측(protein-ligand interaction prediction)

  • Choe, Gyu-Hong;Sin, Ung-Hui;Lee, Dong-Seon
    • Proceeding of EDISON Challenge
    • /
    • 2013.04a
    • /
    • pp.125-137
    • /
    • 2013
  • 2012년 G 단백질 연결 수용체(G-Protein Coupled Receptors ; GPCR) 연구가 노벨 화학상을 받았다. 상당히 많은 병과 관련되어 있어 잠재력이 크고, 많은 연구가 진행 중이다. 현재 리간드와 단백질간의 정전기적 포텐셜 연구를 통한 예측 연구가 진행되고 있지만, GPCR과 리간드 간의 연구에서 아직 리간드의 전하를 통한 단백질과 리간드간의 상호작용 예측 연구가 되어 있지 않다. 그렇기 때문에 이번 연구에서는 8가지 방법으로 전하(charge)를 띠게 하여서 단백질과 리간드의 상호작용을 계산을 통하여 예측하여 보았다.

  • PDF

Attention Network For Click-through Rate Prediction Based On MovieLens-1M, Avazu4, Criteo Datasets (MovieLens-1M, Avazu4, Criteo 데이터셋에 기반한 클릭률 예측을 위한 어텐션 네트워크)

  • Zijian An;Inwhee Joe
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.522-523
    • /
    • 2023
  • CTR(Click Through Rate) 예측은 사용자가 광고나 아이템을 클릭할 확률을 예측하는 데 사용되는 용어로, 광고 분야에서 중요한 연구 분야로 자리 잡았다. 인터넷 데이터의 양이 증가함에 따라, 전통적인 피쳐 엔지니어링의 인건비는 계속해서 상승하고 있다. 특징 상호 작용에 대한 의존도를 줄이기 위해, 본 논문은 TMH(Two-Tower Multi-Headed Attention Neural Network) 접근법이라고 하는 명시적인 특징 상호 작용과 암시적인 특징 상호 작용을 결합한 융합 모델을 제안한다. CTR 예측에서 TMH 의 효과를 평가하기 위해 3 개의 실제 데이터 세트를 사용하여 많은 수의 실험을 수행하였다. 성능은 3 개의 데이터 세트에서 0.12%, 0.41% 및 0.68%으로 향상되었다.