• 제목/요약/키워드: Subcellular localization

검색결과 157건 처리시간 0.041초

레이블 멱집합 분류와 다중클래스 확률추정을 사용한 단백질 세포내 위치 예측 (Prediction of Protein Subcellular Localization using Label Power-set Classification and Multi-class Probability Estimates)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2562-2570
    • /
    • 2014
  • 단백질의 기능을 유추할 수 있는 중요한 정보중의 하나는 단백질이 존재하는 세포내 위치이다. 최근에는 하나의 단백질이 동시에 존재하는 여러 세포내 위치를 예측하는 연구가 활발하다. 본 논문에서는 단백질이 존재하는 세포내의 다중위치를 예측하기 위해서 레이블 멱집합 방법을 개선한다. 레이블 멱집합 방법으로 분류한 다중위치들을 예측 확률에 따라 결합하여 최종적인 다중레이블로 분류한다. 각 다중위치에 대한 정확한 확률적 기여를 구하기 위하여 쌍별 비교와 오류정정 출력코드를 사용한 다중클래스 확률추정 방법을 적용하였다. 단백질 세포내 위치 예측 실험에 제안한 방법을 적용하여 성능이 향상됨을 보였다.

다중레이블 조합을 사용한 단백질 세포내 위치 예측 (Multi-Label Combination for Prediction of Protein Subcellular Localization)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1749-1756
    • /
    • 2014
  • 단백질이 존재하는 세포내 위치에 대한 지식은 단백질의 기능과 관련된 중요한 정보이다. 본 논문은 개선된 레이블 멱집합 다중레이블 분류방법을 제안하여 단백질이 존재하는 세포내의 다중 위치를 예측한다. 다중레이블 분류 방법 중에서 레이블 멱집합 방법은 특정 생물학적 기능을 수행하는 단백질의 세포내 위치간의 연관 관계를 효과적으로 모델링할 수 있다. 본 논문은 다중레이블을 다른 다중레이블들의 선형조합으로 나타낼 때의 조합가중치를 제약조건이 있는 최적화를 통하여 구하고, 이를 사용하여 여러 다중레이블의 예측 확률들을 조합하여 최종적인 예측을 수행한다. 인간 단백질 자료에 대한 실험에서 제안한 방법이 다른 단백질 세포내 위치 예측 방법에 비하여 높은 성능을 보였다. 이는 제안한 방법이 레이블 멱집합 방법에서 사용되는 다중레이블들내에 존재하는 중복 정보를 이용하여 다중 레이블의 예측확률을 성공적으로 강화할 수 있기 때문이다.

구문 의존 경로에 기반한 단백질의 세포 내 위치 인식 (Detection of Protein Subcellular Localization based on Syntactic Dependency Paths)

  • 김미영
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.375-382
    • /
    • 2008
  • 단백질의 세포 내 위치를 인식하는 것은 생물학 현상의 기술에 있어서 필수적이다. 생물학 문서의 양이 늘어남에 따라, 단백질의 세포 내 위치 정보를 문서 내용으로부터 얻기 위한 연구들이 많이 이루어졌다. 기존의 논문들은 문장의 구문 정보를 이용하여 정보를 얻고자 하였으며, 언어학적 정보가 단백질의 세포 내 위치를 인식하는 데 유용하다고 주장하고 있다. 그러나, 이전의 시스템들은 구문 정보를 얻기 위해 부분 구문분석기만을 사용하였고 재현율이 좋지 못했다. 그러므로 단백질의 세포 내 위치 정보를 얻기 위해 전체 구문분석기를 사용할 필요가 있다. 또한, 더 많은 언어학적 정보를 위해 의미 정보 또한 사용이 가능하다. 단백질의 세포 내 위치 정보를 인식하는 성능을 향상시키기 위하여, 본 논문은 전체 구문분석기와 어휘망(WordNet)을 기반으로 한 방법을 제안한다. 첫 번째 단계에서, 각 단백질 단어로부터 그 단백질의 위치후보에까지 이르는 구문 의존 경로를 구축한다. 두 번째 단계에서, 구문의존 경로의 루트 정보를 추출한다. 마지막으로, 단백질 부분트리와 위치 부분트리의 구문-의미 패턴을 추출한다. 구문 의존 경로의 루트와 부분트리로부터 구문태그와 구문방향을 구문 정보로서 추출하고, 각 노드 단어의 의미태그를 의미 정보로서 추출한다. 의미태그로는 어휘망의 동의어 집합(synset)을 사용한다. 학습데이터에서 추출한 루트 정보와 부분트리의 구문-의미 패턴에 따라서, 실험데이터에서 (단백질, 위치) 쌍들을 추출했다. 어떤 생물학적 지식 없이, 본 논문의 방법은 메드라인(Medline) 요약 데이터를 사용한 실험 결과에서 학습데이터에 대해 74.53%의 조화평균(F-measure), 실험데이터에 대해서는 58.90%의 조화평균을 보였다. 이 실험은 기존의 방법들보다 12-25%의 성능향상을 보였다.

Visualization of Multicolored in vivo Organelle Markers for Co-Localization Studies in Oryza sativa

  • Dangol, Sarmina;Singh, Raksha;Chen, Yafei;Jwa, Nam-Soo
    • Molecules and Cells
    • /
    • 제40권11호
    • /
    • pp.828-836
    • /
    • 2017
  • Eukaryotic cells consist of a complex network of thousands of proteins present in different organelles where organelle-specific cellular processes occur. Identification of the subcellular localization of a protein is important for understanding its potential biochemical functions. In the post-genomic era, localization of unknown proteins is achieved using multiple tools including a fluorescent-tagged protein approach. Several fluorescent-tagged protein organelle markers have been introduced into dicot plants, but its use is still limited in monocot plants. Here, we generated a set of multicolored organelle markers (fluorescent-tagged proteins) based on well-established targeting sequences. We used a series of pGWBs binary vectors to ameliorate localization and co-localization experiments using monocot plants. We constructed different fluorescent-tagged markers to visualize rice cell organelles, i.e., nucleus, plastids, mitochondria, peroxisomes, golgi body, endoplasmic reticulum, plasma membrane, and tonoplast, with four different fluorescent proteins (FPs) (G3GFP, mRFP, YFP, and CFP). Visualization of FP-tagged markers in their respective compartments has been reported for dicot and monocot plants. The comparative localization of the nucleus marker with a nucleus localizing sequence, and the similar, characteristic morphology of mCherry-tagged Arabidopsis organelle markers and our generated organelle markers in onion cells, provide further evidence for the correct subcellular localization of the Oryza sativa (rice) organelle marker. The set of eight different rice organelle markers with four different FPs provides a valuable resource for determining the subcellular localization of newly identified proteins, conducting co-localization assays, and generating stable transgenic localization in monocot plants.

Differential Subcellular Localization of Ribosomal Protein L7 Paralogs in Saccharomyces cerevisiae

  • Kim, Tae-Youl;Ha, Cheol Woong;Huh, Won-Ki
    • Molecules and Cells
    • /
    • 제27권5호
    • /
    • pp.539-546
    • /
    • 2009
  • In Saccharomyces cerevisiae, ribosomal protein L7, one of the ~46 ribosomal proteins of the 60S subunit, is encoded by paralogous RPL7A and RPL7B genes. The amino acid sequence identity between RPl7a and RPl7b is 97 percent; they differ by only 5 amino acid residues. Interestingly, despite the high sequence homology, Rpl7b is detected in both the cytoplasm and the nucleolus, whereas Rpl7a is detected exclusively in the cytoplasm. A site-directed mutagenesis experiment revealed that the change in the amino acid sequence of Rpl7b does not influence its subcellular localization. In addition, introns of RPL7A and RPL7B did not affect the subcellular localization of Rpl7a and Rpl7b. Remarkably, Rpl7b was detected exclusively in the cytoplasm in rpl7a knockout mutant, and overexpression of Rpl7a resulted in its accumulation in the nucleolus, indicating that the subcellular localization of Rpl7a and Rpl7b is influenced by the intracellular level of Rpl7a. Rpl7b showed a wide range of localization patterns, from exclusively cytoplasmic to exclusively nucleolar, in knockout mutants for some rRNA-processing factors, nuclear pore proteins, and large ribosomal subunit assembly factors. Rpl7a, however, was detected exclusively in the cytoplasm in these mutants. Taken together, these results suggest that although Rpl7a and Rpl7b are paralogous and functionally replaceable with each other, their precise physiological roles may not be identical.

Determination of subcellular localization of Betanodavirus B2

  • 김영미;차승주;문창훈;도정완;박정우
    • 한국양식학회:학술대회논문집
    • /
    • 한국양식학회 2006년도 수산관련학회 공동학술대회 발표요지집
    • /
    • pp.476-478
    • /
    • 2006
  • To analyze subcellular localization of betanodavirus protein B2, a plasmid expressing Betanodavirus protein B2 fused to enhanced green fluorescent protein (EGFP-Nl) was constructed. The transient expression of full-length B2 fused to EGFP in GF cells confirmed the equal distribution of protein B2 between cytoplasm and nucleus. However, transfection of N-terminal half of the B2 revealed that this truncated form predominantly localized to the cytoplasm. By using several deletion mutants and point mutants, we determined the regions and/or motif responsible for the subcellular localization of betanodavirus.

  • PDF

A novel method for predicting protein subcellular localization based on pseudo amino acid composition

  • Ma, Junwei;Gu, Hong
    • BMB Reports
    • /
    • 제43권10호
    • /
    • pp.670-676
    • /
    • 2010
  • In this paper, a novel approach, ELM-PCA, is introduced for the first time to predict protein subcellular localization. Firstly, Protein Samples are represented by the pseudo amino acid composition (PseAAC). Secondly, the principal component analysis (PCA) is employed to extract essential features. Finally, the Elman Recurrent Neural Network (RNN) is used as a classifier to identify the protein sequences. The results demonstrate that the proposed approach is effective and practical.

Subcellular Localization of Diacylglycerol-responsive Protein Kinase C Isoforms in HeLa Cells

  • Kazi, Julhash U.;Kim, Cho-Rong;Soh, Jae-Won
    • Bulletin of the Korean Chemical Society
    • /
    • 제30권9호
    • /
    • pp.1981-1984
    • /
    • 2009
  • Subcellular localization of protein kinase often plays an important role in determining its activity and specificity. Protein kinase C (PKC), a family of multi-gene protein kinases has long been known to be translocated to the particular cellular compartments in response to DAG or its analog phorbol esters. We used C-terminal green fluorescent protein (GFP) fusion proteins of PKC isoforms to visualize the subcellular distribution of individual PKC isoforms. Intracellular localization of PKC-GFP proteins was monitored by fluorescence microscopy after transient transfection of PKC-GFP expression vectors in the HeLa cells. In unstimulated HeLa cells, all PKC isoforms were found to be distributed throughout the cytoplasm with a few exceptions. PKC$\theta$ was mostly localized to the Golgi, and PKC$\gamma$, PKC$\delta$ and PKC$\eta$ showed cytoplasmic distribution with Golgi localization. DAG analog TPA induced translocation of PKC-GFP to the plasma membrane. PKC$\alpha$, PKC$\eta$ and PKC$\theta$ were also localized to the Golgi in response to TPA. Only PKC$\delta$ was found to be associated with the nuclear membrane after transient TPA treatment. These results suggest that specific PKC isoforms are translocated to different intracellular sites and exhibit distinct biological effects.

Protein subcellular localization classification from multiple subsets of amino acid pair compositions

  • Tung, Thai Quang;Lim, Jong-Tae;Lee, Kwang-Hyung;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.101-106
    • /
    • 2004
  • Subcellular localization is a key functional char acteristic of proteins. With the number of sequences entering databanks rapidly increasing, the importance of developing a powerful tool to identify protein subcellular location has become self-evident. In this paper, we introduce a novel method for predic ting protein subcellular locations from protein sequences. The main idea was motivated from the observation that amino acid pair composition data is redundant. By classifying from multiple feature subsets and using many kinds of amino acid pair composition s, we forced the classifiers to make uncorrelated errors. Therefore when we combined the predictors using a voting scheme, the prediction accuracy c ould be improved. Experiment was conducted on several data sets and significant improvement has been achieve d in a jackknife test.

  • PDF

단백질의 세포내 위치 예측을 위한 다중레이블 분류 방법의 성능 비교 (A Performance Comparison of Multi-Label Classification Methods for Protein Subcellular Localization Prediction)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.992-999
    • /
    • 2014
  • 단백질이 존재하는 세포내의 다중 위치를 정확하게 예측하기 위하여 다중레이블 학습 방법을 광범위하게 비교한다. 이를 위하여 다중레이블 분류의 접근 방법인 알고리즘 적응, 문제 변환, 메타 학습의 여러 방법을 비교 평가한다. 다양한 관점에서 다중레이블 분류 방법의 특성을 평가하기 위하여 12가지 평가 척도를 사용하였고, 최적의 성능을 보이는 방법을 찾기 위하여 새로운 요약 척도를 사용하였다. 비교 실험 결과, 흔하지 않은 다중레이블 집합을 가지치기 하는 멱집합 방법과, 관련 레이블들을 추가된 특징으로 나타내는 분류기-체인 방법의 성능이 높았다. 또한, 이들 방법들로 구성된 여러 개의 분류기를 조합하면 더욱 성능이 향상되었다. 즉, 세포내 위치간의 연관관계를 사용하는 것이 예측에 효과적인데, 특정 생물학적 기능을 수행하는 단백질의 세포내 위치들의 관계는 독립적이지 않고 서로 관련되어 있기 때문이라 판단된다.