• 제목/요약/키워드: Subcellular location

검색결과 23건 처리시간 0.027초

단백질 서열의 n-Gram 자질을 이용한 세포내 위치 예측 (Classification Protein Subcellular Locations Using n-Gram Features)

  • 김진숙
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.12-16
    • /
    • 2007
  • 단백질의 기능은 그 기능을 발휘하는 세포내의 위치와 밀접한 연관이 있다. 따라서 새로운 단백질의 서열이 밝혀지면 이 단백질의 세포내 위치를 규명하는 것은 생물학적으로 매우 중요한 일이다. 이 논문에서는 단백질의 n-그램과 kNN (k-Nearest Neighbor) 분류기를 이용한 새로운 세포내 위치예측 방법을 다룬다. 이 방법은 입력 단백질 서열과 가장 유사한 가중치를 가지는 k개의 단백질이 가지는 세포내 위치 정보들을 취합하여 입력 단백질의 세포내 위치를 추정한다. 단백질간의 유사도 가중치는 두 단백질서열의 5-그램 자질의 유사도를 비교하여 계산된다. 단백질의 세포내 위치예측 정확도를 검증하기 위해 SWISS-PROT 단백질 데이터베이스로 부터 세포내 위치가 알려진 51,885개의 서열을 추출하여 대용량 테스트 컬렉션을 구축하였으며, 다른 연구자들이 제공하는 또 하나의 소용량 테스트 컬렉션을 실험에 사용하였다. 이 논문에서 사용한 예측방법은 대용량 테스트컬렉션에 대해 약 93%의 정확도를 보여주었으며, 소용량 데스트컬렉션을 이용하여 이전 실험과 비교하였을 때도 이 방법이 다른 시스템에 비해 성능이 우월함을 알 수 있었다.

  • PDF

Capsaicin 가수분해효소의 흰쥐 간세포내 소재확인 (Subcellular Localization of Capsaicin-Hydrolyzing Enzyme in Rat Hepatocytes)

  • 박영호;이상섭
    • 약학회지
    • /
    • 제38권1호
    • /
    • pp.12-19
    • /
    • 1994
  • Capsaicin(8-methyl-N-vanillyl-6-nonenamide) is the principal pungent component of Capsicum fruits. This work is directed to the capsaicin-hydrolyzing enzyme playing a key role in the rate limiting and critical step of capsaicin metabolism. In order to get precise information on the enzyme's subcellular location, rat liver homogenate was divided into six subcellular fractions by differential centrifugation technique: crude nuclear pellet, PNS(post nuclear supernatant) fraction, lysosomal pellet, cytosol, Tris wash fraction, micrisomes. Capsaicin-hydrolysing enzyme activity was analysed by high performance liquid chromatography(HPLC). This enzyme was found at the highest specific activity in the microsomal fraction and co-distributed with marker enzymes of the endoplasmic reticulum, NADPH-cytochrome c reductase and nucleoside diphosphatase. This is compatible with the result of ninhydrin color reaction of vanillylamine, primary metabolite of capsaicin hydrolysis, on thin layer chromatography(TLC). This enzyme is most active at pH $8.0{\sim}9.0$. Definite subcellular location of this enzyme will make it easy to proceed with further study.

  • PDF

Protein subcellular localization classification from multiple subsets of amino acid pair compositions

  • Tung, Thai Quang;Lim, Jong-Tae;Lee, Kwang-Hyung;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.101-106
    • /
    • 2004
  • Subcellular localization is a key functional char acteristic of proteins. With the number of sequences entering databanks rapidly increasing, the importance of developing a powerful tool to identify protein subcellular location has become self-evident. In this paper, we introduce a novel method for predic ting protein subcellular locations from protein sequences. The main idea was motivated from the observation that amino acid pair composition data is redundant. By classifying from multiple feature subsets and using many kinds of amino acid pair composition s, we forced the classifiers to make uncorrelated errors. Therefore when we combined the predictors using a voting scheme, the prediction accuracy c ould be improved. Experiment was conducted on several data sets and significant improvement has been achieve d in a jackknife test.

  • PDF

구문 의존 경로에 기반한 단백질의 세포 내 위치 인식 (Detection of Protein Subcellular Localization based on Syntactic Dependency Paths)

  • 김미영
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.375-382
    • /
    • 2008
  • 단백질의 세포 내 위치를 인식하는 것은 생물학 현상의 기술에 있어서 필수적이다. 생물학 문서의 양이 늘어남에 따라, 단백질의 세포 내 위치 정보를 문서 내용으로부터 얻기 위한 연구들이 많이 이루어졌다. 기존의 논문들은 문장의 구문 정보를 이용하여 정보를 얻고자 하였으며, 언어학적 정보가 단백질의 세포 내 위치를 인식하는 데 유용하다고 주장하고 있다. 그러나, 이전의 시스템들은 구문 정보를 얻기 위해 부분 구문분석기만을 사용하였고 재현율이 좋지 못했다. 그러므로 단백질의 세포 내 위치 정보를 얻기 위해 전체 구문분석기를 사용할 필요가 있다. 또한, 더 많은 언어학적 정보를 위해 의미 정보 또한 사용이 가능하다. 단백질의 세포 내 위치 정보를 인식하는 성능을 향상시키기 위하여, 본 논문은 전체 구문분석기와 어휘망(WordNet)을 기반으로 한 방법을 제안한다. 첫 번째 단계에서, 각 단백질 단어로부터 그 단백질의 위치후보에까지 이르는 구문 의존 경로를 구축한다. 두 번째 단계에서, 구문의존 경로의 루트 정보를 추출한다. 마지막으로, 단백질 부분트리와 위치 부분트리의 구문-의미 패턴을 추출한다. 구문 의존 경로의 루트와 부분트리로부터 구문태그와 구문방향을 구문 정보로서 추출하고, 각 노드 단어의 의미태그를 의미 정보로서 추출한다. 의미태그로는 어휘망의 동의어 집합(synset)을 사용한다. 학습데이터에서 추출한 루트 정보와 부분트리의 구문-의미 패턴에 따라서, 실험데이터에서 (단백질, 위치) 쌍들을 추출했다. 어떤 생물학적 지식 없이, 본 논문의 방법은 메드라인(Medline) 요약 데이터를 사용한 실험 결과에서 학습데이터에 대해 74.53%의 조화평균(F-measure), 실험데이터에 대해서는 58.90%의 조화평균을 보였다. 이 실험은 기존의 방법들보다 12-25%의 성능향상을 보였다.

Sequence driven features for prediction of subcellular localization of proteins

  • Kim, Jong-Kyoung;Bang, Sung-Yang;Choi, Seung-Jin
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.237-242
    • /
    • 2005
  • Predicting the cellular location of an unknown protein gives a valuable information for inferring the possible function of the protein. For more accurate prediction system, we need a good feature extraction method that transforms the raw sequence data into the numerical feature vector, minimizing information loss. In this paper, we propose new methods of extracting underlying features only from the sequence data by computing pairwise sequence alignment scores. In addition, we use composition based features to improve prediction accuracy. To construct an SVM ensemble from separately trained SVM classifiers, we propose specificity based weighted majority voting. The overall prediction accuracy evaluated by the 5-fold cross-validation reached 88.53% for the eukaryotic animal data set. By comparing the prediction accuracy of various feature extraction methods, we could get the biological insight on the location of targeting information. Our numerical experiments confirm that our new feature extraction methods are very useful for predicting subcellular localization of proteins.

  • PDF

포플러류(類)의 식물체(植物體)와 미토콘드리아의 동위효소(同位酵素) 분석(分析)에 의(依)한 몇 동위효소(同位酵素)의 세포소기관적(細胞小器管的) 위치(位置) (Subcellular Location of Five Isozymes in Populus Species by Isozyme Analysis with Whole Plant and Mitochondria)

  • 류장발;노은운;손두식
    • 한국산림과학회지
    • /
    • 제80권1호
    • /
    • pp.97-102
    • /
    • 1991
  • 포플러류의 식물체(植物體)와 그 식물체(植物體)에서 분리(分離)한 미토콘드라아를 동위효소(同位酵素) 분석(分析)하여, 각 동위효소(同位酵素)의 세포내(細胞內) 위치(位置)를 규명(糾明)하였다. 분석(分析)한 동위효소(同位酵素)는 ADH, 6-PGD, MDH, PGI와 Diaphorase였다. ADH는 세포질(細胞質)에 있으며, 핵내(核內)에 있는 한개의 유전자좌(遺傳子座)에 의(依)해 지배(支配)되는 것으로 나타났고, 6-PGD는 mitochondria에 있는 것으로 나타났다. MDH는 세포질(細胞質)에 3개의 band, mitochondria에 4개의 band가 있는 것으로 나타났다. PGI는 세포질(細胞質)에 3개의 band가 있는 듯하며, Diaphorase는 mitochondria에 1개의 band, 세포질(細胞質)에 2개의 band가 있는 것으로 나타났다. 세포질(細胞質)에 있는 두개의 band는 핵내(核內)에 있는 1개의 유전자좌(遺傳子座)에 있는 유전자(遺傳子)에 의(依)해 지배(支配)되는 것으로 판단되었다.

  • PDF

Subcellular Location of Spodpotera Cell-expressed Human HepG2-type Glucose Transport Protein

  • Lee, Chong-Kee
    • 대한의생명과학회지
    • /
    • 제18권2호
    • /
    • pp.160-164
    • /
    • 2012
  • The baculovirus/insect cell expression system is of great value for the large-scale production of normal and mutant mammalian passive glucose-transport proteins heterologously for structural and functional studies. In most mammalian cells that express HepG2, this transporter isoform is predominantly located at the cell surface. However, it had been reported that heterologous expression of other membrane proteins using the baculovirus system induced highly vacuolated cytoplasmic membranes. Therefore, how a cell responds to the synthesis of large amounts of a glycoprotein could be an interesting area for investigation. In order to examine the subcellular location of the human HepG2 transport proteins when expressed in insect cells, immunofluorescence studies were carried out. Insect cells were infected with the recombinant baculovirus AcNPVHIS-GT or with wild-type virus at a MOI of 5, or were not exposed to viral infection. A high level of fluorescence displayed in cells infected with the recombinant virus indicated that transporters are expressed abundantly and present on the surface of infected Sf21 cells. The evidence for the specificity of the immunostaining was strengthened by the negative results shown in the negative controls. Distribution of the transporter protein expressed in insect cells was further revealed by making a series of optical sections through an AcNPVHIS-GT-infected cell using a confocal microscope, which permits optical sectioning of cell sample. These sections displayed intense cytoplasmic immunofluorecence surrounding the region occupied by the enlarged nucleus, indicating that the expressed protein was present not only at the cell surface but also throughout the cytoplasmic membranous structures.

단백질의 세포내 소 기관별 분포 예측을 위한 서열 기반의 특징 추출 방법 (Sequence driven features for prediction of subcellular localization of proteins)

  • 김종경;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.226-228
    • /
    • 2005
  • Predicting the cellular location of an unknown protein gives valuable information for inferring the possible function of the protein. For more accurate Prediction system, we need a good feature extraction method that transforms the raw sequence data into the numerical feature vector, minimizing information loss. In this paper we propose new methods of extracting underlying features only from the sequence data by computing pairwise sequence alignment scores. In addition, we use composition based features to improve prediction accuracy. To construct an SVM ensemble from separately trained SVM classifiers, we propose specificity based weighted majority voting . The overall prediction accuracy evaluated by the 5-fold cross-validation reached $88.53\%$ for the eukaryotic animal data set. By comparing the prediction accuracy of various feature extraction methods, we could get the biological insight on the location of targeting information. Our numerical experiments confirm that our new feature extraction methods are very useful forpredicting subcellular localization of proteins.

  • PDF

Phosphate Number and Acyl Chain Length Determine the Subcellular Location and Lateral Mobility of Phosphoinositides

  • Cho, Hana;Kim, Yeon A;Ho, Won-Kyung
    • Molecules and Cells
    • /
    • 제22권1호
    • /
    • pp.97-103
    • /
    • 2006
  • Phosphoinositides are critical regulators of ion channel and transporter activity. There are multiple isomers of biologically active phosphoinositides in the plasma membrane and the different lipid species are non-randomly distributed. However, the mechanism by which cells impose selectivity and directionality on lipid movements and so generate a non-random lipid distribution remains unclear. In the present study we investigated which structural elements of phosphoinositides are responsible for their subcellular location and movement. We incubated phosphatidylinositol (PI), phosphatidylinositol 4-monophosphate (PI(4)P) and phosphatidylinositol 4,5-bisphosphate ($PI(4,5)P_2$) with short or long acyl chains in CHO and HEK cells. We show that phosphate number and acyl chain length determine cellular location and translocation movement. In CHO cells, $PI(4,5)P_2$ with a long acyl chain was released into the cytosol easily because of a low partition coefficient whereas long chain PI was released more slowly because of a high partition coefficient. In HEK cells, the cellular location and translocation movement of PI were similar to those of PI in CHO cells, whereas those of $PI(4,5)P_2$ were different; some mechanism restricted the translocation movement of $PI(4,5)P_2$, and this is in good agreement with the extremely low lateral diffusion of $PI(4,5)P_2$. In contrast to the dependence on the number of phosphates of the phospholipid head group of long acyl chain analogs, short acyl chain phospholipids easily undergo translocation movement regardless of cell type and number of phosphates in the lipid headgroup.

단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교 (Comparison of External Information Performance Predicting Subcellular Localization of Proteins)

  • 지상문
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.803-811
    • /
    • 2010
  • 단백질의 세포내 위치와 단백질의 기능은 연관성이 크므로, 단백질의 세포내 위치 예측을 통해서 그 기능에 대한 정보를 얻을 수 있다. 예측 정확도를 높이기 위해서 아미노산 서열 정보이외의 외부 정보들을 효과적으로 이용하려는 연구가 활발하다. 본 논문에서는 아미노산 서열 유사성, 단백질 프로파일, 유전자 온톨로지, 모티프, 문헌 정보에 내재된 세포내 위치 예측 능력을 비교한다. 단백질간의 서열 유사성이 80% 이하인 PLOC 자료를 사용한 실험에서는 서열 유사성과 유전자 온톨로지를 이용하는 방법이 효과적이며, 94.8%의 예측정확도를 얻었다. 단백질 서열간의 유사성이 30% 이하로서 단백질간의 서열 유사성이 작은 BaCelLo IDS 자료는 유전자 온톨로지를 사용하는 것이 효과적이었고, 동물은 93.2%, 곰팡이는 86.6%의 예측정확도로 크게 향상된 성능을 얻었다.