• 제목/요약/키워드: 단백질 프로파일

검색결과 19건 처리시간 0.02초

단백질 이차 구조 예측을 위한 단백질 프로파일의 성능 비교 (A Performance Comparison of Protein Profiles for the Prediction of Protein Secondary Structures)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.26-32
    • /
    • 2018
  • 단백질의 이차구조는 단백질의 진화, 구조, 기능을 연구하는데 중요한 정보이다. 단백질 서열 정보만을 이용하여 단백질의 이차 구조를 예측하는 분야에 심층 학습 방법들이 최근 들어 활발히 적용되고 있다. 이러한 방법에서 널리 사용되는 입력은 단백질 서열을 변환하여 만들어진 단백질 프로파일이다. 본 논문에서는 효과적인 단백질 프로파일을 얻기 위하여 단백질 서열 탐색 방법으로 PSI-BLAST와 더불어서 HHblits를 사용하였다. 단백질 프로파일의 구성에 사용되는 상동 단백질 서열을 결정하기 위한 유사도 문턱치와 상동 단백질 서열 정보를 반복적으로 사용하는 회수를 조절하였다. 합성곱 신경망과 순환 신경망을 사용하여 단백질 이차구조를 예측하였는데, 진화적 정보를 한번만 추가하여 만들어진 단백질 프로파일이 효과적이었다.

질병 의존 단백질 도출을 위한 데이터 큐브의 응용 (Application of Data Cube to Identify Differentially Expressed Proteins by Disease)

  • 김단비;이원석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.268-270
    • /
    • 2004
  • 주어진 셀이나 조직에 발현된 단백질 프로파일의 구조적인 분석을 다루는 단백질체학(Proteomics) 연구에 있어서, 질병에 대한 마커 단백질(marker proteins)을 도출(identification)하는 것은 핵심 논점 중 하나이다. 수십 개의 샘플로부터 추출한 셀이나 조직 내에는 수많은 단백질이 포함되어 있으며, 존재하는 단백질의 질병에 의한 발현량(expression level) 변화 및 임상 특성에 의한 영향을 분석하기 위해서 데이터베이스와 데이터 마이닝 기술의 활용이 효과적이다. 본 논문에서는 질병 일 임상 특성에 따른 단백질의 발현량 변화를 분석하기 위한 OLAP 데이터 큐브(Data cube)의 응용 방법과 단백질 데이터의 분석에 적합한 척도(measure)를 제안하고, 유효성을 보인다.

  • PDF

단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교 (Comparison of External Information Performance Predicting Subcellular Localization of Proteins)

  • 지상문
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.803-811
    • /
    • 2010
  • 단백질의 세포내 위치와 단백질의 기능은 연관성이 크므로, 단백질의 세포내 위치 예측을 통해서 그 기능에 대한 정보를 얻을 수 있다. 예측 정확도를 높이기 위해서 아미노산 서열 정보이외의 외부 정보들을 효과적으로 이용하려는 연구가 활발하다. 본 논문에서는 아미노산 서열 유사성, 단백질 프로파일, 유전자 온톨로지, 모티프, 문헌 정보에 내재된 세포내 위치 예측 능력을 비교한다. 단백질간의 서열 유사성이 80% 이하인 PLOC 자료를 사용한 실험에서는 서열 유사성과 유전자 온톨로지를 이용하는 방법이 효과적이며, 94.8%의 예측정확도를 얻었다. 단백질 서열간의 유사성이 30% 이하로서 단백질간의 서열 유사성이 작은 BaCelLo IDS 자료는 유전자 온톨로지를 사용하는 것이 효과적이었고, 동물은 93.2%, 곰팡이는 86.6%의 예측정확도로 크게 향상된 성능을 얻었다.

Random forest를 이용한 RNA에서의 단백질 결합 영역 예측 (Prediction of protein binding regions in RNA using random forest)

  • 최대식;박병규;채한주;이욱;한경숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.583-586
    • /
    • 2016
  • 단백질과 RNA의 상호작용 데이터가 대량으로 늘어남에 따라, 단백질과 RNA의 결합부위를 예측하는 계산학적인 방법들이 많이 개발되고 있다. 하지만, 많은 계산학적인 방법들은 단백질에서 단백질과 RNA 결합부위를 예측한다는 한계점이 있었다. 본 논문에서는 RNA와 단백질의 서열정보를 모두 사용하여, 단백질과 결합하는 RNA 결합부위를 예측하는 기법과 그 결과를 논한다. WEKA random forest(http://www.cs.waikato.ac.nz/ml/weka/)를 이용하여 예측 모델을 개발하였고, RNA 서열의 서열 프로파일, 서열 composition, 결합 상대방의 단백질의 특성 등을 특정으로 표현하였다. Random forest 기법을 사용한 cross validation의 결과로서 1:1 모델에서 제일 높은 성능인 92.4% sensitivity, 92.0% specificity, 92.2% accuracy를 보였고, independent test에서는 72.5% sensitivity, 90.0% specificity, 2.1% accuracy를 보였다.

다차원 클러스터링 기반의 단백질 2DE 이미지에서의 자동화된 기준점 추출 방법 (Automated Method of Landmark Extraction for Protein 2DE Images based on Multi-dimensional Clustering)

  • 심정은;이원석
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.719-728
    • /
    • 2005
  • 2DE는 조직 내의 단백질을 규명하는 단백질 분리 기술이다. 그러나 2DE 이미지는 실험 조건, 스캐닝 상태와 같은 환경에 민감하게 영향을 받는다. 이러한 이미지간의 변화를 극복하기 위해서 사용자는 각각의 서로 다른 이미지에 수동으로 기준점을 입력해주어야 한다. 그러나 이 과정은 에러를 발생시키며 긴 시간을 요구하는 작업으로, 빠른 분석에 장애 요인이 된다. 따라서 본 논문에서는 기준점 프로파일에 기반 하여 기준점을 자동으로 추출하는 방법을 개발하였다. 기준점 프로파일은 이미 확인된 이미지들의 기준점들에 대한 클러스터링 방법을 통하여 생성하며, 각 클러스터의 다양한 속성을 정의한다. 새로운 이미지가 입력되면 기준점의 후보 스팟들을 대상으로 프로파일과 비교하석 기준점을 추출한다. 그리고 $A^*$알고리즘을 이용하여 기준점 선정 과정을 최적화한다. 본 논문에서는 실제 사람의 간 조직 이미지를 이용하여 기준점 추출 방법의 성능을 분석하였다

대용량 파일에 의한 프로세스간의 동기화 (Inter-Process Synchronization by Large Scaled File)

  • 하성진;황선태;정갑주;이지수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.322-324
    • /
    • 2002
  • 최근에 지역적으로 분산된 컴퓨팅 자원을 어디에서나 활용할 수 있도록 해주는 GRID가 많은 주목을 받고 있다. 특히 단백질 분자모사나 고에너지 물리학 분야 둥과 같이 매우 많은 계산을 요구하는 분야에서는 GRID를 통해서 계산 자원을 제공받을 수 있다. GRID에서 제공되는 계산 능력을 잘 활용하기 위해서 각 분야에서 사용되는 어플리케이션을 병렬화 할 수도 있지만 이미 계산 방법이나 결과가 검증되어 있는 기존의 패키지를 활용하는 것도 매우 중요하므로 기존 패키지에 의한 직렬 또는 지역적으로 병렬인 프로세스를 매우 많이 생성하여 GRID를 채우는 것도 한 방법이라 하겠다. 일반적으로 이와 같은 패키지는 기동할 때에 패러미터 파일을 참조하게 되고 그 계산 결과는 매우 큰 파일로 출력이 되는데 본 논문에서는 대용량 파일에 의해서 프로세스간에 동기화 및 통신을 이루어야할 때 발생하는 문제를 해결하는 방안을 제시한다. 동기화와 통신을 동시에 다루어야 하므로 Linda 개념을 도입하였으며 기존 Linda에서는 Tuple Space안에서 대용량 파일 처리를 고려하기 어려우므로 이에 대한 해결책을 제안하였다.

  • PDF

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

국내콩 4품종의 LC-MS 기반 비표적대사체 비교평가 (Comparative untargeted metabolomic analysis of Korean soybean four varieties (Glycine max (L.) Merr.) based on liquid chromatography mass spectrometry)

  • 김은하;박수윤;이상구;박현민;유오숙;강윤녕;김명지;정정원;오선우
    • Journal of Applied Biological Chemistry
    • /
    • 제65권4호
    • /
    • pp.439-446
    • /
    • 2022
  • 콩은 양질의 단백질과 지방산이 풍부하며, 세계적으로 가장 많이 사용되는 형질전환작물(GM) 중 하나이다. 국내에서 GM콩은 주로 광안을 모본으로 하여 개발되고 있는 상황이다. 본 연구에서는 비표적 LC-MS 기반 대사체 분석기술을 이용하여 2020년도에 군위와 전주에서 재배한 광안과 세 일반콩의 대사체 프로파일을 비교분석 하였다. Partial least square-discriminant analysis (PLS-DA) 분석을 통하여 대사체 프로파일들은 품종별로 잘 분리되었으며, 페닐알라닌과 이소플라본, 지방산을 포함하여 18종 물질이 관여하는 것으로 확인하였다. PLS-DA 스코어 플롯에서 콩 4품종은 지역별로 클러스터를 형성하였으며, 이는 재배환경이 대사물질의 변화에 영향을 준 것으로 판단된다. 광안은 다른 품종들에 비하여 이소플라본 함량이 가장 낮았으며, 리놀렌산 함량은 가장 높았다. 광안을 이용하여 개발된 생명공학콩의 실질적동등성 평가의 경우 광안의 대사체 프로파일 특성을 고려한 비교품종 선정 등에 관하여 고찰하였다.

SNU-16 위암 세포의 mRNA 및 miRNA 프로파일에 미치는 제주조릿대 추출물의 영향 (Effects of Sasa quelpaertensis Extract on mRNA and microRNA Profiles of SNU-16 Human Gastric Cancer Cells)

  • 장미경;고희철;김세재
    • 생명과학회지
    • /
    • 제30권6호
    • /
    • pp.501-512
    • /
    • 2020
  • 제주조릿대 잎은 항염, 해열 및 이뇨작용을 가지고 있어 위궤양, 목마름 및 토혈 치료를 위한 민간의약으로 사용되어 왔다. 본 저자들은 제주조리대 잎에서 분리한 피토케미칼 풍부 추출물(PRE)과 그 에틸아세테이트 분획물(EPRE)은 여러 위암 세포주에서 세포사멸을 유도하는 항암 효과가 있다고 보고한 바 있다. 본 연구는 EPRE의 세포사멸 유도 기전에 관여하는 분자표적들을 탐색하기 위하여 EPRE을 처리한 SNU-16 세포에서 mRNA와 microRNA (miRNA)의 프로파일 변화를 분석하였다. RNA sequencing 분석을 통해 총 2,875개의 차등적으로 발현되는 유전자들(DEGs)을 동정하였다. 유전자 온톨로지(GO)와 KEGG 경로 분석 결과, EPRE는 세포사멸, 유사 분열-활성화 단백질 키나제(MAPK) 및 염증 반응, 종양 괴사 인자(TNF) 신호 전달 및 암 경로에 관여하는 유전자들의 발현을 조절하는 것으로 나타났다. 단백질-단백질 상호 작용(PPI) 네트워크 분석으로 세포사멸 및 세포죽음과 관련된 유전자들 간의 상호작용들을 확인할 수 있었다. 그리고, miRNA sequencing 분석을 통해 총 27개의 차별적으로 발현되는 miRNAs (DEMs)를 동정하였다. GO와 KEGG 경로 분석 결과, EPRE는 세포주기, 세포사멸 및 tropomyosin-receptor-kinase (TRK) 수용체 신호 전달, 성장인자-β(TGF-β), 핵인자 κB (NF-κB) 및 암 경로에 관여하는 miRNAs의 발현을 조정하였다. 본 연구결과는 EPRE의 항암 효과의 근본적인 메커니즘에 대한 통찰력을 제공한다.

신개념 질병 진단 및 치료 연구에 있어서의 당사슬의 생물학적 역할 (Biological Roles of the Glycan in the Investigation of the Novel Disease Diagnosis and Treatment Methods)

  • 김동찬
    • 생명과학회지
    • /
    • 제28권11호
    • /
    • pp.1379-1385
    • /
    • 2018
  • 당사슬은 당단백질과 단백당에 결합하며, 일반적으로 세포의 최외각 표면에서 발견된다. O-연결 당사슬과 N-연결 당사슬은 진핵세포에 흔히 존재하는 당사슬이며 원핵세포에서도 발견된다. 세포 표면에 존재하는 당사슬과 주변에 동일한 종류의 세포막에 노출된 당사슬 결합 단백질과의 상호작용, 전혀 다른 종류의 세포와의 상호작용, 또는 질병 유발 균주와 바이러스와의 상호작용은 생물학 및 의생명과학에 있어서 질병원인물질 인식, 세포 이동, 세포간의 결합, 발생, 그리고 감염 등과 같은 과정에 있어서 매우 중요한 역할을 담당한다. 각종 질병 상황에서의 당사슬의 프로파일의 변화와 역할은 당사슬이 질병 진단 마커로 활용할 가능성을 제시한다. 이에 더하여, 기존의 많은 선행 연구들에서, 재조합 단백질 의약품에 결합된 당사슬은 재조합 단백질 의약품의 용해도, 약동역학, 약물 활성, 생체활성, 안전성을 적절하게 유지하고 결정짓는데 중요한 요소가 된다. 게다가, 암의 발생과 진전의 영향으로 인해 당사슬 가지 끝에 결합하는 시알릭산의 당질화 양상의 변화는 세포와 세포간 상호작용, 인식 그리고 면역 반응에 매우 중요한 요소로 작용한다. 본 총설에서는 당사슬의 생물학적인 기능에 대한 전반적인 이해를 돕고, 당질화 현상과 질병 진단 및 질병 치료 기법간의 상호 연관성을 간략히 설명하고자 한다. 추가적으로 혈액 내 혈청에 존재하는 당사슬의 프로파일의 변화를 분석하는 대량효능검색 방법과 이로 인해 유도되는 생화학적 작용 기작을 살펴보았다.