• 제목/요약/키워드: 모티프

검색결과 140건 처리시간 0.025초

단백질 모티프간 연관성 탐사 (Exploring Association Among Protein Motifs)

  • 이현숙;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.47-50
    • /
    • 2002
  • 단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix). 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 하지만, 이러한 데이터베이스는 모티프와 단백질간의 일대일 관계만을 저장하고 있기 때문에, 모티프 간의 연관성을 파악하기는 어렵다. 본 논문에서는 모티프 간의 연관 관계를 연관 규칙의 형태로 발견하는 데이터 마이닝 기법을 제시한다. 아울러 HITS 데이터베이스로부터 입수한 단백질-모티프 데이터베이스에 본 기법을 적용함으로써 상당히 높은 연관성을 갖는 모티프 집단이 실제로 존재한다는 것을 밝힌다.

  • PDF

모티프 자원 통합을 이용한 단백질 모티프 예측 시스템 구현 (Implementation of Protein Motif Prediction System Using integrated Motif Resources)

  • 이범주;최은선;류근호
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.679-688
    • /
    • 2003
  • 지놈 서열 시퀀싱을 통해 생성되는 원시 데이터에 대한 단백질 기능 및 구조 예측에 사용되는 모티프 데이터베이스들은 원시 데이터들의 폭발적인 성장추세에 맞추어 그 사용빈도가 증가하고 있다. 그러나 이러한 모티프 데이터베이스들은 독자적으로 개발, 발전하여왔고 웹 기반 cross-reference를 이용한 논리적 통합을 추진하여왔기 때문에 이질적인 검색 결과와 복잡한 질의 처리 문제, 중복된 데이터베이스 엔트리 핸들링 문제 등을 갖고 있다. 따라서, 이 논문에서는 이런 문제점들을 개선하기 위하여 물리적인 모티프 자원 통합을 제안하고, 패밀리 기반 단백질 예측 메소드들에 대한 통합 검색 방법을 기술한다. 끝으로 모티프 통합 데이터베이스 구축 및 단백질 모티프 예측 시스템 구현을 통한 결과를 평가한다.

모티프 자원 통합 데이터베이스 구축 및 메타엔진 설계 (Implementation of integrated motif database and Design of meta engine)

  • 이범주;최은선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1887-1890
    • /
    • 2002
  • 새롭게 발견되는 단백질의 구조와 기능 예측에 사용되는 모티프는 단백질 원시 데이터가 빠르게 증가함에 따라 그 중요성 역시 나날이 증가하고 있으며 이러한 모티프에 대한 다양한 서열 메소드들과 데이터베이스들이 개발되었다. 그러나, 이러한 모티프 데이터베이스들은 각각 이질적인 데이터 구조를 지니고 독자적으로 개발, 개발되어 왔기 때문에 서로 다른 형태의 검색 결과를 제공한다. 따라서 사용자는 각 데이터베이스에서 사용하는 데이터 구조들에 대한 전반적인 지식을 습득해야 하며 모티프 데이터베이스들 각각에 대해 중복된 반복 검색 작업들을 수행하여야 한다. 따라서 이 논문에서는 이러한 문제 해결을 위해, 각각의 모티프 데이터베이스들에서 제공하는 자원을 분해하고, 합병하는 과정을 거쳐 하나의 통합된 모티프 데이터베이스를 구축하였고, 기존의 데이터베이스에서 지원하지 못했던 단백질 3차 구조정보, 분류 정보의 지원을 가능케 하였고, 각 멤버 데이터베이스 검색 메소드의 장점을 그대로 적용할 수 있는 메타 엔진을 설계하여 사용자 편의적 검색 환경을 제공한다.

  • PDF

진화 알고리즘을 통한 전사 조절 모티프 조합 탐색 (Search of Transcriptional Motif Combination using Evolutionary Algorithms)

  • 이제근;정제균;오석준;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.328-330
    • /
    • 2004
  • 유전자 발현은 다양한 전사 인자들의 상호 작용에 의해서 조절되어진다 이러한 전사 인자들에 존재하는 모티프는 직접적으로 조절 작용을 위한 기능을 수행한다. 또한 대부분의 경우에서 여러 모티프가 함께 유전자 발현 기작을 위하여 조절 작용을 한다. 따라서 이러한 모티프들이 어떤 조합으로 함께 전사 과정에 관여하는지 여부를 밝히는 작업은 중요한 일이다. 본 논문에서 진화 연산을 응용하여, 다양한 조건 하에 전사 과정에 중요하게 작용하는 모티프들의 조합을 알아보았고, 그 결과를 기본적인 k-Means 알고리즘 등과 비교하여 제안한 방법이 유전자들의 상관관계에 있어서 보다 우수한 결과를 보임을 알 수 있었다.

  • PDF

발생 관련 유전자의 DNA 메틸화 모티프 패턴 분석 (Analysis of DNA Methylation Motif Patterns for Development Related Genes)

  • 이현재;류제운;김학용
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.355-356
    • /
    • 2012
  • 후성유전은 DNA 염기 서열이 변화하지 않고 DNA의 메틸화(methyaltion) 및 히스톤 단백질의 변형(modification)등의 후천적 과정에 의해 유전자 발현이 조절되는 현상이다. 특히 DNA 메틸화 정도에 대한 패턴 분석은 후성유전을 이해하는 중요한 접근방법중 하나이다. DNA 메틸화 패턴 분석을 위해 발생에 관련된 123개 유전자들의 -5000bp ~ +200bp사이에 있는 DNA 염기 서열 정보를 추출하였다. 추출한 염기 서열 정보를 기반으로 기존에 알려진 메틸화 경향성 모티프와 메틸화 저항성 모티프를 모니터링 함으로써 발생관련 유전자들의 메틸화 모티프 패턴을 분석하였다. 결과적으로 메틸화 저항 모티프만이 발견되었고 따라서 메틸화 저항 모티프 패턴과 발생관련 유전자들의 상관관계를 분석하였다.

  • PDF

모티프 자원 통합을 위한 데이터베이스 구축 (Implementation of motif database for integrating motif sources)

  • 이범주;최은선;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.160-162
    • /
    • 2002
  • 서열 시퀀싱을 통해 등장하는 원시 데이터들을 대상으로 유사한 서열과 기능 예측에 사용되는 모티프 데이터베이스들은 원시 데이터 생성 속도가 빠르게 증가함에 따라 그 중요성 또한 나날이 증가하고 있다. 그러나, 이러한 모티프 데이터베이스들은 서로 독자적으로 개발되고 발전되어 왔기 때문에 각각 서로 다른 형식의 데이터를 사용하고 있어 이에 대한 검색결과도 데이터베이스마다 서로 이질적인 형태로 제공하고 있다. 그러므로 사용자는 각 데이터베이스에서 사용하는 데이터 구조들에 대한 전반적 지식을 습득해야 할 뿐만 아니라 중복된 반복 검색 작업을 하여야 한다. 따라서, 이 논문에서는 이러한 문제 해결을 위해 독립적인 모티프 데이터베이스들의 자원을 분해하고, 합병하는 과정을 거쳐 하나의 통합된 모티프 데이터베이스를 구축하였다. 또한 데이터베이스의 각 엔트리당 단백질의 3차 구조 정보, 분류 정보, 샘플 정보의 지원을 가능케 하여 기존 검색 조건을 개선하였다. 이 데이터베이스 구축으로서 사용자는 모티프 데이터베이스 검색에 대한 streamline적인 검색이 가능할 뿐만 아니라 기존의 통합된 데이터베이스에서 지원되지 못한 구조 정보, 분류 정보 검색을 가능케 하였다.

  • PDF

인공신경망을 이용한 세포 주기상의 전사 조절 모티프 탐색 (Transcriptional Regulatory Motif identification in Cell Cycle using Artificial Neural Networks)

  • 이제근;정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.295-297
    • /
    • 2004
  • 생체 내의 모든 기능은 유전자 발현에 의해 결정된다. 유전자 발현은 않은 인자들에 의해 조절되며, 이러한 조절 과정에 따라 유전자 발현량이 결정되는 것이다. 세포 주기 역시 유전자 발현과 밀접한 연관성을 가지고 있다. 본 논문에서는 효모에서 세포 주기의 각 단계와 관련된 유전자들의 분석을 통해서 세포주기를 조절하는데 있어서 중요한 역할을 수행하는 전사 조절 모티프들이 무엇인지를 찾아보았다. 주요 모티프의 추출은 인공신경망 모델을 학습하고. 입출력 에러 분석을 통하여 이루어진다. 그 결과 MCB 등 기존의 실험 결과를 통하여 세포주기에 관련이 있다고 알려진 모티프들이 높은 점수를 보인다는 것을 알 수 있었고. 그 외에 세포주기의 각 단계에서 유전자 발현에 중요한 역할을 수행할 것으로 예상되는 다른 모티프들도 예측해볼 수 있었다.

  • PDF

단백질 모티프간 연관성 탐사 (Association Discovery Among Protein Motifs)

  • 이현숙;이도헌;최덕재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1827-1830
    • /
    • 2002
  • 단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix), 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 본 논문에서는 연관성 탐사 기법을 적용하여 Hits 데이터로부터 상당히 높은 연관성을 갖는 모티프 집단을 밝히고, 실제 자연현상에서 자주 나타나는 연관성을 교차타당성 (cross-validation) 기법을 통해 입증하였다. 이렇게 밝혀진 단백질 모티프간 연관성을 트라이 탐색 기법을 통해 웹으로 제공함으로써 단백질의 기능유추에 쉽게 접근하고자 한다.

  • PDF

모티프 서열에서의 특징추출 및 빈발패턴 분석 (Feature selection and frequent pattern analysis in protein motif sequence)

  • 김대성;이범주;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.10-13
    • /
    • 2007
  • 모티프는 진화과정을 거치면서 단백질 서열상에서 부분적으로 높게 보존된 지역을 의미한다. 이러한 모티프는 단백질의 기능과 구조를 예측하거나 생물학적으로 관련성이 있는 단백질의 공통적인 특성을 기술하는데 사용된다. 또한, 모티프와 단백질 서열의 상관관계는 생물학적 기능 예측에 필수적이며, 이러한 예측 문제는 모티프 검색을 통해 서열에 존재하는 빈발한 서열패턴과 구조패턴을 통해 단백질 서열에 대한 분석이 가능하다. 이 논문에서는 단백질 서열에 존재하는 2차 구조 특성과 빈발패턴을 검색하고 추출된 정보를 이용하여 단백질 기능 분류에 활용하고자 한다.

  • PDF

네트워크 기반 면역관련 유전자의 DNA 메탈화 모티프 분석 (Analysis of DNA Methylation Motif for Immune Related Genes Based on Networks)

  • 이지후;류제운;김학용
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.357-358
    • /
    • 2012
  • 후성유전은 DNA 염기서열이 변화하지 않은 상태에서 특별한 후성적 조절 기전에 의해 유전자의 발현 양상이 변하는 현상이다. 후성적 조절 기전에는 DNA의 메틸화(methyaltion)와 히스톤 단백질의 변형(modification), non coding RNA에 의한 조절 등이 포함되는데, 이 중 DNA 메틸화 정도에 대한 패턴 분석은 후성유전을 이해하는 중요한 접근방법 중 하나이다. 네트워크와 DNA 메틸화 분석을 위하여 면역관련 264개 유전자들의 -2000bp ~ +200bp사이에 있는 DNA 염기 서열 정보를 추출하였다. 또한 면역관련 단백질들의 상호작용 정보를 이용하여 네트워크를 구축하고 여기에 메틸화 정보를 적용하여 상호작용과 메틸화 모티프와의 관계를 분석하였다. 메틸화 모티프 정보를 적용한 단백질 네트워크에서는 기존 단백질 네트워크보다 더 복잡한 구조를 이루고 있었다. 이러한 구조는 동일한 메틸화 모티프들이 여러 유전자들의 활성을 조절할 것으로 사료된다. 단백질 상호작용 네트워크에 모티프를 적용한 분석은 새로운 후성유전학적 연구를 위한 접근 방법으로 이용될 수 있을 것이다.

  • PDF