• Title/Summary/Keyword: 구조 유사성

Search Result 2,636, Processing Time 0.032 seconds

Efficient Generation of Docking Graph in Protein Structure Comparison (단백질 구조 비교에서 유사성 그래프의 효율적인 생성)

  • 최경호;김진홍;이명준;이수현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.893-895
    • /
    • 2003
  • 단백질간 구조 비교는 기능적 또는 구조적으로 연관된 단백질을 분류하거나 모티프(motif)를 찾는데 유용하게 사용되고 있다. 여러 가지 단백질간 구조 비교 방법 중에서 단백질 2차구조를 이용하는 방법은 실행속도의 측면에서 장점이 있다. 본 논문에서는 단백질 2차 구조와 그들 사이의 관계를 기반으로 한 단백질 구조 비교에서 사용될 유사성 그래프를 생성하는 방법을 기술하였다. 유사성 그래프는 단백질의 2차구조 사이의 관계를 노드로 하여 생성되는데, 그 시간복잡도가 O(n$^4$)이다. 이에 본 논문에서는 유사성 그래프의 생성을 효율적으로 할 수 있는 알고리즘을 개발하였다.

  • PDF

Korea Information Science Society (순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석)

  • 이원철;이상민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

A Protein Structure Comparison by 3D Edge Histogram (3D 에지 히스토그램을 이용한 단백질 구조 비교)

  • 박성희;박수준;이성훈;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.805-807
    • /
    • 2003
  • 현재 생물분자의 기능적 관점에서 단백질 구조에 관심이 많이 모아지고 있다. 단백질의 기능은 구조에서 기인하기 때문에 두 단백질의 구조간의 유사성을 측정할 수 있는 방법은 두 단백질의 기능의 유사성을 유추할 수 있다. 본 논문에서는 두 단백질의 구조의 유사성을 측정하기 위한 단백질의 새로운 표현(representation)으로 3차원 에지 히스토그램을 제안한다. 단백질의 3차원 구조를 작은 복셀(voxel)로 이루어진 공간으로 나누고 복셀들로부터 3차원 에지 히스토그램을 추출하여 두 단백질간의 유사도 계산에 이용한다. 이를 통하여 단백질의 검색 및 분류를 시도한다.

  • PDF

Protein Structure Retrieval System using Bond-line Histogram of Atoms (원자간 결합 분포를 이용한 단백질 구조 검색 시스템)

  • Park, Sung-Hee;Park, Soo-Jun;Lee, Seong-Hun;Park, Seon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.817-820
    • /
    • 2003
  • 현재 생물분자의 기능적 관점에서 단백질 구조에 관심이 많이 모아지고 있다. 단백질의 기능은 구조에서 기인하기 때문에 두 단백질의 구조간의 유사성을 측정할 수 있는 방법은 두 단백질의 기능의 유사성을 유추할 수 있다. 본 논문에서는 두 단백질의 원자간 결합선 분포의 유사성을 기반으로 한 웹 환경에서 동작하는 단백질 구조 검색 시스템을 설계 구현하였다. 두 단백질의 구조의 유사성을 측정하기 위한 단백질의 표현(representation)으로는 3 차원 에지 히스토그램을 사용하였다. 3차원 에지 히스토그램, 즉, 3차원 공간 상에서의 원자간 결합선 분포에 기반한 단백질 구조 검색 시스템은 많은 양의 단백질 구조 정보로부터 원하는 형태의 단백질 구조를 빠른 시간에 검색할 수 있는 장점을 가지므로 스크리닝의 전단계(pre-screening)에서 사용될 수 있다.

  • PDF

Building of Protein 3-D Structure Database and Similarity Search System (3D 단백질 구조 데이터베이스 및 유사성 검색 시스템 구축)

  • Li, Rong-Hua;Park, Sung-Hee;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.79-82
    • /
    • 2002
  • 단백질 3차 구조 정보는 PDB에서 플랫화일 형태로 제공되고 있으며 이러한 플랫화일 각각의 엔트리들은 단백질 3차 분자 구조를 구성하는 원자들의 공간좌표정보, 서열정보, 실험정보 및 참조정보 등으로 구성된다. 이러한 정보들을 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적 검색을 위해서는 플랫파일을 데이터베이스로 구축함과 동시에, 구축된 데이터베이스를 위한 유사성 검색시스템 구축이 요구된다. 따라서, 이 논문에서는 Protein DataBank에서 제공하는 플랫파일을 공간객체 모델링기법에 기반한 관계형 데이터베이스로 구축하고 PSI-BLAST를 적용하여 단백질 서열 유사성 검색 시스템을 구축한다. 이렇게 함으로써 단백질 3자 구조 분자를 구성하는 원자에 대한 검색과 구조에 대한 서열 유사성 검색을 통하여 단백질 3차 구조 분류 및 구조 예측 시스템 구축에 활용할 수 있다.

  • PDF

Effective Comparison of Protein Structures Based on Extended PSAML (확장된 PSAML을 통한 효과적인 단백질 구조 비교)

  • Kim, Jin-Hong;Ahn, Geon-Tae;Lee, Su-Hyun;Lee, Myung-Joon
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.114-119
    • /
    • 2003
  • 단백질 구조를 비교하는 방법은 단백질 구조를 표현하는 기술에 따라 다양하게 존재한다. 일반적인 단백질 구조 정렬방법은 단백질 구조를 원자 또는 Residue를 기준으로 표현하고, 표현된 두 구조사이의 일치된 부분을 찾는 방법과 단백질 구조를 단백질 이차구조요소로 표현하고 표현된 두 단백질 구조를 정렬하는 방법으로 크게 구분된다. 이러한 단백질 구조 비교 방법은 단백질 구조의 유사성을 측정하는 과정에서 많은 시간을 요구할 뿐만 아니라 PDB에 저장된 데이터가 증가함에 따라 보다 많은 단백질과 비교가 요구된다. 따라서 대용량의 단백질 구조 데이터베이스를 대상으로 효율적으로 단백질의 유사 부분구조를 찾을 수 있는 방법이 필요하다. 본 논문에서는 단백질 구조 비교를 보다 빠르고 효과적으로 수행하기 위하여, 기존의 단백질 이차구조 기반의 구조 표현 방법인 PSAML을 확장하여 단백질 이차구조가 가지는 공간상의 정보를 내포한 Topology String을 생성하고 이를 이용하여 대용량의 단백질구조 데이터베이스에서 유사성이 높은 단백질 구조를 필터링하는 방법에 대하여 기술한다. Topology String은 단백질 이차구조를 하나의 문자로 기술하여 아미노산 순서와 위상학적인(공간적인) 정보를 바탕으로 단백질 구조를 표현하여, 단백질 이차구조를 이용하여 구조 비교를 수행하기 이전에 유사성이 높은 단백질 구조를 신속하게 찾아내는데 효과적으로 적용될 수 있다.

  • PDF

Numerical Objective Assessment Using Structural Similarity for Diffuse Optical Reconstructed Images (재구성된 광간섭단층 영상의 구조적 유사성을 이용한 수치 목표 평가)

  • Mudeng, Vicky;Choe, Se-woon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.658-660
    • /
    • 2021
  • The work within this study develops an algorithm based on the structural similarity index to assess numerically between reconstructed images with a reference image to separate the homogeneity and heterogeneity for diffuse optical tomography. Global geometry and region of interest assessment have been measured to yield the similarity. The results indicate that the mean of structural similarity index shows potential performance to distinguish between visible and invisible inclusion inside the model. Therefore, the structural similarity index may promise to assist the image assessment for evaluating breast structural information.

  • PDF

A Study of Flexible Protein Structure Alignment Using Three Dimensional Local Similarities (단백질 3차원 구조의 지역적 유사성을 이용한 Flexible 단백질 구조 정렬에 관한 연구)

  • Park, Chan-Yong;Hwang, Chi-Jung
    • The KIPS Transactions:PartB
    • /
    • v.16B no.5
    • /
    • pp.359-366
    • /
    • 2009
  • Analysis of 3-dimensional (3D) protein structure plays an important role of structural bioinformatics. The protein structure alignment is the main subjects of the structural bioinformatics and the most fundamental problem. Protein Structures are flexible and undergo structural changes as part of their function, and most existing protein structure comparison methods treat them as rigid bodies, which may lead to incorrect alignment. We present a new method that carries out the flexible structure alignment by means of finding SSPs(Similar Substructure Pairs) and flexible points of the protein. In order to find SSPs, we encode the coordinates of atoms in the backbone of protein into RDA(Relative Direction Angle) using local similarity of protein structure. We connect the SSPs with Floyd-Warshall algorithm and make compatible SSPs. We compare the two compatible SSPs and find optimal flexible point in the protein. On our well defined performance experiment, 68 benchmark data set is used and our method is better than three widely used methods (DALI, CE, FATCAT) in terms of alignment accuracy.

XML Document Analysis based on Similarity (유사성 기반 XML 문서 분석 기법)

  • Lee, Jung-Won;Lee, Ki-Ho
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.6
    • /
    • pp.367-376
    • /
    • 2002
  • XML allows users to define elements using arbitrary words and organize them in a nested structure. These features of XML offer both challenges and opportunities in information retrieval and document management. In this paper, we propose a new methodology for computing similarity considering XML semantics - meanings of the elements and nested structures of XML documents. We generate extended-element vectors, using thesaurus, to normalize synonyms, compound words, and abbreviations and build similarity matrix using them. And then we compute similarity between XML elements. We also discover and minimize XML structure using automata(NFA(Nondeterministic Finite Automata) and DFA(Deterministic Finite automata). We compute similarity between XML structures using similarity matrix between elements and minimized XML structures. Our methodology considering XML semantics shows 100% accuracy in identifying the category of real documents from on-line bookstore.

Structural Alignment: Conceptual Implications and Limitations (구조적 정렬: 개념적 시사점과 한계)

  • Lee Tae-Yeon
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.1
    • /
    • pp.53-74
    • /
    • 2006
  • Similarity has been considered as one of basic concepts of cognitive psychology which is useful for explaining cognitive structure and process. MDS models(Shepard, 1964; Nosofsky, 1991) and Contrast model(Tversky, 1977) were proposed as early models of similarity comparison process. But, there have been a lot of theoretical doubts about the conceptual validity of similarity as a result of empirical findings which could not be explained by early models. Goldstone(1994) assumed that similarity could be defined by alignment processes, and suggested structural alignment as a prospective alternative for solving conceptual controversies so far. In this study, basic assumption and algorithms of MDS models(Shepard, 1944; Nosofsky, 1991) and Contrast model(Tversky, 1977) were described shortly and some theoretical limitations such as arbitrariness of selective attention and correlated structures were discussed as well. The conceptual characteristics and algorithms of SIAM(Goldstone, 1994) were described and how it has been applied to cognitive psychology areas such as categorization, conceptual combination, and analogical reasoning were reviewed. Finally, some theoretical limitations related with data-driven processing and alternative processing and possible directions for structural alignment were discussed.

  • PDF