• 제목/요약/키워드: 구조유사성

검색결과 2,638건 처리시간 0.031초

순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석 (Korea Information Science Society)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

단백질 구조 비교에서 유사성 그래프의 효율적인 생성 (Efficient Generation of Docking Graph in Protein Structure Comparison)

  • 최경호;김진홍;이명준;이수현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.893-895
    • /
    • 2003
  • 단백질간 구조 비교는 기능적 또는 구조적으로 연관된 단백질을 분류하거나 모티프(motif)를 찾는데 유용하게 사용되고 있다. 여러 가지 단백질간 구조 비교 방법 중에서 단백질 2차구조를 이용하는 방법은 실행속도의 측면에서 장점이 있다. 본 논문에서는 단백질 2차 구조와 그들 사이의 관계를 기반으로 한 단백질 구조 비교에서 사용될 유사성 그래프를 생성하는 방법을 기술하였다. 유사성 그래프는 단백질의 2차구조 사이의 관계를 노드로 하여 생성되는데, 그 시간복잡도가 O(n$^4$)이다. 이에 본 논문에서는 유사성 그래프의 생성을 효율적으로 할 수 있는 알고리즘을 개발하였다.

  • PDF

3D 에지 히스토그램을 이용한 단백질 구조 비교 (A Protein Structure Comparison by 3D Edge Histogram)

  • 박성희;박수준;이성훈;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.805-807
    • /
    • 2003
  • 현재 생물분자의 기능적 관점에서 단백질 구조에 관심이 많이 모아지고 있다. 단백질의 기능은 구조에서 기인하기 때문에 두 단백질의 구조간의 유사성을 측정할 수 있는 방법은 두 단백질의 기능의 유사성을 유추할 수 있다. 본 논문에서는 두 단백질의 구조의 유사성을 측정하기 위한 단백질의 새로운 표현(representation)으로 3차원 에지 히스토그램을 제안한다. 단백질의 3차원 구조를 작은 복셀(voxel)로 이루어진 공간으로 나누고 복셀들로부터 3차원 에지 히스토그램을 추출하여 두 단백질간의 유사도 계산에 이용한다. 이를 통하여 단백질의 검색 및 분류를 시도한다.

  • PDF

가는 유사 부유의 연직구조 특성 : 농도, 속도경사, 스토크스 수 (On vertical profiles of cohesive sediment: concentration, velocity gradient, and Stokes number)

  • 손민우;변지선
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.391-391
    • /
    • 2016
  • 유수동역학적인 요소와 유사의 부유는 서로 상호작용을 주고받으며 다양한 현상을 만들어낸다. 많은 선행연구를 통해 유사 농도 등의 특성이 난류 구조 등의 변화를 야기하며, 변화한 난류 구조 역시 유사의 부유 등에 2차적인 영향을 준다는 점이 확인되었다. 본 연구에서는 가는 유사에 보다 집중하여 유사 부유와 이에 따른 연직구조 특성의 변화를 살펴본다. 본 연구에서는 1차원 연직 모형을 이용하여 수치실험을 수행한다. 본 연구에 이용된 모형은 가는 유사의 특성인 빠른 입자 반응 시간(Particle Response Time)이 가정되는 모형으로 선행연구를 통해 적용성이 검증된 것으로 판단한다. 주요 분석대상은 유사의 농도와 속도경사 간의 관계 등이며, 분석하는 유사 농도 종류는 일반적인 비점착성 유사의 경우에 관심을 가지는 질량 농도에 집중하여 결정된다. 수치실험 수행을 위해서는 정류 흐름, 진동파 흐름 등이 적용되었고 다양한 경우의 가는 유사를 고려하기 위한 실험조건의 변경이 이루어졌다. 수치실험 결과 진동파의 다양한 위상에서 조금씩 달라지는 연직구조가 확인되었다. 이는 보정되는 Schmidt 수의 값과도 연관관계를 가지는 것으로 나타났다. 특히 가는 유사의 경우에도 입자의 크기에 따라 다른 연직구조의 특성이 모의되었으며 이를 통해 수치실험의 경우에도 입자 크기의 고려 하에 매개변수의 보정이 이루어져야 한다는 점을 알 수 있다. 스토크스 수는 입자 반응 시간과 유체 난류 시간규모(Fluid Turbulence Ttime Scale)의 비율을 의미한다. 본 연구를 통해 스토크스 수가 유사의 확산강도 결정과 큰 상관 관계를 가지는 것을 알 수 있다. 이때 유사의 크기와 보정되는 Schmidt 수의 값은 고정되었다. 수치 계산시에 확산계수의 값이 부유 및 이에 따른 연직구조의 특성을 결정하는 중요한 변수라는 점을 고려할 때, 가는 유사의 부유를 모의할 때에는 세심한 주의가 요구된다는 점을 이해할 수 있다. 선행 연구사례를 통해 볼 때 부유하는 입자의 관성력이 Schmidt 수의 결정과 이에 따른 연직 구조의 계산에 큰 영향을 준다는 점을 알 수 있다. 본 연구에서는 스토크스 수를 관성력을 나타낼 수 있는 지표로서 계산하였지만 보다 정량적이고 효율적인 입자 관성력 지표가 제시될 때 효율적인 연구결과의 제시가 이루어질 수 있을 것으로 기대한다.

  • PDF

원자간 결합 분포를 이용한 단백질 구조 검색 시스템 (Protein Structure Retrieval System using Bond-line Histogram of Atoms)

  • 박성희;박수준;이성훈;박선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.817-820
    • /
    • 2003
  • 현재 생물분자의 기능적 관점에서 단백질 구조에 관심이 많이 모아지고 있다. 단백질의 기능은 구조에서 기인하기 때문에 두 단백질의 구조간의 유사성을 측정할 수 있는 방법은 두 단백질의 기능의 유사성을 유추할 수 있다. 본 논문에서는 두 단백질의 원자간 결합선 분포의 유사성을 기반으로 한 웹 환경에서 동작하는 단백질 구조 검색 시스템을 설계 구현하였다. 두 단백질의 구조의 유사성을 측정하기 위한 단백질의 표현(representation)으로는 3 차원 에지 히스토그램을 사용하였다. 3차원 에지 히스토그램, 즉, 3차원 공간 상에서의 원자간 결합선 분포에 기반한 단백질 구조 검색 시스템은 많은 양의 단백질 구조 정보로부터 원하는 형태의 단백질 구조를 빠른 시간에 검색할 수 있는 장점을 가지므로 스크리닝의 전단계(pre-screening)에서 사용될 수 있다.

  • PDF

3D 단백질 구조 데이터베이스 및 유사성 검색 시스템 구축 (Building of Protein 3-D Structure Database and Similarity Search System)

  • 이영화;박성희;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.79-82
    • /
    • 2002
  • 단백질 3차 구조 정보는 PDB에서 플랫화일 형태로 제공되고 있으며 이러한 플랫화일 각각의 엔트리들은 단백질 3차 분자 구조를 구성하는 원자들의 공간좌표정보, 서열정보, 실험정보 및 참조정보 등으로 구성된다. 이러한 정보들을 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적 검색을 위해서는 플랫파일을 데이터베이스로 구축함과 동시에, 구축된 데이터베이스를 위한 유사성 검색시스템 구축이 요구된다. 따라서, 이 논문에서는 Protein DataBank에서 제공하는 플랫파일을 공간객체 모델링기법에 기반한 관계형 데이터베이스로 구축하고 PSI-BLAST를 적용하여 단백질 서열 유사성 검색 시스템을 구축한다. 이렇게 함으로써 단백질 3자 구조 분자를 구성하는 원자에 대한 검색과 구조에 대한 서열 유사성 검색을 통하여 단백질 3차 구조 분류 및 구조 예측 시스템 구축에 활용할 수 있다.

  • PDF

단백질 3차원 구조의 지역적 유사성을 이용한 Flexible 단백질 구조 정렬에 관한 연구 (A Study of Flexible Protein Structure Alignment Using Three Dimensional Local Similarities)

  • 박찬용;황치정
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.359-366
    • /
    • 2009
  • 구조적 생물 정보학 분야는 단백질의 3차원 구조를 대상으로 단백질을 연구하는 분야이며, 본 논문에서는 구조적 생물 정보학 분야의 핵심 연구 주제중의 하나인 Flexible 단백질 구조 정렬에 관한 새로운 알고리즘을 제시한다. Flexible 단백질 구조 정렬을 위하여, 단백질의 3차원 구조의 지역적인 유사성을 이용하여 두 단백질의 유사한 부분 구조를 추출해 내고, 이 추출된 유사 구조간에 연결 가능성을 검색하여 정렬이 가능한 모든 유사 구조를 찾고, 이 유사 구조에 꺽임점을 도입하여 Flexible 단백질 구조 정렬을 수행하였다. 이 과정에서 단백질의 지역적 유사성을 정확히 비교하기 위하여 RDA를 이용한 방법을 제안하였고, Flexible 단백질 구조 정렬시 신뢰성 있는 꺽임점 위치 선정 방법과 그래프를 이용한 최적화 방법을 제안하였다. 성능 평가를 위하여 다양한 방법으로 Flexible 단백질 구조 정렬의 성능 평가를 수행하였고, 기존의 방법인 DALI, CE, FATCAT 보다 성능의 우수함을 나타내었다.

문서구조 정보 기반의 유사도 측정 (A Similarity Evaluation using Structural Information of Documents)

  • 신미해;고방원;김영철;정진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

유사 구조를 갖는 XML 문서 생성기의 설계 및 구현 (Design and Implementation of XML Document Generator with Similar Structure)

  • 이범석;이재민;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.163-165
    • /
    • 2004
  • 여러 장점을 가지고 점차 그 사용이 증가하고 있는 XML은 내용뿐만 아니라 그 구조적 정보까지 포함하고 있는 특징을 가지고 있는데, 이러한 XML 문서를 효율적으로 검색하기 위해 구조 유사성을 기반으로 하는 검색 기법이 개발되고 있다. 새롭게 개발되는 유사한 구조의 XML 문서를 검색하는 시스템의 성능 평가를 위해서는 구조적으로 유사한 다량의 XML 데이터가 필요하다. 본 논문에서는 지금까지 개발되었던 유사 구조 문서 생성기를 바탕으로 사용자가 원하는 데이터 구조를 생성하는데 보다 효과적인, 유사 구조를 갖는 XML 문서 생성기인 xTrans를 설계 및 구현한다. xTrans는 원본 XML 문서에 삽입, 삭제, 치환의 세 가지 연산을 이용하여 사용자가 원하는 일정한 비율만큼의 구조적 변화를 일으키는데, 그러한 연산은 불규칙한 위치에서 생성되므로, 같은 비율의 변화가 일어난 여러 개의 유사 구조 문서를 생성할 수 있다. 사용자는 각 연산의 변형 비율을 지정해주어 원하는 만큼 변형시킨 문서를 생성하고, 이 문서들을 이용하여 새롭게 개발되는 유사 구조 문서 검색 시스템의 성능평가에 활용할 수 있다.

  • PDF

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.