• 제목/요약/키워드: 플랫파일

검색결과 15건 처리시간 0.027초

3D 단백질 구조 데이터베이스 및 유사성 검색 시스템 구축 (Building of Protein 3-D Structure Database and Similarity Search System)

  • 이영화;박성희;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.79-82
    • /
    • 2002
  • 단백질 3차 구조 정보는 PDB에서 플랫화일 형태로 제공되고 있으며 이러한 플랫화일 각각의 엔트리들은 단백질 3차 분자 구조를 구성하는 원자들의 공간좌표정보, 서열정보, 실험정보 및 참조정보 등으로 구성된다. 이러한 정보들을 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적 검색을 위해서는 플랫파일을 데이터베이스로 구축함과 동시에, 구축된 데이터베이스를 위한 유사성 검색시스템 구축이 요구된다. 따라서, 이 논문에서는 Protein DataBank에서 제공하는 플랫파일을 공간객체 모델링기법에 기반한 관계형 데이터베이스로 구축하고 PSI-BLAST를 적용하여 단백질 서열 유사성 검색 시스템을 구축한다. 이렇게 함으로써 단백질 3자 구조 분자를 구성하는 원자에 대한 검색과 구조에 대한 서열 유사성 검색을 통하여 단백질 3차 구조 분류 및 구조 예측 시스템 구축에 활용할 수 있다.

  • PDF

공간객체 모델 기반 단백질 3차 구조 모델링 (Modelling of three Dimensional Structure in Protein based on Spatial Object Model)

  • 한욱;박성희;이순희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.73-75
    • /
    • 2002
  • PDB에서 제공하는 단백질 3차원 고분자결정 구조에 대한 플랫파일은 인자들의 좌표, 서열정보, 실험정보 및 참조 정보가 포함된다. 이러한 정보를 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적인 검색을 위해서는 이러한 데이터를 추출하여 데이터베이스 구축이 요구되며 이 때 단백질 구조 및 서열 정보와 실험 및 탐조 정보의 관계에 대한 모델링이 중요하다. 따라서 이 논문에서는 PDB에서 제공하는 플랫파일들의 엔트리들을 분석하고 3차원 공간 객체의 기하적 특성을 갖는 단백질 3차 구조를 공간객체로 표현하고 공간객체 모델을 적용하여 모델링한다. 이렇게 함으로써 단백질 3차 구조 분자를 구성하는 인자 및 구조 정보 검색이 가능하며 위상 및 기하 연산자글 이용하여 단백질 구조 분석에 활용할 수 있다.

  • PDF

한반도 과거 지진기록에 대한 응답이력 데이터베이스 구축 기초 연구 (A Fundamental Study on the Database of Response History for Historical Earthquake Records on the Korean Peninsula)

  • 최인혁;안재광;곽동엽
    • 대한토목학회논문집
    • /
    • 제39권6호
    • /
    • pp.821-831
    • /
    • 2019
  • 9.12지진(2016.9.12., ML=5.8)과 포항지진(2017.11.15., ML=5.4)은 사회·경제적 피해를 야기시켰고, 이로 인해 지진에 대한 국민의 관심이 과거보다 크게 높아졌다. 지진 빈도가 높은 미국, 일본, 칠레 등 불의 고리 인근의 국가에서는 이미 지진재난에 대비·대응을 위하여 지진재해도(PSHA), 지반운동예측모델(GMPE) 등을 기반으로 인프라 시설을 관리하고 있다. 국내도 앞서 설명된 PSHA, GMPE가 개별 연구자들을 통해 독자적으로 개발되고 있지만, 모델 개발시 생성한 기초 데이터 산출 방법, 최종 결과물의 주요 요소 등이 제한적으로 공개되었다. 이는 해마다 발생하는 지진의 추가를 통한 모델 개선이 아닌 과거 지진에 대해 매번 새롭게 자료 구축을 해야 한다는 문제점을 내포하고 있다. 따라서, 본 연구에서는 GMPE 개발의 기초자료인 플랫파일 생성 방법과 지진 관측자료의 지진파형의 계기보정 방법, 계기진도 생성 방법 등을 기술하였다.

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

SAN 환경 대용량 파일 시스템을 위한 디렉토리 구조 비교 (Comparison of Directory Structures for SAN Based Very Large File Systems)

  • 김신우;이용규
    • 한국전자거래학회지
    • /
    • 제9권1호
    • /
    • pp.83-104
    • /
    • 2004
  • 최근 전자상거래시스템을 비롯하여 대용량 데이터의 저장과 검색을 요구하는 정보시스템들이 광범위하게 활용되고 있다. 이에 맞추어 클라이언트가 메타데이터를 직접 관리하며 데이터에 접근할 수 있는 SAN 환경의 리눅스클러스터 파일시스템이 연구되고 있으며, 파일의 빠른 검색을 위해 확장 해시 기반의 세미플랫 디렉토리 구조가 제안되었다[1]. 본 연구에서는 리눅스 환경에서 확장 해시 기반의 세미플랫 디렉토리를 설계 및 구현하였으며, 구현된 시스템의 실용성을 평가하기 위하여 B+ 트리 기반의 디렉토리 구조를 함께 구현하여 성능을 비교하였다. 디렉토리의 성능을 비교 분석한 결과, 파일의 삽입, 삭제, 검색 성능에서는 확장 해싱 기반의 디렉토리가 우수하였으나, 전체 파일의 목록을 정렬하는 데는 B+ 트리 기반의 디렉토리가 더 우수한 성능을 보였다.

  • PDF

대규모 동적 해싱 디렉토리의 구현 및 평가 (An Implementation and Evaluation of Large-Scale Dynamic Hashing Directories)

  • 김신우;이용규
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.924-942
    • /
    • 2005
  • 최근 대용량 데이터의 저장과 검색을 위해서 리눅스 클러스터 파일시스템의 디렉토리는 점차 대규모로 되고 있다. 그들 중 대표적인 GFS의 디렉토리는 동적 해싱의 하나인 빠른 검객을 지원하는 확장 해싱을 이용하고 있다. GFS의 디렉토리의 주된 특징은 모든 리프 노드들이 트리의 동일한 레벨에 놓이는 플랫 구조를 가지고 있다. 그러나 리프 노드에서 오버플로우가 발생하게 되면 레벨이 하나 증가하면서 갑자기 데이터 블록의 임의의 평균 접근 시간이 길어지는 단점이 있다. 또 다른 동적 해싱으로는 선형해싱을 들 수 있고, 이는 확장 해싱보다 파일 접근에 좋은 성능을 보여준다. 본 논문에서는 플랫 구조보다 더 좋은 접근 성능을 가지는 세미 플랫 구조를 이용하여, 대규모 리눅스 클러스터 파일 시스템을 위한 확장 해싱 디렉토리와 선형 해싱 디렉토리를 설계 및 구현하고 그들의 성능을 비교한다. 성능 평가 결과, 파일의 삽입 면에서는 선형 해싱 기반의 디렉토리가 좋은 성능을 보였으나, 공간 활용 면에서는 확장 해싱 기반의 디렉토리가 좋은 성능을 보였다.

  • PDF

LOCK을 확장한 3차원 단백질 구조비교 및 분석시스템의 설계 및 구현 (Comparison and Analyzing System for Protein Tertiary Structure Database expands LOCK)

  • 정광수;한욱;박성희;류근호
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.247-258
    • /
    • 2005
  • 단백질의 구조는 단백질의 기능과 밀접한 연관을 가지고 있으며 단백질 구조비교는 단백질의 모티프와 패밀리를 결정하고 나아가서 그들의 기능을 파악하는데 매우 중요한 역할을 한다. 이 논문에서는 단백질 구조데이터 및 관련된 문헌 데이터의 통합된 데이터베이스를 구축하고 웹 환경에서 질의된 단백질과 유사성 비교를 진행하여 그 결과 및 연관된 문헌데이터를 검색하여 체계적으로 정보를 제공하는 단백질 분석시스템을 제안한다. 제안 시스템을 구축하기 위하여 현재까지 가장 큰 단백질 구조데이터의 저장소인 Protein Data Bank의 플랫파일 데이터에 대해 분석을 진행하고 여기에서 단백질의 구조비교 알고리즘에 필수적인 구조데이터정보를 추출하여 새로운 구조비교에 사용되는 엔트리 플랫 파일을 만들어서 데이터베이스를 구축한다 이러한 엔트리에 연관된 분석정보 데이터는 데이터베이스 스키마를 작성하여 문헌정보 데이터베이스를 구축한다. 따라서 사용자가 인터넷을 통하여 진행한 질의는 구조비교엔진을 통하여 유사부분과 RMSD값이 계산되고 이와 연관된 문헌정보의 검색이 진행된 후 체계적으로 출력화면에 보여준다. 제안 시스템은 기존의 구조비교시스템보다 빠른 검색을 지원하고 더 훌륭한 분석환경을 제공한다.

XML 뷰 기반의 생물 정보원 통합 시스템 개발 (Development of an Integration System for Biological Information Sources based on XML Views)

  • 정재훈;박은경;정채영;김현주;배종민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.77-80
    • /
    • 2005
  • 생물정보원은 이질성이 높고 사용자의 요구사항이 다양하다. 본 논문은 이러한 이질성을 해결하고 사용자의 다양한 요구사항에 쉽게 대처할 수 있는 XML 기반의 생물정보원 통합시스템의 설계개념과 구조 및 구현결과를 제시한다. 제시하는 통합시스템은 관계형테이블, 객체, XML, 플랫파일 등 다양한 자료형을 지원하면서, 관계형, 객체관계형, 웹자원, 응용프로그램 등 데이터 관리모델에 무관한 뷰 정의 및 질의처리모델이다. 그리고 사용자정의 XML 뷰 기반의 뷰 관리 및 질의처리를 통하여 사용자의 다양한 요구사항에 쉽게 적응할 수 있는 미디에이터 질의처리 기반의 생물정보원 통합시스템을 제시한다.

  • PDF

논리 프로그램의 병렬도 개선을 위한 플랫 인덱싱 기법 (Flat Indexing: A Compilation Technique to Enhance the Parallelism of Logic Programs)

  • 김희철;이용두
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1908-1922
    • /
    • 1998
  • 본 논문은 논리언어 프로그램의 효율적인 클로즈(Clause) 인덱싱을 위한 컴파일 기법에 대한 체계적인 접근방법을 제시한다. 본 접근방법의 핵심으로서 노드당 평균 병렬도와 클로즈 수행시도(clause trial) 횟수를 정확하게 나타낼 수 있는 기법으로서 인덱싱트리(Indexign Tree)를 제안한다. 인덱싱트리는 인덱싱 수행 시에 인덱싱을 위한 지시어(Instruction)의 수행 결과로 프로그램으 컨트롤이 실패처리코드로 이동하는 경우도 정량적으로 나타내 준다. 인덱싱트리를 사용하여 논리 프로그램을 위한 대표적인 가상머신인 WAM(Warren Abstract Machine)을 분석한 결과, WAM에서 사용하는 인덱싱 기법이 논리 프로그램의 병렬 처리에 있어 탐색트리의 병렬도를 감소시키며, 또한 스케쥴링의 효율성을 저하시키는 결점을 내포하고 있음을 발견할 수 있었다. 이러한 결점을 해결하기 위하여 본 논문은 플랫 인덱싱이라는 새로운 인덱싱 기법을 제안하고 이것을 실제 논리언어 컴파일러에 구현하여 측정한 향상 및 분석 결과를 보여준다.

  • PDF