• 제목/요약/키워드: XML Databases

검색결과 230건 처리시간 0.032초

Requirement Analysis for Bio-Information Integration Systems

  • Lee, Sean;Lee, Phil-Hyoun;Dokyun Na;Lee, Doheon;Lee, Kwanghyung;Bae, Myung-Nam
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.11-15
    • /
    • 2003
  • Amount of biological data information has been increasing exponentially. In order to cope with this bio-information explosion, it is necessary to construct a biological data information integration system. The integration system could provide useful services for bio-application developers by answering general complex queries that require accessing information from heterogeneous bio data sources, and easily accommodate a new database into the integrated systems. In this paper, we analyze architectures and mechanisms of existing integration systems with their advantages and disadvantages. Based on this analysis and user requirement studies, we propose an integration system framework that embraces advantages of the existing systems. More specifically, we propose an integration system architecture composed of a mediator and wrappers, which can offer a service interface layer for various other applications as well as independent biologists, thus playing the role of database management system for biology applications. In other words, the system can help abstract the heterogeneous information structures and formats from the application layer. In the system, the wrappers send database-specific queries and report the result to the mediator using XML. The proposed system could facilitate in silico knowledge discovery by allowing combination of numerous discrete biological information databases.

  • PDF

Building an Integrated Protein Data Management System Using the XPath Query Process

  • Cha Hyo Soung;Jung Kwang Su;Jung Young Jin;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.99-102
    • /
    • 2004
  • Recently according to developing of bioinformatics techniques, there are a lot of researches about large amount of biological data. And a variety of files and databases are being used to manage these data efficiently. However, because of the deficiency of standardization there are a lot of problems to manage the data and transform one into the other among heterogeneous formats. We are interested in integrating. saving, and managing gene and protein sequence data generated through sequencing. Accordingly, in this paper the goal of our research is to implement the system to manage sequence data and transform a sequence file format into other format. To satisfy these requirements, we adopt BSML (Bioinformatics Sequence Markup Language) as the standard to manage the bioinformatics data. And then we integrate and store the heterogeneous 리at file formats using BSML schema based DTD. And we developed the system to apply the characteristics of object-oriented database and to process XPath query, one of the efficient structural query. that saves and manages XML documents easily.

  • PDF

에이전트 기반의 벼 기능 유전자 통합 데이터베이스 (An agent-based integrated database for rice functional genomics)

  • 이기열;신문수;안수영;정동훈;안진흥;정무영
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1702-1706
    • /
    • 2006
  • In the field of rice research, insertional mutants have become a valuable resource for studies of gene function. However, a well-designed database yet in the area of rice functional genomics. The relevant data are widely distributed and independently managed by the individual research groups. Heterogeneous data format in the distributed database systems causes many problems related to redundancy and compatibility. In this research, integration of the distributed databases using agent technology is pursued. In particular, a data integration agent, an ontology agent, a comparison agent, and resource agents are designed, whereby the integrated database is maintained. Moreover a framework for the web-based information system, which provides information to biologists and permits biologists to add new data to the database, is proposed. To establish an interoperable data format, an XML-based data model is also developed adopting ontology concept.

  • PDF

GWB: 유전자 서열 데이터의 관리와 분석을 위한 통합 소프트웨어 시스템 (GWB: An integrated software system for Managing and Analyzing Genomic Sequences)

  • 김인철;진훈
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 논문에서는 효율적인 유전자 서열 데이터의 관리와 분석을 위한 웹 기반의 통합 시스템인 GWB(Gene WorkBench)의 설계와 구현에 대해 설명한다. 유전자 서열을 다루는 기존의 시스템들은 서열 데이터의 관리 기능과 분석 기능을 동시에 지원하는 경우가 드물고, 또한 분석 기능 역시 일부 혹은 단일 분석 기능만을 제공하는 단위 프로그램들이 대부분이다. 또 이러한 분석 프로그램들마저 서로 분산되어 있고 다른 수행환경을 필요로 한다. 따라서 이러한 프로그램들을 함께 이용하기 위해서는 많은 수작업과 변환작업을 필요로 하는 등 유전자 서열 데이터를 다루는 많은 생명과학 연구자들이 불편을 겪어왔다. 본 논문에서는 기존 시스템들의 단점을 보완하고 유전자 서열 연구에 효과적으로 도움을 줄 수 있는 보다 편리한 시스템을 구현하고자, 서열 데이터베이스 관리 기능과 다양한 분석 기능들을 하나의 시스템인 GWB로 동합하였다. GWB 시스템 설계의 가상 중요한 이슈는 서로 상이한 분석 프로그램들을 어떻게 하나의 시스템으로 통합할 것이며, 또 이들 프로그램들이 요구하는 서로 다른 서열 데이터 및 서열 데이터베이스 형태를 어떻게 제공할 수 있느냐는 것이다. GWB는 이 문제들을 해결하기 위해 공통의 입출력 인터페이스인 포장기를 이용하여 서로 다른 분석 프로그램들을 시스템에 통합시켰고, 공통 서열 데이터 형식인 KSF를 제안하였으며, 로컬 서열 데이터베이스를 관계형 데이터베이스부분과 색인 순차파일부분으로 나누어 구성하였고, 서로 상이한 서열 데이터 형식간의 변환 기능과 XML 파일로의 변환 기능을 제공하도록 하였다.유의하게 높았다 (P<0.01). 고형물질별 피복지수는 red clover는 V나 V+T(1 : 1)로 피복한 종자에서 높았으며 tall fescue는 T, V, V + T(1 : 1로 피복한 종자)에서 가장 높게 나타났다(P<0.01). 종자피복에 있어서 red clover와 tall fescue 공히 접착제는 CF나 PVA로 하고 고형물질은 V나 V+T(1:1)로 피복함으로서 가장 좋은 피복효과를 얻을 수 있었다.. 쟁점 및 과제들이 제시되었다. cells of these species contained considerable to large amount of neutral mucin, and small to considerable amount of acid mucin, Most of the medium sized and small mucous cells contained neutral mucin and sialomucin, but a few mucous cells contained neutral mucin and strongly sulfomucin or neutral combined with strongly sulfomucin and sialomucin. Most of the esophageal mucous cells pf Bryzoichthys lysimus contained small amount of neutral mucin, while on the other hand a feww mucous cells contained small amount of neutral mucin and minimal

  • PDF

TTA 표준 교통 프레임워크 데이터 모델 기반 GML 변환 시스템 설계 및 구현 (Design and Implementation of GML Transformation System based on Standard Transportation Framework Model of TTA)

  • 이기원;김학훈
    • 한국지리정보학회지
    • /
    • 제9권3호
    • /
    • pp.25-35
    • /
    • 2006
  • 공간정보 응용 분야에서 표준화 및 표준화 관련 연구와 기술 개발은 최근 중요한 현안중의 하나로 간주되고 있다. 국내외에서 다양한 표준안과 관련 기술 사양들이 발표되고 있으나 현실적으로는 이러한 표준사양을 수용하고 실무적으로 활용할 수 있는 개발 사례는 그리 많지 않다. 본 연구에서는 OGC에서 제안한 XML 기반의 지리정보 엔코딩 표준 방식인 Geography Markup Language(GML) 3.0과 한국정보통신기술협회(TTA)에서 개발한 우리나라 표준 교통데이터 모델을 연동하여 공간자료를 편집, 관리하고 유통할 수 있는 시스템을 설계 및 구현하였다. 본 연구에서 개발된 시스템은 실무 적용성을 고려하여 ESRI shapefile 자료구조로 구축된 기본 교통데이터를 입력 대상 자료로 하여 표준 교통데이터 모델의 기본 엔터티를 GML로 직접 변환 및 편집할 수 있도록 한다. 한편 웹 기반 운영 환경에서 GML로 변환된 GIS 정보의 가시화를 위하여 SVG 형식을 지원하는 출력 기능을 구현하였다. 현재 본 시스템에서는 TTA 표준 교통 데이터 모델을 시범적으로 적용하였으나 기본적인 범용적인 GIS 자료의 입력 및 GML 편집 기능을 제공하므로 교통데이터 모델외에 다른 응용 분야에서의 표준 데이터모델이 개발되면 별도의 작업 없이 직접 적용할 수 있다. 따라서 본 연구에서 개발된 GML 기반의 공간정보 편집 시스템은 표준 데이터 모델의 실무 적용성, 시험 운영 및 사양 검증을 위한 실무적인 도구로도 활용이 가능하다.

  • PDF

Ontology를 이용한 이종 메타데이터 검색 시스템의 설계 및 구현 (A Design and Implementation of Heterogeneous Metadata Searching System using Ontology)

  • 최현종;김태영
    • 정보교육학회논문지
    • /
    • 제8권3호
    • /
    • pp.353-360
    • /
    • 2004
  • 웹은 이제 더 이상 무의미한 정보의 바다가 아니라, 의미있는 정보를 사용자에게 정확하게 전해줄 수 있는 새로운 Semantic Web 시대를 맞이하고 있다. 그 출발점이 XML과 메타데이터였다면 웹의 자원을 연결시켜 주는 RDF를 거쳐, 이제는 의미와 논리가 Ontology를 통해 자리 잡고 있다. 현재 국내의 많은 웹 교육 자료들이 한국교육학술정보원의 메타데이터형식(KEM)에 메타데이터가 구축되었다. 따라서 우리나라도 이제는 의미와 논리의 형식을 연구해야 될 시기가 되었다. 하지만, 국내의 많은 연구자들은 KEM보다 DublinCore의 DC와 SCORM의 LOM의 연구에 더 적극적이다. 따라서 현재는 의미와 추론의 연구보다 세 개의 서로 다른 메타데이터를 엮어서로 공유하고 통합할 수 있는 방법의 연구가 선행되어져야 한다. 이에 본 연구는 세 메타데이터 형식을 통합해주는 Ontology를 설계해 보고, 프로토타입 검색 시스템을 구현해 보았다. 연구 결과 세 메타데이터의 많은 요소들이 서로 같은 요소 이름과 의미를 가지고 있었고, 몇 개의 요소들은 서로 같은 의미이지만 다른 요소 이름을 가지고 있었다. Ontology를 설계할 때 이렇게 동일한 의미를 가진 다른 이름의 요소들은 일대일 매핑 기법을 적용하여 설계하였다. 본 연구에서 설계한 Ontology가 세 가지 다른 형식의 메타데이터를 통합하는 통합 스키마로 활용될 수 있음을 확인하였다. 더불어 검색 결과를 좀 더 다양하게 동의, 반의, 계층, 연관 관계까지 제공하기 위해서는 좀 더 정교한 속성 설계가 필요하였다.

  • PDF

오령산 구성성분-타겟 네트워크 분석 (Analysis of a Compound-Target Network of Oryeong-san)

  • 김상균
    • 한국지식정보기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.607-614
    • /
    • 2018
  • 오령산은 몸 속의 수분을 순환시키고 소변으로 배출이 잘 되게 하는 효능이 있어 수분이 정체되어 나타나는 질환에 많이 쓰이는 처방이다. 본 연구에서는 시스템 약리학 접근 방법을 이용해서 오령산의 작용 기전을 탐색하기 위해서 오령산의 구성약재의 성분-타겟 네트워크를 구축하고 분석하였다. 우선, 오령산의 475개 성분에 대해서 STITCH 데이터베이스에서 연관된 타겟을 검색하였으며, 성분과 타겟의 상호작용에 대한 검색 결과는 XML 파일로 다운로드하였다. 본 연구에서 성분-타겟 네트워크는 Gephi를 이용해서 시각화하고 탐색하였다. 노드는 성분과 타겟이 되고, 링크는 성분과 타겟들간에 상호작용이 존재하면 연결되며, 상호작용의 신뢰도에 따라 링크에 가중치를 부여하였다. MCL 알고리즘을 이용해서 네트워크를 클러스터링 하였으며, 총 130개의 클러스터가 생성되었다. 가장 많은 노드를 가지는 클러스터에서 노드의 개수는 32개였다. 성분-타겟 네트워크에서 약재의 유효 성분들이 신장의 혈압 조절 기능과 관련된 타겟들과 연결되어 있는 것을 발견할 수 있었다. 향후에는 질병 데이터베이스와 연계해서 보다 명확한 오령산의 작용 기전을 밝힐 수 있도록 할 계획이다.

워크플로우 환경에서의 대규모 서열 유사성 검색 웹 서비스에 관한 연구 (A Study on Web Services for Sequence Similarity search in the Workflow Environment)

  • 정진영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.41-49
    • /
    • 2008
  • 최근 생물정보학에서의 워크플로우 관리 도구를 이용한 생명 현상에 대한 연구가 활발하게 진행되고 있다. 워크플로우 관리 도구는 서비스의 재사용과 공유를 통해 연구자들이 서로 협업할 수 있는 기반으로 MyGrid 프로젝트의 Taverna를 비롯하여 Kepler, BioWMS 등의 다양한 워크플로우 관리 도구들이 오픈소스로 개발되어 사용 되고 있다. 이러한 워크플로우 관리 도구는 공간적으로 떨어진 서로 다른 서비스들을 웹 서비스 기술을 기반으로 하나의 작업공간에서 연구 과정을 모델링하고 자동화 할 수 있도록 해준다. 생물정보학에서 사용되는 많은 도구와 데이터베이스들이 웹 서비스 형태로 제공되어 워크플로우 관리 도구에서 사용되고 있다. 이러한 상황에서 생물정보학에서 기본으로 사용되는 서열 유사성 검색에 대한 웹 서비스의 개발과 안정적인 서비스 제공은 생물정보학 분야에서 필수적이라 할 수 있다. 본 논문에서는 리눅스 클러스터를 기반으로 생물학 서열 데이터의 유사성 검색 속도를 향상시키는 한편, 이를 웹 서비스 형태로 개발하여 워크플로우 관리 도구와의 연동하여 단시간에 서열 유사성 검색을 가능하게 하였다.

  • PDF

The Application of Geography Markup Language(GML) to the Maritime Information

  • Oh, Se-Woong;Park, Jong-Min;Suh, Sang-Hyun
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2006년도 International Symposium on GPS/GNSS Vol.1
    • /
    • pp.519-524
    • /
    • 2006
  • This paper describes an application of information presentation based geographic map for maritime information, including navigation information. The work is motivated by the need to prepare maritime information representation and distribution for future generation Web network technology. This works consist of map generation using GML and application to maritime information. GML 3.0 became an adopted specification of the Open Geospatial Consortium(OGC) in January 2003, and is rapidly emerging as the world standard for the encoding, transport and storage of all forms of geographic information. This paper looks at the application of GML to one of the more challenging areas of maritime information. Specific features of GML of interest to maritime information provider are discussed and then illustrated through a series of maritime information case studies. The first phase of the work consists of the construction of GML application schema for using as a base map of maritime information. Maritime information is acquired from multiple sources, including standards documents, database schemas, lexicons, collections of symbol definition. The sources of GML ontological knowledge and the contribution of each source to the overall ontology are described in this paper. In the second phase, the prepared GML is used to create a prototype of the mixed maritime information as a base map - for tagging documents within the maritime domain. An overview of this prototype is included. One application area for these information elements described here is the integrated retrieval of maritime information from diverse sources, ranging from Web sites to nautical chart databases and text documents.

  • PDF

효율적인 ROLAP 큐브 생성 방법 (An Efficient ROLAP Cube Generation Scheme)

  • 김명;송지숙
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.99-109
    • /
    • 2002
  • ROLAP(Relational Online Analytical Processing)은 다차원적 데이타 분석을 위한 제반 기술로써, 전사적 데이타 웨어하우스로부터 고부가가치를 창출하는데 필수적인 기술이다. 질의처리 성능을 높이기 위해서 대부분의 ROLAP 시스템들은 집계 테이블들을 미리 계산해 둔다. 이를 큐브 생성이라고 하며, 이 과정에서 기존의 방법들은 데이타를 여러 차례 정렬해야 하고 이는 큐브 생성의 성능을 저하시키는 큰 요인이다. (1)은 MOLAP 큐브 생성 알고리즘을 통해 간접적으로 ROLAP 큐브를 생성하는 것이 훨씬 빠르다는 것을 보였다. 본 연구에서도 MOLAP 큐브 생성 알고리즘을 사용한 신속하고 확장적인 ROLAP 큐브 생성 알고리즘을 제시하였다. 분석할 입력 사실 테이블을 적절하게 조각내어 메모리 효율을 높였고, 집계 테이블들을 최소 부모 집계 테이블로부터 생성하도록 하여 큐브 생성 시간을 단축하였다. 제안한 방법의 효율성은 실험을 통해 검증하였다.