Abstract
Recent massive data generation by genomics and proteomics requires bioinformatic tools to extract the biological meaning from the massive results. Here we introduce ROSPath, a database system to deal with information on reactive oxygen species (ROS)-mediated cell signaling pathways. It provides a structured repository for handling pathway related data and tools for querying, displaying, and analyzing pathways. ROSPath data model provides the extensibility for representing incomplete knowledge and the accessibility for linking the existing biochemical databases via the Internet. For flexibility and efficient retrieval, hierarchically structured data model is defined by using the object-oriented model. There are two major data types in ROSPath data model: ‘bio entity’ and ‘interaction’. Bio entity represents a single biochemical entity: a protein or protein state involved in ROS cell-signaling pathways. Interaction, characterized by a list of inputs and outputs, describes various types of relationship among bio entities. Typical interactions are protein state transitions, chemical reactions, and protein-protein interactions. A complex network can be constructed from ROSPath data model and thus provides a foundation for describing and analyzing various biochemical processes.
최근 유전체학과 단백질체학 분야에서 생성되는 방대한 분량의 데이타로부터 생물학적 의미를 추출해내기 위한 생물정보학적인 도구들에 대한 필요성이 크게 대두되고 있다. 본 논문에서는 세포 신호전달 경로에 관한 정보를 효율적으로 표현, 저장함은 물론 저장된 데이타로부터 생물학적 의미를 추출할 수 있도록 하기 위한 다양한 요구 조건들을 생물학자의 관점에서 분석하고, 이들 요구조건을 체계적으로 반영하여 설계한 ROSPath 데이타베이스 시스템을 제안한다. ROSPath 데이타 모델에서는 향후의 확장성을 고려하여 불완전한 지식의 표현이 가능하도록 하며 인터넷상에서 기존의 다른 생화학 데이타베이스를 공유할 수 있는 연결성을 제공한다. 또한, 객체지향 모델을 이용하여 계층적인 구성을 제공함으로써 효율적인 검색을 지원한다. ROSPath 데이타 모델은 두 가지 주요 데이타 요소인 ‘바이오 개체’와 ‘상호작용’으로 정의된다. 바이오 개체는 세포 신호전달 경로에 관여하는 단백질과 단백질 상태 등과 같은 개개의 생화학적인 개체를 의미하고, 상호작용은 단백질 상태 전이나 화학 반응, 단백질-단백질 상호작용 등과 같은 바이오 개체들 간의 다양한 관계 및 신호전달과정을 설명한다. 제안된 ROSPath 데이타 모델을 이용하여 구성되는 복잡한 정보 네트워크는 다양한 생화학 프로세스들을 기술하고 분석하는 데에 활용할 수 있다.