• 제목/요약/키워드: Database Construction

검색결과 1,433건 처리시간 0.023초

단백질-단백질 상호작용 경로 분석 알고리즘의 설계 및 구현 (Design and Implementation of the Protein to Protein Interaction Pathway Analysis Algorithms)

  • 이재권;강태호;이영훈;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.511-515
    • /
    • 2004
  • Post-genome 시대에는 유전체뿐만 아니라 단백질에 대한 연구의 필요성이 증대되고 있다. 특히 단백질-단백질 상호작용 및 단백질 네트워크에 대한 연구를 기반으로 전체 생물 시스템을 분석하는 연구가 중요한 이슈로 떠오르고 있다. 기존에 생물학자들이 실험을 통해서 증명한 사실들을 논문이나 기타 매체를 통해서 공개를 하고 있다. 하지만 공개된 정보의 양이 방대하므로 생물학자들이 정보를 효율적으로 이용하지 못하는 경우가 많다. 인터넷의 발달로 하루에도 수 없이 쏟아져 나오는 연구 성과들에 쉽게 접근이 가능해졌다. 이러한 매체로부터 생물학적 의미를 가지는 정보를 효과적으로 추출하는 일이 중요하게 대두되었다. 따라서 본 연구에서는 인터넷상에 공개된 다량의 논문 및 기타정보 매체로부터 단백질-단백질 상호작용 정보를 추출한 데이터베이스로부터 단백질의 네트워크를 구성하고 단백질 네트워크를 통해서 생물학적 의미를 가지는 여러 가지 경로 분석 알고리즘을 설계하고 구현한다.

  • PDF

반복학습법에 의해 작성한 N-gram 언어모델을 이용한 연속음성인식에 관한 연구 (Continuous Speech Recognition Using N-gram Language Models Constructed by Iterative Learning)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.62-70
    • /
    • 2000
  • 일반적으로 통계적 언어모델의 확률을 추정하는 방법은 대량의 텍스트 데이터로부터 출현빈도가 높은 단어를 선택하여 사용하고 있다. 하지만 특정 태스크에서 적용할 언어모델의 경우 시간적, 비용적 측면을 고려할 때 대용량의 텍스트의 사용은 비효율적일 것이다. 본 논문에서는 특정 태스크에서 사용하기 위해 소량의 텍스트 데이터로부터 효율적인 언어모델을 작성하는 방법을 제안한다. 즉, 언어모델을 작성할 때 출현빈도가 낮은 단어의 빈도를 개선하기 위해 같은 문장을 반복하여 학습에 참가시키므로 단어의 발생확률을 좀 더 강건하게 하였으며 제안된 언어모델을 이용하여 3명이 발성한 항공편 예약관련 200문장에 대하여 연속음성인식 실험을 수행하였다. 인식실험 결과, 반복학습에 의해 작성한 언어모델을 이용한 경우가 반복학습 적용 전에 비하여 평균 20.4%의 인식률 향상을 보였다. 또한 기존의 문맥자유문법을 이용한 시스템과 비교하여 인식률이 평균 13.4% 향상되어 제안한 방법이 시스템에 유효함을 확인하였다.

  • PDF

계층적 군집분석 기반의 Continuous Risk Profile을 이용한 고속도로 사고취약구간 선정 (Identifying Hotspots on Freeways Using the Continuous Risk Profile With Hierarchical Clustering Analysis)

  • 이서영;김철순;김동규;이청원
    • 대한교통학회지
    • /
    • 제31권4호
    • /
    • pp.85-94
    • /
    • 2013
  • Continuous Risk Profile(CRP)은 고속도로의 사고취약구간을 선정하는 방법론 중에서 정확성과 효율성이 뛰어난 것으로 알려져 있다. 그러나 전통적인 CRP는 데이터베이스 구축을 위한 대규모 투자를 필요로 하는 안전성능함수를 이용한다. 본 연구는 안전성능함수 대신 동질 그룹들의 평균사고건수를 규모조정계수로 이용하는 CRP를 제안하는 것을 목적으로 한다. 고속도로 구간들을 동질 그룹으로 분류하기 위하여 각 구간의 AADT와 차로 수 자료를 기반으로 하는 계층적 군집분석이 수행된다. 제안된 모형은 캘리포니아의 I-880 자료를 이용하여 다른 여러 가지 사고취약구간 선정방법들과 비교된다. 분석 결과에 따르면, 제안된 모형은 false negative를 발생시키지 않으며 false positive rate를 감소시킨다. 본 연구에서 개발된 방법론은 추가적인 복잡한 데이터베이스 없이 고속도로 사고취약구간을 선정하는 데에 활용될 수 있으며, 또한 고속도로 안전관리시스템을 개선하는 데에 기여할 수 있다.

문자-음성 합성기의 데이터 베이스를 위한 문맥 적응 음소 분할 (Context-adaptive Phoneme Segmentation for a TTS Database)

  • 이기승;김정수
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.135-144
    • /
    • 2003
  • 본 논문에서는 문-음성 합성기에서 사용되는 대용량 데이터 베이스의 구성을 목적으로 하는 음성 신호의 자동 분할기법을 기술하였다. 주된 내용은 은닉 마코프 모델에 기반을 둔 음소 분할과 여기서 얻어진 결과를 초기 음소 경계로 사용하여 이를 자동으로 수정하는 방법으로 구성되어 있다. 다층 퍼셉트론이 음성 경계의 검출기로 사용되었으며, 음소 분할의 성능을 증가시키기 위해, 음소의 천이 패턴에 따라 다층 퍼셉트론을 개별적으로 학습시키는 방법이 제안되었다. 음소 천이 패턴은 수작업에 의해 생성된 레이블 정보를 기준 음소 경계로 사용하여, 기준 음소 경계와 추정된 음소 경계간의 전체 오차를 최소화하는 관점에서 분할되도록 하였다. 단일 화자를 대상으로 하는 실험에서 제안된 기법을 통해 생성된 음소 경계는 기준 경계와 비교하여 95%의 음소가 20 msec 이내의 경계 오차를 갖는 것으로 나타났으며, 평균 자승 제곱근 오차면에서 수정 작업을 통해 25% 향상된 결과를 나타내었다.

교통시설 DB구축과 환승시설 설계 적용에 관한 연구 (Construction of Transportation Facility Database and Design Process for Intermodal Facilities)

  • 임미;신용은;백태경
    • 한국지리정보학회지
    • /
    • 제11권3호
    • /
    • pp.127-135
    • /
    • 2008
  • 여러 교통수단이 만나는 교통 결절점에서 이용자의 수단간 환승의 편의를 도모하는 환승시설은 명확한 합리적 기준과 원칙에 의해 설계되어야하나 우리나라의 경우 주로 설계가의 주관과 외관에 치중되어 효율적이고 기능적이지 못한 경우가 많다. 본 연구의 주목적은 환승시설의 운영효율성과 서비스 질을 제고하기 위한 기본적 설계원칙의 제시와 이에 기초한 환승시설 설계과정 소개에 있다. 이를 위해 설계과정에 기초한 고려사항과 필요자료를 검토하고 이를 기초로 GIS를 활용한 교통DB를 구축하였다. 구축된 교통DB는 설계과정에 요구되는 항목 뿐 아니라 시설 관리에도 적용될 수 있는 포괄적인 내용을 포함한다. 본 연구에서 제시된 원칙을 부산역 설계안에 적용하여 문제점을 파악하고 제시된 원칙에 기초하여 개선안을 제시하였다.

  • PDF

시스템 구축 과정에서 소프트웨어 자동생성 도구의 적용 (Automated Generation of Software Systems in Systems Construction)

  • 정일주
    • 정보기술응용연구
    • /
    • 제3권4호
    • /
    • pp.63-92
    • /
    • 2001
  • 1970대 이후 CASE 도구들은 꾸준히 발전되어 오고 활용은 보편화되고 있다. 많은 CASE 도구들은 보다 확대된 기능을 제공하기 위하여 통합되고 연계되고 있다. 한편 E-R 모델은 모델링 도구로서 널리 사용되고 있으며 대부분의 CASE 도구들이 E-R 모델을 지원하고 있다. 본 연구에서는E-R 모델에 내재한 여러 가지 특성과 응용시스템의 기본 요소들 사이에 관계를 설정하고 이를 이용하여 응용시스템을 자동적으로 생성할 수 있는 방법을 제시한다. 먼저 E-R 모델로부터 일정한 규칙에 의해 업무 프로그램, 프로그램간의 링크, 지속적 데이터 등으로 구성된 정형적 응용시스템이 생성된다. 정형적 시스템은 이용자를 위한 인터페이스 설계를 거쳐 최종적인 응용시스템으로 생성된다. 본 연구에서는 제안된 자동생성과정의 실현가능성을 가상의 시스템을 대상으로 검증해 본다. 본 연구에서 제안된 응용시스템의 자동생성 방안은 CASE 도구들의 모델링 기능과 코드 생성 기능을 연계하고 통합할 수 있는 하나의 대안을 제시할 것으로 기대된다. 동시에 종래에 데이터모델링 도구로서 주로 인식되어 온 E-R 모델에 관한 연구를 응용시스템 전체에 대한 모델링의 관점으로 확대할 수 있을 것으로 기대된다.

  • PDF

A new thermal conductivity estimation model for weathered granite soils in Korea

  • Go, Gyu-Hyun;Lee, Seung-Rae;Kim, Young-Sang;Park, Hyun-Ku;Yoon, Seok
    • Geomechanics and Engineering
    • /
    • 제6권4호
    • /
    • pp.359-376
    • /
    • 2014
  • Thermal conductivity of ground has a great influence on the performance of Ground Heat Exchangers (GHEs). In general, the ground thermal conductivity significantly depends on the density (or porosity) and the moisture content since they are decisive factors that determine the interface area between soil particles which is available for heat transfer. In this study, a large number of thermal conductivity experiments were conducted for soils of varying porosity and moisture content, and a database of thermal properties for the weathered granite soils was set up. Based on the database, a 3D Curved Surface Model and an Artificial Neural Network Model (ANNM) were proposed for estimating the thermal conductivity. The new models were validated by comparing predictions by the models with new thermal conductivity data, which had not been used in developing the models. As for the 3D CSM, the normalized average values of training and test data were 1.079 and 1.061 with variations of 0.158 and 0.148, respectively. The predictions became somewhat unreliable in a low range of thermal conductivity values in considering the distribution pattern. As for the ANNM, the 'Logsig-Tansig' transfer function combination with nine neurons gave the most accurate estimates. The normalized average values of training data and test data were 1.006 and 0.954 with variations of 0.026 and 0.098, respectively. It can be concluded that the ANNM gives much better results than the 3D CSM.

Construction of a Protein-Protein Interaction Network for Chronic Myelocytic Leukemia and Pathway Prediction of Molecular Complexes

  • Zhou, Chao;Teng, Wen-Jing;Yang, Jing;Hu, Zhen-Bo;Wang, Cong-Cong;Qin, Bao-Ning;Lv, Qing-Liang;Liu, Ze-Wang;Sun, Chang-Gang
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권13호
    • /
    • pp.5325-5330
    • /
    • 2014
  • Background: Chronic myelocytic leukemia is a disease that threatens both adults and children. Great progress has been achieved in treatment but protein-protein interaction networks underlining chronic myelocytic leukemia are less known. Objective: To develop a protein-protein interaction network for chronic myelocytic leukemia based on gene expression and to predict biological pathways underlying molecular complexes in the network. Materials and Methods: Genes involved in chronic myelocytic leukemia were selected from OMIM database. Literature mining was performed by Agilent Literature Search plugin and a protein-protein interaction network of chronic myelocytic leukemia was established by Cytoscape. The molecular complexes in the network were detected by Clusterviz plugin and pathway enrichment of molecular complexes were performed by DAVID online. Results and Discussion: There are seventy-nine chronic myelocytic leukemia genes in the Mendelian Inheritance In Man Database. The protein-protein interaction network of chronic myelocytic leukemia contained 638 nodes, 1830 edges and perhaps 5 molecular complexes. Among them, complex 1 is involved in pathways that are related to cytokine secretion, cytokine-receptor binding, cytokine receptor signaling, while complex 3 is related to biological behavior of tumors which can provide the bioinformatic foundation for further understanding the mechanisms of chronic myelocytic leukemia.

항공기 통합기술정보시스템(ITIS) 개발 및 운용 (Development and Operation of Integrated Technical Information System(ITIS) for an Aircraft Development)

  • 정준영;이준우;김천영
    • 한국콘텐츠학회논문지
    • /
    • 제6권2호
    • /
    • pp.75-83
    • /
    • 2006
  • 항공기 체계부에서는 연구개발 과정에서 발생되는 기술자료에 대해서 데이터베이스 관리시스템을 이용하여 체계적으로 관리하는 기술자료 관리시스템을 운용하였으며, 수행중인 항공기 개발 사업에 프로젝트별로 연구개발 기술자료를 관리하였다. 그러나 사업별로 분리하여 사용자 관리 및 기술자료를 관리함에 따라 업무메모 워크플로 및 기술자료 검색 등에 문제점을 야기하였으며, 이에 따라 사업별 기술자료 관리시스템을 통합 관리할 수 있는 웹기반 통합기술정보시스템을 개발하였다. 본 시스템의 구축 및 운용으로 사용자 및 권한을 관리하여 사업별로 접근할 수 있고, 통합기술정보시스템의 통합 화면에서 각 사용자별로 필요한 업무메모 워크플로 및 기술자료 검색을 효율적으로 수행할 수 있어 사업별 기술자료 관리 및 활용 등 연구 생산성을 극대화하였다.

  • PDF

AUTOMATIC 3D BUILDING INFORMATION EXTRACTION FROM A SINGLE QUICKBIRD IMAGE AND DIGITAL MAPS

  • Kim, Hye-Jin;Byun, Young-Gi;Choi, Jae-Wan;Han, You-Kyung;Kim, Yong-Il
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.238-242
    • /
    • 2007
  • Today's commercial high resolution satellite imagery such as that provided by IKONOS and QuickBird, offers the potential to extract useful spatial information for geographical database construction and GIS applications. Digital maps supply the most generally used GIS data probiding topography, road, and building information. Currently, the building information provided by digital maps is incompletely constructed for GIS applications due to planar position error and warped shape. We focus on extracting of the accurate building information including position, shape, and height to update the building information of the digital maps and GIS database. In this paper, we propose a new method of 3D building information extraction with a single high resolution satellite image and digital map. Co-registration between the QuickBird image and the 1:1,000 digital maps was carried out automatically using the RPC adjustment model and the building layer of the digital map was projected onto the image. The building roof boundaries were detected using the building layer from the digital map based on the satellite azimuth. The building shape could be modified using a snake algorithm. Then we measured the building height and traced the building bottom automatically using triangular vector structure (TVS) hypothesis. In order to evaluate the proposed method, we estimated accuracy of the extracted building information using LiDAR DSM.

  • PDF