• 제목/요약/키워드: Large-scale Ontology

검색결과 34건 처리시간 0.025초

GOMS: Large-scale ontology management system using graph databases

  • Lee, Chun-Hee;Kang, Dong-oh
    • ETRI Journal
    • /
    • 제44권5호
    • /
    • pp.780-793
    • /
    • 2022
  • Large-scale ontology management is one of the main issues when using ontology data practically. Although many approaches have been proposed in relational database management systems (RDBMSs) or object-oriented DBMSs (OODBMSs) to develop large-scale ontology management systems, they have several limitations because ontology data structures are intrinsically different from traditional data structures in RDBMSs or OODBMSs. In addition, users have difficulty using ontology data because many terminologies (ontology nodes) in large-scale ontology data match with a given string keyword. Therefore, in this study, we propose a (graph database-based ontology management system (GOMS) to efficiently manage large-scale ontology data. GOMS uses a graph DBMS and provides new query templates to help users find key concepts or instances. Furthermore, to run queries with multiple joins and path conditions efficiently, we propose GOMS encoding as a filtering tool and develop hash-based join processing algorithms in the graph DBMS. Finally, we experimentally show that GOMS can process various types of queries efficiently.

신뢰 값 기반의 대용량 OWL Horst 온톨로지 추론 (Confidence Value based Large Scale OWL Horst Ontology Reasoning)

  • 이완곤;박현규;바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.553-561
    • /
    • 2016
  • 웹으로부터 얻어진 데이터를 통해 자동적으로 온톨로지를 확장하는 많은 기계학습 방법들이 존재한다. 또한 대용량 온톨로지 추론에 대한 관심이 증가하고 있다. 하지만 웹으로부터 얻어진 다양한 데이터의 신뢰성 문제를 고려하지 않으면, 불확실성을 내포하는 추론결과를 초래하는 문제점이 있다. 현재 대용량 온톨로지의 신뢰도를 반영하는 추론에 대한 연구가 부족하기 때문에 신뢰 값 기반의 대용량 온톨로지 추론 방법론이 요구되고 있다. 본 논문에서는 인메모리 기반의 분산 클러스터 프레임워크인 스파크 환경에서 신뢰 값 기반의 대용량 OWL Horst 추론 방법에 대해서 설명한다. 기존의 연구들의 문제점인 중복 추론된 데이터의 신뢰 값을 통합하는 방법을 제안한다. 또한 추론의 성능을 저하시키는 문제를 해결할 수 있는 분산 병렬 추론 알고리즘을 설명한다. 본 논문에서 제안하는 신뢰 값 기반의 추론 방법의 성능을 평가하기 위해 LUBM3000을 대상으로 실험을 진행했고, 기존의 추론엔진인 WebPIE에 비해 약 2배 이상의 성능을 얻었다.

AN ONTOLOGY SCHEME FOR DISCRIMINATING CONSTRUCTION IETM FROM EXISTING INFORMATION SYSTEMS

  • Jeong, Jinwook;Park, Moonseo
    • 국제학술발표논문집
    • /
    • The 3th International Conference on Construction Engineering and Project Management
    • /
    • pp.942-948
    • /
    • 2009
  • Today's construction is a large-scale and long life span program, so called Mega-scale project, that every moment constructor faces much of hardships, It is because of a large amount of stakeholders, data and complicated relationship among workers. In order to overcome these problems, IETM(Interactive Electronic Technical Manual) has been introduced to construction industry recently, It is regarded as a useful tool for handling the data, procedures of the construction, but it is similar to existing IT-based information systems, the PMIS(Project Management Information System) and the KMS(Knowledge Management System), without characterizing. This research is intended to find out IETM's property and to present the Ontology scheme discriminating Construction IETM from existing systems..

  • PDF

미디어 온톨로지의 시공간 정보 확장을 위한 분산 인메모리 기반의 대용량 RDFS 추론 및 질의 처리 엔진 (Distributed In-Memory based Large Scale RDFS Reasoning and Query Processing Engine for the Population of Temporal/Spatial Information of Media Ontology)

  • 이완곤;이남기;전명중;박영택
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.963-973
    • /
    • 2016
  • 대용량 미디어 온톨로지를 이용하여 의미 있는 지능형 서비스를 제공하기 위해 기존의 Axiom 추론뿐만 아니라 다양한 추론을 활용하는 지식 확장이 요구되고 있다. 특히 시공간 정보는 인공지능 응용분야에서 중요하게 활용될 수 있고, 시공간 정보의 표현과 추론에 대한 중요도는 지속적으로 증가하고 있다. 따라서 본 논문에서는 공간 정보를 추론에 활용하기 위해서 공공 주소체계에 대한 LOD를 대용량 미디어 온톨로지에 추가하고, 이러한 대용량 데이터 처리를 위해 인메모리 기반의 분산 처리 프레임워크를 활용하는 공간 추론을 포함하는 RDFS 추론 시스템을 제안한다. 또한 추론을 통해 확장된 데이터를 포함하는 대용량 온톨로지 데이터를 대상으로 하는 분산 병렬 시공간 SPARQL 질의 처리 방법에 대해서 설명한다. 제안하는 시스템의 성능을 측정하기 온톨로지 추론과 질의 처리 벤치 마킹을 위한 LUBM과 BSBM 데이터셋을 대상으로 실험을 진행했다.

분산 메모리 환경에서의 ABox 실체화 추론 (ABox Realization Reasoning in Distributed In-Memory System)

  • 이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.852-859
    • /
    • 2015
  • 최근 지식 정보의 양이 방대해지면서, 대용량 온톨로지를 효과적으로 추론하는 연구가 활발히 진행되고 있다. 이러한 추론 방법들은 TBox 분류와 ABox 실체화로 나누어진다. TBox 추론은 스키마의 무결성과 종속성을 주로 다룬다면, ABox 추론은 인스턴스 위주의 다양한 문제를 다루어서 실제 응용에서의 중요성이 매우 크다. 따라서 본 논문은 클래스의 제약 조건을 분석하고, 이를 통해 인스턴스가 속하는 클래스를 추론할 수 있는 방법을 제안한다. 객체 지향 언어 기반의 분산 파일 시스템을 활용했던 기존 방법과 달리 함수형 프로그래밍 기반의 인 메모리 시스템인 스파크를 통해 대용량 온톨로지 실체화 방법에 대해서 설명한다. 제안하는 기법의 효율성을 검증하기 위해 W3C의 Wine 온톨로지를 이용해 인스턴스를 생성(1억 2천만~6억개의 트리플)하고 실험을 수행하였다. 6억개의 트리플을 대상으로 진행한 실험의 경우 전체 추론 시간이 51분(696 K Triple/sec)이 소요되었다.

Improving methods for normalizing biomedical text entities with concepts from an ontology with (almost) no training data at BLAH5 the CONTES

  • Ferre, Arnaud;Ba, Mouhamadou;Bossy, Robert
    • Genomics & Informatics
    • /
    • 제17권2호
    • /
    • pp.20.1-20.5
    • /
    • 2019
  • Entity normalization, or entity linking in the general domain, is an information extraction task that aims to annotate/bind multiple words/expressions in raw text with semantic references, such as concepts of an ontology. An ontology consists minimally of a formally organized vocabulary or hierarchy of terms, which captures knowledge of a domain. Presently, machine-learning methods, often coupled with distributional representations, achieve good performance. However, these require large training datasets, which are not always available, especially for tasks in specialized domains. CONTES (CONcept-TErm System) is a supervised method that addresses entity normalization with ontology concepts using small training datasets. CONTES has some limitations, such as it does not scale well with very large ontologies, it tends to overgeneralize predictions, and it lacks valid representations for the out-of-vocabulary words. Here, we propose to assess different methods to reduce the dimensionality in the representation of the ontology. We also propose to calibrate parameters in order to make the predictions more accurate, and to address the problem of out-of-vocabulary words, with a specific method.

X-TOP: 레거시 시스템상에서 온톨로지 구축을 위한 토픽맵 플랫폼의 설계와 구현 (X-TOP: Design and Implementation of TopicMaps Platform for Ontology Construction on Legacy Systems)

  • 박여삼;장옥배;한성국
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권2호
    • /
    • pp.130-142
    • /
    • 2008
  • 토픽맵은 기존의 온톨로지 언어와는 달리 위치정보를 이용하여 형태를 변환하지 않고도 많은 양의 이종 정보 자원을 통합할 수 있는 온톨로지 언어이다. 지금까지 토픽맵 구축을 위한 여러 편집기등이 개발되어 있으나, 이들은 XTM 문서를 독자 방식으로 처리하고 있다. 따라서 대용량 자료를 처리하는 데 많은 시간이 소요되고, 현재 RDB 기반에서 운영되고 있는 레거시 시스템에 적용하여 실용화하기에는 많은 문제가 있다. 본 논문에서는 XTM 1.0 규격 기반의 대용량 토픽맵을 RDB 구조로 모델링하여, 처리시간을 최소화하고 레거시 시스템 상에서 온톨로지 구축이 가능하도록 하였다. 기존에 사용하고 있는 SQL 도구와 어플리케이션 개발 도구를 토픽맵 온톨로지 구축에 활용할 수 있도록 하여, 온톨로지 구축의 효율성을 높이고 XTM 문서와 데이타베이스간의 상호 호환이 가능한 토픽맵 플랫폼 X-TOP을 설계하고 구현하였다. X-TOP은 향후 사용자 인터페이스 변경과 다양한 DBMS를 지원할 수 있도록 3계층 구조를 갖고 있다. 헬스케어의 암 온톨로지 관리에 X-TOP을 적용하여 기존 시스템과의 성능 비교와 실무 응용의 유효성을 보였다.

GPU 클러스터 기반 대용량 온톨로지 추론 (Scalable Ontology Reasoning Using GPU Cluster Approach)

  • 홍진영;전명중;박영택
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.61-70
    • /
    • 2016
  • 근래에 들어 다양한 시멘틱 서비스를 위하여 기존의 지식을 바탕으로 새로운 지식을 고속으로 추론할 수 있는 대용량 온톨로지 추론 기법이 요구되고 있다. 이런 추세에 따라 대규모의 클러스터를 활용하는 하둡 및 Spark 프레임워크 기반의 온톨로지 추론 엔진 개발이 연구되고 있다. 또한, 기존의 CPU에 비해 많은 코어로 구성되어 있는 GPGPU를 활용하는 병렬 프로그래밍 방식도 온톨로지 추론에 활용되고 있다. 앞서 말한 두 가지 방식의 장점을 결합하여, 본 논문에서는 RDFS 대용량 온톨로지 데이터를 인-메모리 기반 프레임워크인 Spark를 통해 분산시키고 GPGPU를 이용하여 분산된 데이터를 고속 추론하는 방법을 제안한다. GPGPU를 통한 온톨로지 추론은 기존의 추론 방식보다 저비용으로 고속 추론을 수행하는 것이 가능하다. 또한 Spark 클러스터의 각 노드를 통하여 대용량 온톨로지 데이터에 대한 부하를 줄일 수 있다. 본 논문에서 제안하는 추론 엔진을 평가하기 위하여 LUBM10, 50, 100, 120에 대해 추론 속도를 실험하였고, 최대 데이터인 LUBM120(약 1백7십만 트리플, 2.1GB)의 실험 결과, 인-메모리(Spark) 추론 엔진 보다 7배 빠른 추론 성능을 보였다.

국방 온톨로지를 통한 지능형 의사결정지원시스템 구축 및 활용 - 공군 군수상황관리체계 적용 사례 (Construction and Application of Intelligent Decision Support System through Defense Ontology - Application example of Air Force Logistics Situation Management System)

  • 조원기;김학진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.77-97
    • /
    • 2019
  • 제 4차 산업혁명의 초연결 환경에서 발생하는 많은 양의 데이터는 제 4차 산업혁명을 기존의 생산 환경과 구분지어 주는 주요한 요소이다. 이러한 환경은 데이터를 필요로 하는 동시에 데이터를 생산하는 양면적인 특징을 가진다. 때문에 앞으로의 정보 시스템은 기존의 정보시스템보다 양적인 측면에서 더 많은 데이터를 처리해야 하며, 질적인 측면에서는 많은 데이터 중 사용자의 목적에 부합하는 목표 데이터만을 추출하는 능력이 요구된다. 작은 규모의 정보 시스템에서는 사람이 그 시스템을 정확히 이해하고 필요한 정보를 획득하는 것이 가능하지만, 시스템에 대해 정확한 이해가 어려워진 다양하고 복잡한 시스템에서는 원하는 정보를 획득하는 것이 점점 더 어려워진다. 이러한 문제는 데이터를 사람뿐 아니라 컴퓨터가 이해할 수 있는 온톨로지로 표현하여 다양한 정보처리가 가능하도록 하는 시맨틱 웹(Semantic Web) 구축이 해결책이 될 수 있다. 군에서도 현재 대부분의 업무가 정보 시스템을 통해 이루어지고 있는데, 정보의 입력이나 가공 등 단순처리 중심으로 구축된 기존 시스템이 점점 더 많은 양의 데이터를 포함하게 되면서 시스템을 쉽게 활용하기 위한 노력이 필요한 상황이다. 본 연구에서는 온톨로지를 통한 지능형 의사결정지원시스템의 예로 온톨로지 기반 군수상황관리체계를 제안하고자 한다. 온톨로지 기반 군수상황관리체계는 기존의 군수정보체계의 복잡한 정보를 직관적으로 보여주기 위해 구축된 군수상황관리체계를 온톨로지를 통해 구축하였으며, 성과기반군수지원 계약관리, 부품사전 등의 유용한 기능을 추가 식별하여 온톨로지에 포함하였다. 또한 구축된 온톨로지가 의사결정지원에 활용할 수 있는지를 확인하기 위해 시맨틱 웹 기술을 통해 기본적인 질의응답은 물론 추론 및 함수를 통한 분석기능을 구현하였다.

온톨로지 개발 방법론 분석 비교 (CMMI 버전 1.1 성숙 단계 2와 3을 기반으로) (Analysis and comparison of ontology development methodologies: based on CMM-I version 1.1 Maturity Level 2 and 3)

  • 최승용;김정아;정란;배제민;홍찬기;최성운
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1021-1036
    • /
    • 2007
  • 시맨틱 웹(semantic web), 지식 경영 요구가 증대되면서 온톨로지 개발이 활발하게 이루어지고 있다. 온톨로지 역시 대규모 소프트웨어를 개발하는 것과 동일하게 체계적인 개발 표준이 필요한 시점에 있다. 그러나 아직 온톨로지 개발 방법론의 체계화 및 표준화는 이루어지고 있지 않은 상황이다. 본 연구에서는 온톨로지 개발 방법론의 비교를 위해 외국의 대표적인 온톨로지 개발 방법론(METHONTOLOGY, CommonKADS, OTK)과 국내 온톨로지 개발 방법론(EOE)을 선정했다. 평가 방법은 CMM-I 버전 1.1 프레임워크를 도입하여 CMM-I 성숙 단계 2와 3에 해당하는 프로세스 영역별로 온톨로지 개발 방법론을 평가했다. 본 연구의 목적은 프로세스 성숙도(CMM-I) 관점으로 평가 대상의 온톨로지 개발 방법론에 대해 성숙된 프로세스 영역과 취약한 프로세스 영역을 파악하고 온톨로지 개발 방법론의 개선 영역을 제시하는 것이다. 본 연구의 결과는 온톨로지 개발 방법론의 수립 또는 개선의 기초 자료로 활용할 수 있다.