• 제목/요약/키워드: Owl

검색결과 424건 처리시간 0.021초

SWAT: 분산 인-메모리 시스템 기반 SWRL과 ATMS의 효율적 결합 연구 (SWAT: A Study on the Efficient Integration of SWRL and ATMS based on a Distributed In-Memory System)

  • 전명중;이완곤;바트셀렘;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.113-125
    • /
    • 2018
  • 최근 빅데이터의 시대가 도래하여 다양한 분야로부터 다량의 지식을 얻을 수 있다. 수집된 지식은 정형화된 형태의 지식으로 가공하여 표현되며, 그 중 W3C의 온톨로지 표준 언어인 OWL이 대표적인 정형화 표현 형식이다. 이렇게 표현된 대용량의 온톨로지로부터 내재된 정보를 도출하기 위해 다양한 방법의 심볼릭 추론(Symbolic Reasoning) 연구가 활발하게 진행되고 있다. 그러나 대부분의 추론 연구들은 서술논리(Description Logic)표현 기반의 제한적인 규칙표현을 지원하며 실생활 기반의 서비스를 구축하기에는 많은 제약이 따른다. 또한 잘못된 지식으로부터 도출된 결과는 규칙들 사이의 종속관계에 따라 연쇄적으로 잘못된 지식이 생산될 수 있기 때문에 이러한 잘못된 지식에 대한 처리를 위한 지식관리가 필요하다. 따라서 본 논문에서는 해당 문제를 해결하기 위해 SWRL(Semantic Web Rule Language) 기반의 추론과 ATMS(Assumption-based Truth Maintenance System)간의 결합을 통해 새롭게 도출된 지식에 대한 관리를 할 수 있는 SWAT(SWRL + ATMS) 시스템을 제안한다. 또한 이 시스템은 대용량 데이터를 처리하기 위해 분산 인-메모리 프레임워크 기반의 SWRL추론과 ATMS를 병합 구축하였으며 이를 바탕으로 웹 형태의 ATMS 모니터링 시스템을 통하여 사용자가 손쉽게 잘못된 지식을 검색 및 수정할 수 있도록 한다. 본 논문에서 제안하는 방법에 대한 평가를 위해 LUBM(Lehigh University Benchmark)데이터 셋을 사용하였으며, 대용량 데이터에 대한 SWRL 추론과 잘못 추론된 정보에 대한 삭제를 통해 효율적인 추론과 관리가 가능한 결합 방법임을 증명한다.

기준점 관리를 위한 온톨로지 모델링과 적용 방안 (Ontology Modeling and Its Application for Managing Control Points)

  • ;황현숙;신성현;서용철;김창수
    • 한국지리정보학회지
    • /
    • 제11권3호
    • /
    • pp.34-42
    • /
    • 2008
  • 정확한 지리위치 좌표를 나타내는 기준점은 국가의 중요한 자산으로써 전국토의 측량과 기타 측량 사업에 사용되고 있다. 유비쿼터스 기술의 발전으로 위치정보는 우리 생활에서 중요한 역할을 하고 있다. 현재 RFID (Radio-Frequency Identification)와 같은 유비쿼터스 기술을 기준점 관리 시스템에 융합함으로써 관리의 효율성을 제고하기 위해 여러 분야에서 연구가 진행되고 있다. 그러나 기존의 연구에서는 데이터 관점에서 기준점 관리를 위한 호환성과 효율적인 검색에 대한 연구는 미비한 실정이다. 따라서, 본 논문에서는 온톨로지 기술을 사용하여 기준점 데이터를 효율적으로 검색하기 위한 데이터 모델링을 구축하고 그의 적용 방안에 초점을 두어 연구한다. 제안된 온톨로지 기반의 검색 시스템은 계층적 검색으로 사용자의 반복된 검색 수행을 줄일 수 있고, 연관 검색으로 검색 시간을 줄일 수 있는 장점이 있다. 또한, 사용자 인터페이스와 관련된 소스 코드를 수정하지 않고 카테고리와 속성의 항목을 편집할 수 있는 효과적인 검색 시스템 구축 방법을 제안한다.

  • PDF

지역 및 전역 의미집합을 이용한 온톨로지 병합 및 정렬 알고리즘 (An Algorithm for Ontology Merging and Alignment using Local and Global Semantic Set)

  • 김재홍;이상조
    • 전자공학회논문지CI
    • /
    • 제41권4호
    • /
    • pp.23-30
    • /
    • 2004
  • 기존 웹의 단점을 보완하기 위해 시맨틱 웹 개념이 제안되었고, 시맨틱 웹에서 중요한 역할을 하는 온톨로지는 분산 독립된 형태로 개발되는 특성으로 인해 동일한 도메인에 대해 중복 저작될 수 있는 문제점을 가지고 있다. 따라서 온톨로지의 공유와 재사용이 중요한 문제로 부각되고 있으며, 온톨로지 병합 덴 정렬이 한 해결책이 될 수 있다. 현재까지 제안된 반자동 방식의 온톨로지 병합 및 정렬 알고리즘은 온톨로지 전체에서 가지는 의미정보가 아닌 지역적 구문정보만을 이용하고, 반자동 작업 특징으로 인해 온톨로지 엔지니어에게는 지루한 작업이 되어 결과의 품질이 낮아질 수 있다는 단점이 있다. 본 논문에서는 지역 및 전역 의미집합 개념을 이용하여 이러한 단점을 개선한 온톨로지 병합 및 정렬 알고리즘을 제안하였다. 제안된 알고리즘을 구현하여 OWL 언어로 작성된 온톨로지에 대해 실험한 결과 91%의 정확도를 보였다. 본 논문에서 제안하는 알고리즘을 이용하여 온톨로지 병합 및 정렬 작업을 수행하면 온톨로지 공유 및 재활용률을 높이고, 기존 온톨로지를 활용한 새로운 온톨로지의 저작시간도 단축시킬 수 있을 것으로 기대된다. 또한, 온톨로지 매핑등 온톨로지들 간의 의미 정보 교환이 필요한 다른 어떤 분야에도 쉽게 적용이 가능할 것으로 기대된다.

효율적인 온톨로지 검색과 추론을 위한 인덱스 (Index for Efficient Ontology Retrieval and Inference)

  • 송승재;김인성;전종훈
    • 한국전자거래학회지
    • /
    • 제18권2호
    • /
    • pp.153-173
    • /
    • 2013
  • 근래에 들어와서 각광받고 있는 시맨틱 웹과 관련기술의 부상으로 온톨로지에 대한 관심이 증대되었으며, 그중에서도 고난이도의 추론을 요구하는 의미기반 시맨틱 검색을 위해서 온톨로지를 효율적으로 저장하고 검색하는 다양한 기법들이 활발히 연구되어왔다. W3C에서의 표준권고안은 RDFS, OWL을 활용하도록 하고 있다. 하지만 메모리 기반으로 구현되어 있는 에디터나 추론엔진들, 온톨로지의 원형을 그대로 유지하여 저장하는 트리플 저장소를 이용하여 대용량 온톨로지를 처리하기에는 성능상의 한계가 있다. 따라서 이를 해결하기 위해 관계형 데이터베이스 엔진을 이용하여, 온톨로지를 저장하고 효율적으로 활용하기 위한 다양한 방식의 추론엔진과 질의처리 알고리즘들이 제안되었으나, 온톨로지 프로퍼티의 다섯 가지 핵심특성에 따른 추론 결과를 완전하게 획득하지는 못하고 있는 실정이다. 본 논문에서는 하이퍼 큐브 인덱스(Hyper Cube Index)를 제안함으로서 관계형 데이터베이스에 저장한 온톨로지를 효율적으로 검색할 수 있는 환경을 제공하는 것은 물론, 온톨로지 프로퍼티의 핵심특성을 빠짐없이 투영하여 숨겨진 추론 결과를 획득할 수 있는 방안을 제시한다.

저자명 모호성 해결을 위한 개념망 기반 카테고리 유틸리티 (WordNet-Based Category Utility Approach for Author Name Disambiguation)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.225-232
    • /
    • 2009
  • 동명이인의 저자를 구분하는 것은 웹에서 문서 색인과 검색의 성능을 향상시킨다. 동명이인의 저자 구분은 웹사이트 상에서 같은 이름을 갖는 여러 명의 사람이 존재했을 때 야기되는 여러 가지 문제점을 해결한다. 본 논문은 동명이인의 저자 구분을 위해 개념망 기반의 카테고리 유틸리티를 제안한다. 따라서 본 논문에서는 학술회의 웹 사이트를 대상으로 제안하고자 하는 방법을 설명한다. 제안된 방법은 저자가 가지고 있는 다양한 속성(제목, 요약, 공동저자, 소속)을 반영한 저자 온톨로지와 개념망을 활용한다. 저자 온톨로지는 OWL API와 휴리스틱한 방법을 사용하여 반자동으로 구축 되었다. 저자명 모호성 해결은 개념망 기반 카테고리 유틸리티를 사용하여 저자 온톨로지 내에 존재하는 동명이인 저자(Candidate Authors)들로부터 해당 논문에 관련된 정확한 저자를 결정한다. 카테고리 유틸리티는 각각의 저자간의 intra-class 유사성 와 inter-class 비유사성을 기본적인 개념으로 하는 평가 함수다. 이에 비해 개념망 기반 카테고리 유틸리티는 모호성 해결을 위해 개념망이 갖는 개념 정보를 추가로 활용한다. 실험 결과를 분석한 결과 개념망 기반 카테고리 유틸리티가 일반적인 카테고리 유틸리티에 비교해서, 저자명 모호성 해결에 있어서 10% 정도 우수한 성능을 보였으며, 전체적으로 98%의 정확도를 보였다.

대용량 추론을 위한 분산환경에서의 가정기반진리관리시스템 (Distributed Assumption-Based Truth Maintenance System for Scalable Reasoning)

  • 바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1115-1123
    • /
    • 2016
  • 가정기반진리관리 시스템(ATMS)은 추론 시스템의 추론 과정을 저장하고 비단조추론을 지원할 수 있는 도구이다. 또한 의존기반 backtracking을 지원하므로 매우 넓은 공간 탐색 문제를 해결 할 수 있는 강력한 도구이다. 모든 추론 과정을 기록하고, 특정한 컨텍스트에서 지능형시스템의 Belief를 매우 빠르게 확인하고 비단조 추론 문제에 대한 해결책을 효율적으로 제공할 수 있게 한다. 그러나 최근 데이터의 양이 방대해지면서 기존의 단일 머신을 사용하는 경우 문제 해결 프로그램의 대용량의 추론과정을 저장하는 것이 불가능하게 되었다. 대용량 데이터에 대한 문제 해결 과정을 기록하는 것은 많은 연산과 메모리 오버헤드를 야기한다. 이러한 단점을 극복하기 위해 본 논문에서는 Apache Spark 환경에서 functional 및 객체지향 방식 기반의 점진적 컨텍스트 추론을 유지할 수 있는 방법을 제안한다. 이는 가정(Assumption)과 유도과정을 분산 환경에 저장하며, 실체화된 대용량 데이터셋의 변화를 효율적으로 수정가능하게 한다. 또한 ATMS의 Label, Environment를 분산 처리하여 대규모의 추론 과정을 효과적으로 관리할 수 있는 방안을 제시하고 있다. 제안하는 시스템의 성능을 측정하기 위해 5개의 노드로 구성된 클러스터에서 LUBM 데이터셋에 대한 OWL/RDFS 추론을 수행하고, 데이터의 추가, 설명, 제거에 대한 실험을 수행하였다. LUBM2000에 대하여 추론을 수행한 결과 80GB데이터가 추론되었고, ATMS에 적용하여 추가, 설명, 제거에 대하여 수초 내에 처리하는 성능을 보였다.

표준 의학 용어체계의 매핑을 위한 시스템의 설계 및 개발 (Design and Development of a System for Mapping of Medical Standard Terminologies)

  • 이인근;김화선;조훈
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.237-243
    • /
    • 2011
  • 의학 분야에서의 다양한 표준 용어체계는 각기 다른 형태로 구성되어 있다. 따라서 이들을 통합하여 활용하기 위해서는 용어체계 사이의 연결 정보가 필요하다. 이를 위해 여러 통합 도구들이 개발되어 사용되고 있으나, 이들 도구들은 특정 용어 체계에 국한하기 때문에, 매핑 데이터의 생성 범위가 제약적이다. 이를 극복하기 위해 여러 용어체계를 통합하여 매핑작업을 수행할 수 있는 도구도 개발되었다. 그러나 의학용어체계는 각각 독특한 형태로 구성되어 있어 이들의 획일적인 통합이 어려운 문제가 있다. 따라서 본 논문에서는 기존용어체계의 형태를 유지하면서 매핑 시스템에서의 통합 및 활용이 가능한 방법을 제안한다. 제안한 방법에서는 용어체계의 위치와 형태에 대한 메타데이터를 작성함으로써 새로운 용어체계를 쉽게 시스템에 추가하여 사용할 수 있도록 하였으며, 기존 용어체계의 수정 및 구조 변경에도 유동적으로 대처할 수 있다. 또한 본 논문에서 생성한 매핑 데이터는 온톨로지에서의 트리플릿 형태로 구성함으로써 다양한 매핑 정보를 생성할 수 있다. 따라서 생성한 정보는 OWL, RDF, Excel 등의 다양한 형태로 변형하여 배포할 수 있다. 제안한 방법에 기반하여 매핑 시스템을 이용한 매핑 데이터 생성 실험을 통해 개발한 시스템의 효용성을 확인하였다.

다양한 OWL-DL 추론 엔진에서 대용량 ABox 추론에 대한 성능평가 (A Performance Analysis of Large ABox Reasoning in OWL-DL Reasoners)

  • 서은석;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.655-666
    • /
    • 2007
  • RacerPro, Pellet 등 지금까지의 전혈적인 추론 시스템들은 주로 Tableaux Algorithm 기반의 추론 시스템으로 Tableaux Algorithm의 특성상 대용량 ABox 추론에서 문제점을 나타낸다. 이를 해결하기 위한 연구로 Tableaux Algorithm 기반에 DBMS를 함께 사용한 영국 Manchester 대학의 Instance Store와 Disjunctive Datalog Approach를 사용한 독일 Karlsruhe 대학의 KAON2가 있다. 현재 추론 시스템들에 대한 벤치마크 실험은 대부분 Tableaux Algorithm 기반의 TBox 추론 위주이며 ABox 추론에 대한 평가는 거의 진행되지 않았다. 특히 최근 이슈로 부각된 (대용량 ABox 추론을 위한 추론 시스템)의 특성별 벤치마크 실험은 거의 보고되지 않았다. 이에 본 논문에서는 각 추론엔진들의 이론적 배경을 근간으로 전형적 추론엔진들과 최근 이슈에 따른 대용량 ABox론 위한 추론엔진들을 상호 비교를 통해 살펴보며 특히, 대용량 ABox 처리론 위한 추론엔진인 Manchester 대학의 Instance Store와 Karlsruhe 대학의 KAON2를 LUBM을 통하여 분석 평가함으로 사용자의 요구에 따른 대용량 ABox 추론엔진을 제시한다. 평가방법에서는 LUBM(Lehigh University BenchMark)에 대한 소개와 이를 이용한 벤치마크 실험 방법 및 평가 시스템에 대하여 소개한다. 본 논문은 결론을 통해 실험 결과와 각 추론엔진의 사용 Algorithm 특성을 기초로 다양한 환경에서의 대용량 ABox 처리에 적합한 추론엔진을 제시한다.

RDF 웹 문서의 부분적인 정보 은닉과 관련한 접근 권한 충돌 문제의 분석 (Analysis of Access Authorization Conflict for Partial Information Hiding of RDF Web Document)

  • 김재훈;박석
    • 정보보호학회논문지
    • /
    • 제18권2호
    • /
    • pp.49-63
    • /
    • 2008
  • RDF는 W3C의 시맨틱 웹에서 사용하는 기본적인 온톨로지 모델이다. 그리고 더욱 다양한 온톨로지 관계를 정의하는 OWL은 이러한 RDF 기본 모델을 확장한 것이다. 최근 Jain과 Farkas는 RDF에 대한 RDF 트리플에 기반을 둔 접근 제어 모델을 제시하였다. 그들 연구의 초점은 RDF 온톨로지 데이터에서 고려해야 하는 추론에 의한 접근 권한 충돌 문제를 소개한 것이다. 비록 RDF 모델이 XML로 표현되지만, 기존의 XML 접근 제어 모델을 RDF에 적용하기 어려운 것이 바로 이러한 RDF 추론 때문이다. 하지만, Jain과 Farkas는 그들의 연구에서 먼저 RDF 접근 권한 명세시의 권한 전파가 RDF 상/하위 온톨로지 개념에 대하여 어떻게 이루어지는 지를 정의하고 있지 않다. 이것이 중요한 이유는 추론에 의한 권한 충돌의 문제는 결국 권한 명세시의 권한 전파와 권한 추론시의 권한 전파 사이에서의 충돌 문제이기 때문이다. 본 논문에서는 먼저 RDF 트리플에 기반을 둔 RDF 접근 권한 명세 모델에 대하여 자세히 소개한다. 다음으로 이러한 모델을 바탕으로 RDF 추론 시의 권한 충돌 문제를 자세히 분석한다. 다음으로 권한 명세시의 권한 충돌 여부를 신속히 조사하기 위하여 포함 관계 추론과 관련한 그래프 레이블링 기법을 이용하는 방법을 간략히 소개한다. 마지막으로 Jain과 Farkas 연구와의 비교 및 제안된 충돌 발견 알고리즘의 효율성을 보이는 몇 가지 실험 결과를 제시한다.

시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델 및 시뮬레이션 (Semantic Computing-based Dynamic Job Scheduling Model and Simulation)

  • 노창현;장성호;김태영;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권2호
    • /
    • pp.29-38
    • /
    • 2009
  • 이기종의 자원들로 이루어진 컴퓨팅 환경에서 효율적인 자원 활용과 대용량의 데이터를 고속으로 처리하기 위해서는 실시간으로 변화하는 자원의 상태에 따라 대처 할 수 있는 동적인 작업 스케줄링 모델이 필요하다. 현재 이기종의 자원들에게 작업을 어떻게 분배 및 할당 할 것인지에 대하여 많은 자원 평가 방법 및 휴리스틱 기법들이 연구되었으나 이러한 방법들은 표준언어를 사용하지 않기 때문에 시스템 호환 및 확장에 어려움이 많다. 또한 다양한 자원들의 상태가 실시간으로 동적으로 변화하기 때문에 기존 연구에서 제안한 방법으로는 효율적인 처리가 불가능하거나 자원의 상태 변화에 동적으로 대처할 수 없다. 본 논문은 이러한 기존 연구들의 문제에 대한 해결책으로 W3C에서 제정한 온톨로지 표준 언어인 OWL을 이용하여 자원 온톨로지를 구축함으로써 이기종의 자원 관리를 손쉽게 할 수 있으며, 자원의 동적인 변화에 따라 작업 스케줄링하는 방법을 지식기반의 다양한 규칙들로 정의하여 추론을 통해서 최적의 자원에게 작업을 할당하는 시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델을 제안한다. 시뮬레이션 실험 결과는 본 논문에서 제안한 작업 스케줄링 모델이 기존 모델에 비하여 낮은 작업 손실과 높은 작업 처리율 및 짧은 응답시간을 제공함으로써 이기종의 자원들로 구성된 시스템 전반에 걸쳐 안정적이고 고속의 데이터 처리를 제공할 수 있다는 사실을 증명한다.