• 제목/요약/키워드: 대용량 온톨로지

검색결과 60건 처리시간 0.03초

클라우드 컴퓨팅 환경에서의 대용량 RDFS 추론을 위한 분산 테이블 조인 기법 (Distributed Table Join for Scalable RDFS Reasoning on Cloud Computing Environment)

  • 이완곤;김제민;박영택
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.674-685
    • /
    • 2014
  • 지식 서비스 시스템이 효과적인 서비스를 제공하기 위해서는, 명시된 지식을 바탕으로 새로운 지식을 추론 할 수 있어야 한다. 대부분 지식 서비스 시스템은 온톨로지로 지식을 표현한다. 실 세계의 지식 정보의 양은 점점 방대해지고 있으며, 따라서 대용량 온톨로지를 효과적으로 추론하는 기법이 요구되고 있다. 본 논문은 클라우드 컴퓨팅 환경을 기반으로 대용량 온톨로지를 RDFS수준으로 추론하기 위한 분산 테이블 조인 방법을 제안하고, 성능을 평가한다. 본 논문에서 제안하는 RDFS 추론은 분산 파일 시스템 환경에서 RDFS 메타 테이블을 기반으로 맵-리듀스를 적용한 방식과, 맵-리듀스를 사용하지 않고 클라우드 컴퓨터의 메모리만 사용한 방식에 초점을 맞추었다. 따라서 본 논문에서는 제안하는 각 기법에 대한 추론 시스템 구조와 RDFS 추론 규칙에 따른 메타 테이블 설계 및 추론 전략 알고리즘에 대해서 중점적으로 설명한다. 제안하는 기법의 효율성을 검증하기 위해 온톨로지 추론과 검색 속도를 평가하는 공식 데이터인 LUBM1000부터 LUBM6000을 대상으로 실험을 수행 하였다. 가장 큰 LUBM6000(8억 6천만 트리플)의 경우, 메타 테이블 기반의 RDFS 추론 기법은 전체 추론 시간이 13.75분(초당 1,042 트리플 추론) 소요된 반면, 클라우드 컴퓨터의 메모리를 적용한 방식은 7.24분(초당 1,979 트리플 추론)이 소모되어 약 2배정도 빠른 추론 속도를 보였다.

온톨로지와 군집분석을 이용한 지하공간 정보모델 개발 (Development of Subsurface Spatial Information Model with Cluster Analysis and Ontology Model)

  • 이상훈
    • 한국지리정보학회지
    • /
    • 제13권4호
    • /
    • pp.170-180
    • /
    • 2010
  • 지하공간 개발의 증가에 따라 지층단면도 등 다양한 형태로 제공되는 지하공간 정보모델의 신뢰성이 요구되고 있다. 그러나 지반은 근본적으로 불확실하며, 이를 표현하는 정보모델도 자료부족, 해석표준 부재 등의 비통계적 요인과 외부환경 변수라는 통계적 요인으로 불확실성을 가진다. 따라서, 현재의 모델 생성은 고도로 훈련된 전문가에 의해 이뤄지고 있다. 본 연구는 지반공학 전문가의 경험과 지식에서 시맨틱을 추출하고, 이를 온톨로지 모델과 정보량으로 정량화하였다. 정량화한 온톨로지 모델은 군집분석의 클러스터간 거리계산에 적용하여 시맨틱을 고려한 군집분석 방법론을 제안하였다. 본 제안 방법을 실험지역에 적용한 결과 기존 K-Means 방법에 비해 전문가의 해석과 유사한 결과를 도출하였으며, 수작업으로는 어려운 대용량 데이터를 손쉽게 처리하고 3차원 GIS로 가시화가 가능하였다. 본 연구를 통해 지반공학 전문가의 도움 없이도, 그 경험을 고려하면서 대량의 지반정보 데이터를 효과적으로 처리하여 신뢰성 있는 지하공간 정보모델을 생성할 수 있을 것이다.

데이터베이스 시스템에 기반한 효율적인 OWL 저장시스템 설계 및 성능분석 (The Design and Performance Analysis of an Effective OWL Storage System Based on the DBMS)

  • 조성환;김성식;김태영
    • 컴퓨터교육학회논문지
    • /
    • 제11권5호
    • /
    • pp.77-88
    • /
    • 2008
  • 시멘틱 웹은 현재의 웹의 한계에 대한 방성으로 등장하였고, W3C를 주축으로 OWL이라는 온돌로지 표준 기수(description) 언어를 권고하는 수준에까지 이르고 있다. 또한, OWL 데이터에 표현된 정보를 검색하기 위한 Jena, Jess, JTP와 같은 추론기들이 개발되고 있다. 하지만, 아쉽게도 현재까지는 OWL 데이터의 효율적인 저장 및 질의 처리 시스템은 찾아보기 힘들뿐만 아니라, 파일을 기반으로 처리되는 현재 추론기들의 실정상 대용량의 OWL 데이터를 처리하기에는 많은 제약을 가지고 있다. 따라서 온톨로지 상에서의 안정적인 정보 검색을 위해서는 온톨로지 데이터를 효율적으로 저장하고 검색하는 기법이 뒷받침되어야 한다. 이에 본 연구에서는 첫째로, OWL로 기술된 온톨로지 데이터를 데이터베이스에 변환하여 저장하고 데이터베이스 내에서 추론을 지원할 수 있는 모델을 제안하였고, 둘째로, 데이터베이스 시스템에 기반을 둔 OWL 저장 시스템을 설계 및 구현하였으면, 마지막으로, 제안한 시스템을 기존 추론기 시스템과의 성능 차이 실험 비교를 통해 분석하였다.

  • PDF

대용량 RDF 데이터의 처리 성능 개선을 위한 효율적인 저장구조 설계 및 구현 (A Design and Implementation of Efficient Storage Structure for a Large RDF Data Processing)

  • 문현정;성정환;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.251-268
    • /
    • 2007
  • 본 논문에서는 대용량 RDF의 효율적인 저장을 위하여 관계 정보와 데이터 정보를 분리한 새로운 방식의 저장 구조를 제안하였다. 제안 방식은 기존의 저장 방식에 비해 데이터의 중복을 최소화하여 대량의 RDF 데이터를 효율적으로 저장할 수 있다. 또한 본 논문에서 제안한 저장 방식을 이용하여 트리플 형태의 관계 정보 릴레이션과 데이터 정보 릴레이션에서 필요한 데이터를 분리 검색하여 결합하는 방식에 의해 RDF 데이터에 대한 질의 성능을 개선할 수 있다. 본 연구 결과는 RDF 데이타를 이용한 전자상거래, 시맨틱 웹, 지식관리 등과 같은 응용 분야에서 대량의 RDF 데이터의 효율적인 관리를 통하여 질의 성능을 개선할 수 있는 기반 기술로 사용할 수 있다.

  • PDF

분산 처리 환경에서 SWRL 규칙을 이용한 대용량 점증적 추론 방법 (Large Scale Incremental Reasoning using SWRL Rules in a Distributed Framework)

  • 이완곤;방성혁;박영택
    • 정보과학회 논문지
    • /
    • 제44권4호
    • /
    • pp.383-391
    • /
    • 2017
  • 빅데이터 시대가 도래 하면서 시맨틱 데이터의 양이 빠른 속도로 증가하고 있다. 이러한 대용량 시맨틱 데이터에서 의미 있는 암묵적 정보를 추론하기 위해서 지식 사용자의 경험적 지식을 기반으로 작성된 SWRL(Semantic Web Rule Language) 규칙들을 활용하는 많은 연구가 진행되고 있다. 그러나 기존의 단일 노드의 추론 시스템들은 대용량 데이터 처리에 한계가 있고, 다중 노드 기반의 분산 추론 시스템들은 네트워크 셔플링으로 인해 성능이 저하되는 문제점들이 존재한다. 따라서 본 논문에서는 기존 시스템들의 한계를 극복하고 보다 효율적인 분산 추론 방법을 제안한다. 또한 네트워크 셔플링을 최소화 할 수 있는 데이터 파티셔닝 전략을 소개하고, 점증적 추론에서 사용되는 추가된 새로운 데이터의 선별과 추론 규칙의 순서결정으로 추론 과정을 최적화 할 수 있는 방법에 대해 설명한다. 제안하는 방법의 성능을 측적하기 위해 약 2억 트리플로 구성된 WiseKB 온톨로지와 84개의 사용자 정의 규칙을 이용한 실험에서 32.7분이 소요되었다. 또한 LUBM 벤치 마크 데이터를 이용한 실험에서 맵-리듀스 방식에 비해 최대 2배 높은 성능을 보였다.

시멘틱 검색 엔진 설계 및 구현 (A Design and Implementation of the Semantic Search Engine)

  • 허선영;김은경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.331-335
    • /
    • 2008
  • 시맨틱 웹은 정보의 의미를 개념으로 정의하고 개념들 간의 관계성을 표현함으로써, 문서들 간의 단순 연결이 아닌 의미 연결을 통해서 보다 정확하고 효율적인 정보 검색이 가능하게 된다. 이러한 시맨틱 웹의 비전이 구체화되기 위해서는 웹 온톨로지(Web Ontology)를 기반으로 의미 정보로 구성된 시맨틱 문서들에 대한 추론을 통해서 웹상에 존재하는 엄청난 정보들 간의 관련성을 파악하고 사용자가 요구하는 정보를 보다 효율적으로 검색할 수 있는 시스템이 필수적이다. W3C에서 제안한 OWL은 대표적인 온톨로지 언어이다. 시맨틱 웹 상에서 OWL 데이타를 효율적으로 검색하기 위해서는 잘 구성되어진 저장 스키마를 구축해야 한다. 본 논문에서는 Jena2의 경우, 단일 테이블에 문서의 정보를 저장하기 때문에 단순 선택 연산 (Simple Selection), 조인 연산이 요구되는 질의에 대한 성능이 저하되고 대용량의 OWL데이터의 처리에 있어 성능이 저하되는 문제를 해결하기 위하여 본 논문에서는 OWL 문서의 의미를 Class, Property, Individual로 분류하여 각각의 데이터 정보들을 테이블에 저장하기 위한 다중 변환기와 OWL 변환기 기능을 가진 시멘텍 검색 엔진을 설계 및 구현하였다. 본 검색 엔진을 테스트한 결과, 단순정보검색 질의 시 Jena2에서 비정규화된 테이블 구조로 저장할 때보다 질의 응답 속도를 향상 시킬 수 있었고, 조인 연산 시 두 테이블의 크기로 인한 조인비용이 발생하는 문제점을 해결함으로써 빠른 검색 및 질의 속도를 보장할 수 있었다.

  • PDF

청소년 상담을 위한 마음의 병 온톨로지 설계에 관한 연구 (A Study on Design of Diseases of Mind Ontologies for Juvenile Consultation)

  • 백현기
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권4호
    • /
    • pp.547-557
    • /
    • 2012
  • 청소년들은 자신의 부정적인 경험과 감정에 대하여 자신은 마음에 상처를 받았다고 표현하고 있다. 이러한 마음의 상처의 근본원인을 다른 사람이나 외부적인 환경에서 찾고자 한다. 청소년들은 과거의 사건을 재조명하여 기억의 치유를 하고자 한다. 본 연구는 청소년의 상담을 위해 마음의 병과 관련된 원인과 증상 정보를 제공하기 위한 마음의 병 온톨로지를 설계하였다. 온톨로지를 사용하는 경우 대용량, 복잡한 지식의 체계적 구축이 용이하고, 의미 있는 정보로 저장이 가능하다. 또한 복잡한 기존 상담용어 체계들 간 통합을 위한 도구로 매우 유용하다. 그리고 궁극적으로 자료의 재사용과 공유를 활성화함으로써 내담자 중심의 상담서비스 제공이 가능하게 된다. 따라서 본 연구는 내담자 개개인의 맞춤형 상담 서비스를 제공하기 위한 방법으로 내담자의 마음의 병의 원인 및 증상을 분석하여 청소년 상담을 위한 마음의 병 온톨로지를 구축하였다.

계층 구조를 고려한 Jena Plug-in 저장소의 평가를 위한 실험 및 시뮬레이션 (Experiment and Simulation for Evaluation of Jena Storage Plug-in Considering Hierarchical Structure)

  • 신희영;정동원;백두권
    • 한국시뮬레이션학회논문지
    • /
    • 제17권2호
    • /
    • pp.31-47
    • /
    • 2008
  • W3C에서 표준 온톨로지 서술 언어로 OWL을 채택함에 따라 많은 온톨로지들이 OWL로 기술 및 구현되고 있다. 이와 관련된 기술 중 Jena는 HP에서 개발한 API로서 저장소는 물론 추론 엔진을 개발할 수 있는 다양한 API를 제공하고 있으며 현재 많은 시스템 개발에 이용되고 있다. 그러나 Jena2의 저장 모델은 단일 테이블에 문서의 정보를 저장하기 때문에 대용량의 온톨로지 데이터 처리에 있어 성능이 저하되는 문제점을 지닌다. 무엇보다 클래스와 프로퍼티의 계층적 구조를 고려하지 않기 때문에 계층 구조를 이용한 질의 처리 시 잦은 조인 연산으로 인해 성능이 급격하게 저하된다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해 기존의 Jena2 API를 그대로 이용하면서 Plug-in 형식으로 적용할 수 있는 새로운 OWL 온톨로지 관계형 데이터베이스 모델을 제안한다. 제안 모델은 클래스(Class), 프로퍼티(Property), 인스턴스(Instance)의 정보들을 의미적으로 분류하여 저장하며 계층적 정보들에 대해서도 개별적으로 관리함으로써 질의 처리 성능을 향상시킨다. 또한 기존모델과 이 논문에서 제안하는 모델과의 실험 및 시뮬레이션을 통해 비교 분석 한다. 실험 및 시뮬레이션 결과에서, 제안 시스템이 Jena2보다 나은 성능을 보였다.

  • PDF

사물인터넷 환경에서 대용량 스트리밍 센서데이터의 실시간·병렬 시맨틱 변환 기법 (Real-time and Parallel Semantic Translation Technique for Large-Scale Streaming Sensor Data in an IoT Environment)

  • 권순현;박동환;방효찬;박영택
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.54-67
    • /
    • 2015
  • 최근 사물인터넷 환경에서는 발생하는 센서데이터의 가치와 데이터의 상호운용성을 증진시키기 위해 시맨틱웹 기술과의 접목에 대한 연구가 활발히 진행되고 있다. 이를 위해서는 센서데이터와 서비스 도메인 지식의 융합을 위한 센서데이터의 시맨틱화는 필수적이다. 하지만 기존의 시맨틱 변환기술은 정적인 메타데이터를 시맨틱 데이터(RDF)로 변환하는 기술이며, 이는 사물인터넷 환경의 실시간성, 대용량성의 특징을 제대로 처리할 수 없는 실정이다. 따라서 본 논문에서는 사물인터넷 환경에서 발생하는 대용량 스트리밍 센서데이터의 실시간 병렬처리를 통해 시맨틱 데이터로 변환하는 기법을 제시한다. 본 기법에서는 시맨틱 변환을 위한 변환규칙을 정의하고, 정의된 변환규칙과 온톨로지 기반 센서 모델을 통해 실시간 병렬로 센서데이터를 시맨틱 변환하여 시맨틱 레파지토리에 저장한다. 성능향상을 위해 빅데이터 실시간 분석 프레임워크인 아파치 스톰을 이용하여, 각 변환작업을 병렬로 처리한다. 이를 위한 시스템을 구현하고, 대용량 스트리밍 센서데이터인 기상청 AWS 관측데이터를 이용하여 제시된 기법에 대한 성능평가를 진행하여, 본 논문에서 제시된 기법을 입증한다.

메타 규칙과 번역의 혼용을 통한 규칙엔진 기반 OWL 추론 엔진의 성능 향상 방법 (Efficient Rule-based OWL Reasoning by Combing Meta Rules and Translation)

  • 장민수;손주찬;조영조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.214-219
    • /
    • 2007
  • 생성 규칙(Production Rule)과 이를 기반으로 하는 규칙 엔진(Rule Engine)을 기반으로 한 OWL 추론 엔진은 메타 규칙((Meta Rule)에 의존해 왔다. 메타 규칙은 OWL의 의미론 (Semantics)을 표현하기 용이하여 보다 손쉽게 OWL 추론 엔진을 구현할 수 있다는 장점을 제공하였으나 OWL 추론 성능에 있어 추론 속도와 대용량 온톨로지 처리 측면에서 모두 만족할 만한 성과를 얻지 못하였다. 본 논문은 DLP(Description Logic Programming)의 번역 접근법을 기반으로 한 번역 규칙(Translation Rules)을 메타 규칙과 혼용하는 OWL 추론 기법을 소개한다. LUBM 벤치마크를 통해 이 기법이 메타 규칙만을 이용했을 때 보다 100% 이상 추론 성능을 향상시켰을 뿐 아니라 메모리 사용량도 대폭 축소시켰음을 확인할 수 있었다. 또한, 번역을 통해 제한없는 차수 제약(Cardinality Restriction) 관련 추론을 지원하는 등 보다 넓은 범위의 OWL 추론을 지원할 수 있다.

  • PDF