• 제목/요약/키워드: 대용량 온톨로지

검색결과 60건 처리시간 0.025초

효율적 자원 탐색을 위한 소셜 웹 태그들을 이용한 동적 가상 온톨로지 생성 연구 (Dynamic Virtual Ontology using Tags with Semantic Relationship on Social-web to Support Effective Search)

  • 이현정;손미애
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.19-33
    • /
    • 2013
  • 본 논문에서는 네트워크 기반 대용량의 자원들을 효율적으로 검색하기 위해 사용자의 요구사항에 기반해 검색에 요구되는 태그들 간의 의미론에 기반한 동적 가상 온톨로지(Dynamic Virtual Ontology using Tags: DyVOT)를 추출하고 이를 이용한 동적 검색 방법론을 제안한다. 태그는 소셜 네트워크 서비스를 지원하거나 이로부터 생성되는 정형 및 비정형의 다양한 자원들에 대한 자원을 대표하는 특성을 포함하는 메타적 정보들로 구성된다. 따라서 본 연구에서는 이러한 태그들을 이용해 자원의 관계를 정의하고 이를 검색 등에 활용하고자 한다. 관계 등의 정의를 위해 태그들의 속성을 정의하는 것이 요구되며, 이를 위해 태그에 연결된 자원들을 이용하였다. 즉, 태그가 어떠한 자원들을 대표하고 있는 지를 추출하여 태그의 성격을 정의하고자 하였고, 태그를 포함하는 자원들이 무엇인지에 의해 태그간의 의미론적인 관계의 설정도 가능하다고 보았다. 즉, 본 연구에서 제안하는 검색 등의 활용을 목적으로 하는 DyVOT는 태그에 연결된 자원에 근거해 태그들 간의 의미론적 관계를 추출하고 이에 기반 하여 가상 동적 온톨로지를 추출한다. 생성된 DyVOT는 대용량의 데이터 처리를 위해 대표적인 예로 검색에 활용될 수 있으며, 태그들 간의 의미적 관계에 기반해 검색 자원의 뷰를 효과적으로 좁혀나가 효율적으로 자원을 탐색하는 것을 가능하도록 한다. 이를 위해 태그들 간의 상하 계층관계가 이미 정의된 시맨틱 태그 클라우드인 정적 온톨로지를 이용한다. 이에 더해, 태그들 간의 연관관계를 정의하고 이에 동적으로 온톨로지를 정의하여 자원 검색을 위한 동적 가상 온톨로지 DyVOT를 생성한다. DyVOT 생성은 먼저 정적온톨로지로부터 사용자 요구사항을 포함하는 태그를 포함한 부분-온톨로지들을 추출하고, 이들이 공유하는 자원의 정도에 따라 부분-온톨로지들 간의 새로운 연관관계 여부를 결정하여 검색에 요구되는 최소한의 동적 가상 온톨로지를 구축한다. 즉, 태그들이 공유하는 자원이 무엇인가에 의해 연관관계가 높은 태그들 간에는 이들의 관계를 설명하는 새로운 클래스를 가진 생성된 동적 가상 온톨로지를 이용하여 검색에 활용한다. 온톨로지의 인스턴스는 자원으로 정의되고, 즉 이는 사용자가 검색하고자 하는 해로서 정의된다. 태그들 간의 관계에 의해 생성된 DyVOT를 이용해 기존 정적 온톨로지나 키워드 기반 탐색에 비해 검색해야 할 자원의 량을 줄여 검색의 정확성과 신속성을 향상 시킨다.

시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델 및 시뮬레이션 (Semantic Computing-based Dynamic Job Scheduling Model and Simulation)

  • 노창현;장성호;김태영;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권2호
    • /
    • pp.29-38
    • /
    • 2009
  • 이기종의 자원들로 이루어진 컴퓨팅 환경에서 효율적인 자원 활용과 대용량의 데이터를 고속으로 처리하기 위해서는 실시간으로 변화하는 자원의 상태에 따라 대처 할 수 있는 동적인 작업 스케줄링 모델이 필요하다. 현재 이기종의 자원들에게 작업을 어떻게 분배 및 할당 할 것인지에 대하여 많은 자원 평가 방법 및 휴리스틱 기법들이 연구되었으나 이러한 방법들은 표준언어를 사용하지 않기 때문에 시스템 호환 및 확장에 어려움이 많다. 또한 다양한 자원들의 상태가 실시간으로 동적으로 변화하기 때문에 기존 연구에서 제안한 방법으로는 효율적인 처리가 불가능하거나 자원의 상태 변화에 동적으로 대처할 수 없다. 본 논문은 이러한 기존 연구들의 문제에 대한 해결책으로 W3C에서 제정한 온톨로지 표준 언어인 OWL을 이용하여 자원 온톨로지를 구축함으로써 이기종의 자원 관리를 손쉽게 할 수 있으며, 자원의 동적인 변화에 따라 작업 스케줄링하는 방법을 지식기반의 다양한 규칙들로 정의하여 추론을 통해서 최적의 자원에게 작업을 할당하는 시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델을 제안한다. 시뮬레이션 실험 결과는 본 논문에서 제안한 작업 스케줄링 모델이 기존 모델에 비하여 낮은 작업 손실과 높은 작업 처리율 및 짧은 응답시간을 제공함으로써 이기종의 자원들로 구성된 시스템 전반에 걸쳐 안정적이고 고속의 데이터 처리를 제공할 수 있다는 사실을 증명한다.

동물 영역 지식 기반의 지능형 정보 에이전트 (A Knowledge-Based Intelligent Information Agent for Animal Domain)

  • 이용현;오정욱;변영태
    • 인지과학
    • /
    • 제10권1호
    • /
    • pp.67-78
    • /
    • 1999
  • 네트워크의 기술 발달로 웹상의 정보 제공자가 증가함에 따라 정보 사용자가 필요한 정보를 신속하고 정확하게 획득하기는 것이 더욱 어려워졌다. 이를 위해서 키워드 정합 방식의 검색 엔진이 많이 개발 보급되고 있으나 여전히 많은 부담이 사용자에게 주어지고 있는 상황이다. 이러한 문제를 해결하기 위해서 본 논문에서는 특정 영역인 동문 분야에 대한 지식 베이스를 기반으로 사용자의 의도에 보다 적합하고 해당 영역에 적절한 형태로 사용자 질이를 가공하고, 대용량의 다양한 정보로부터 사용자가 필요로 하는 정보를 제공하는 일을 해주는 지능적인 정보검색 대리자, 정보 에이전트(HIIA-la : Hongik Information Agent)를 제안한다. HIIA-la는 온톨로지 형태에 접근한 동물 관련 지식 베이스를 가지고 있으며, 이를 기반으로 사용자 또는 다른 에이전트 시스템의 정보 요청에 대해 필요한 정보를 제공할 뿐만 아니라, 관련 웹 문서 정보도 제공된다. 효율적인 웹 문서의 제공을 위하여 방대한 양의 웹 문서를 대상으로 동물 영역에 관련된 문서를 저장·색인하는 웹DB를 가지고 있다. 또한 사용자의 의도를 좀더 명확하게 표현할 수 있도록 유연한 연사자로의 질의 확장을 하였으며, 축적된 처리 결과와 사용자의 피드백 정보를 통해 학습을 하게 된다. 본 논문에서는 이와 같이 요소들을 포함하는 HIIA-la를 구현하고, 실험을 통해 시스템의 효율성을 보인다.

  • PDF

용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출 (Semantic Relation Extraction using Pattern Pairs Sharing a Term)

  • 김세종;이용훈;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.221-225
    • /
    • 2009
  • 대용량 코퍼스를 사용하여 온톨로지를 구축하는 것은 해당 코퍼스에서 등장하는 용어들과 이들 간의 의미관계를 보다 자동화된 방법으로 추출하는 것으로부터 시작한다. 이때 주로 사용하는 방법이 용어들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어들을 해당 패턴에 할당된 의미 관계로 설정하는 방법이다. 하지만 기존의 패턴 기반 의미 관계 추출 방법은 한 문장만을 대상으로 패턴을 추출 및 적용하기 때문에 서로 떨어진 용어에 대한 의미 관계를 추출할 수 없다는 단점을 가지고 있다. 본 논문은 이러한 한계점에 착안하여, 의미 관계를 대표하는 각각의 용어를 하나씩 포함하고 기타 용어를 공유하고 있는 서로 떨어진 패턴 쌍을 추출하여 확장된 패턴을 생성하고 이를 의미 관계 추출에 적용하였다. 본 방법론은 is-${\alpha}$ 관계의 경우 기존 방법론 보다 7.5% 향상된 83.75%의 정확률을, part-of 관계의 경우에는 5% 향상된 동일한 83.75%의 정확률을 보였으며 상대적 재현율을 통해 실제 재현율의 향상 가능성도 함께 제시하였다.

사용자 선호도를 고려한 의미기반 비디오 검색 (Semantic Video Retrieval Based On User Preference)

  • 정민영;박성한
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.127-133
    • /
    • 2009
  • 최근 멀티미디어 정보의 양이 빠른 속도로 증가함에 따라 비디오 자료에 대한 효율적 관리는 더욱 중요한 의미를 가지게 되었다. 특히 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적으로 비디오 검색을 하기 위해서는 정확한 특징 정보를 추출하여 비디오 색인 구조를 구축해야 한다. 그리고 비디오 색인 구조는 사용자의 선호도가 반영되어 관심있는 콘텐츠를 효과적으로 검색할 수 있도록 지원되어야 한다. 이를 위해 본 논문에서는 사용자 선호도를 고려한 의미기반 비디오 검색 방법을 제안한다. 기존의 방법의 사용자 선호도를 고려하지 않는 단점이 있고, 사용자의 질의에 대하여 단순히 텍스트 매칭한 결과를 보여주기 때문에 의미적 검색을 지원하지 못한다. 이러한 한계를 극복하기 위해 본 논문에서는 사용자 선호도 분석 방법을 개발하고, 의미적 검색을 위한 비디오 온톨로지 구성 방법을 제시한다. 실험 결과 사용자 선호도를 정확히 분석하고, 장면에 포함된 객체와 움직임 단위의 의미적 인덱싱 구조를 구성하므로, 기존의 방법 보다 더 나은 검색 성능을 보인다.

온톨로지에서의 그래프 레이블링을 이용한 효율적인 트랜지티브 클로저 질의 처리 (Efficient Processing of Transitive Closure Queries in Ontology using Graph Labeling)

  • 김종남;정준원;민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.526-535
    • /
    • 2005
  • 온톨로지는 특정 개념에 대한 부가정보 및 개념간의 관계를 기술하는 방법으로서 고차원의 웹과 서비스를 실현하기 위한 시멘틱 웹, 그리고 지식관리 시스템을 비롯한 다양한 응용분야의 요구와 관심이 증가하면서 그 중요성이 대두되고 있다. 온톨로지에서 정보에 대한 접근은 특정 개념과 특정 관계를 가지는 데이타를 찾는 것이 주를 이루는데, 이러한 관계가 주로 트랜지티브 관계이기 때문에 트랜지티브 질의를 처리하는 것이 많은 비중을 차지한다. 또한 이와 같은 트랜지티브 클로저 질의 처리는 재귀호출의 형태로서 그 처리 비용 또한 매우 크다. 본 논문에서는 이와 같은 트랜지티브 클로저 질의의 효율적 처리를 지원하기 위한 방법으로써 그래프 레이블링을 이용한 전처리 기법을 제안한다 이 기법은 저장 공간을 효율적으로 사용하고 알고리즘도 단순한 특징을 가지기 때문에 트랜지티브 클로저 질의에 대한 응답 시간을 줄이는 장점을 가지게 된다. 그리고 이와 같이 제안한 기법에 대해 기존 시스템들과 비교해 봄으로써 그래프 레이블링을 이용한 기법이 대용량 온톨로지에서의 트랜지티브 클로저 질의 처리에 효율적임을 보이고자 한다.

인메모리 기반의 클러스터 환경에서 분산 병렬 SWRL 추론에 대한 연구 (A Study on Distributed Parallel SWRL Inference in an In-Memory-Based Cluster Environment)

  • 이완곤;배석현;박영택
    • 정보과학회 논문지
    • /
    • 제45권3호
    • /
    • pp.224-233
    • /
    • 2018
  • 최근 들어 대용량 온톨로지를 사용하여 분산 환경에서 사용자 정의 규칙을 기반으로 하는 SWRL 추론엔진에 대한 연구가 다양하게 진행되고 있다. 스키마를 기반으로 하는 공리 규칙과 다르게 SWRL 규칙들은 미리 효율적인 추론 순서를 정의할 수 없다. 또한 불필요한 반복과정으로 인해 많은 양의 네트워크 셔플링이 발생한다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 Map-Reduce 알고리즘과 인메모리 기반의 분산처리 프레임워크를 활용하여 동시에 여러 규칙을 추론할 수 있고, 클러스터의 노드간에 발생하는 데이터 셔플링의 양을 최소화할 수 있는 방법을 제안한다. 제안하는 방법의 성능을 측정하기 위해 약 2억 트리플로 구성된 WiseKB 온톨로지와 36개의 사용자 정의 규칙을 사용하여 실험을 진행했고 약 16분이 소요되었다. 또한 LUBM 벤치 마크 데이터를 이용한 비교 실험에서 기존 연구보다 2.7배 높은 성능을 보였다.

데이터 엔지니어링 방법론을 기반으로한 네트워크 트래픽 분석 시스템 (Network Traffic Analysis System Based on Data Engineering Methodology)

  • 한영신;김태규;정재은;정찬기;이칠기
    • 한국시뮬레이션학회논문지
    • /
    • 제18권1호
    • /
    • pp.27-34
    • /
    • 2009
  • 현재 네트워크 사용자 특히 인터넷 사용자 증가 속도는 가히 기하급수적이라 할 수 있다. 더불어 질 높은 서비스에 대한 요구가 제기되고 있는데 이것은 필연적으로 트래픽의 폭증을 가져오고 있다. 따라서 네트워크 트래픽의 효율적 분석 관리는 과거에 비해 더욱 중요한 사항으로 대두되고 있다. SES를 이용한 네트워크 분석은 네트워크 관리자들에게 쉽고, 효율적으로 트래픽데이터를 접근이 가능하다. 따라서 본 연구의 목적은 대용량의 네트워크 트래픽 데이터 효과적으로 처리하기 위해 최적화된 네트워크 트래픽 시스템을 구현하기 위하여 데이터 엔지니어링 방법론인 SES를 이용하여 네트워크 패킷의 정보 구조를 설계한후 DEVS를 이용하여 분석하는 시스템을 구현하고자 한다.

관계형 데이터베이스를 이용한 효율적인 OWL 속성 추론 기법 (An Efficient Reasoning Method for OWL Properties using Relational Databases)

  • 린제시;이지현;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.92-103
    • /
    • 2010
  • OWL(Web Ontology Language)은 시맨틱웹에서 온톨로지를 배포하고 공유하기 위한 W3C의 정식 권고안(Recommendation)으로 채택되었다. OWL 데이터의 숨겨진 정보를 유추하기 위해서 OWL 추론기들이 많이 개발되었다. 그러나 OWL 추론기들은 메모리를 기반으로 처리되기 때문에 대용량 OWL 데이터를 처리하기는 어렵다. 이런 문제를 해결하기 위해서 관계형 데이터베이스에 기반한 시스템이 제안되었다. 이 시스템들은 OWL 데이터를 데이터베이스에 저장하여 데이터베이스 내에서 추론을 한다. 하지만, 이 시스템들은 OWL에서 정의되는 모든 속성(Property)을 고려하지 않았고, 추론에 비효율적인 스키마를 사용하고 있다. 그리고 실제 응용환경에서 자주 발생하는 OWL 데이터 변경에 대해서도 다루지 않았다. 본 논문에서는 관계형 데이터베이스에 기반한 여러 스키마를 비교하고, 효율적인 추론을 위한 개선된 스키마를 제안한다. 그리고 OWL에서 정의되는 모든 종류의 속성을 지원하기 위한 완전하고 효율적인 추론 알고리즘과 OWL 데이터 변경에 대해 효율적인 갱신 방법을 제안한다. 실험결과를 보면 본 논문에서 제안한 스키마가 OWL 데이터 저장 및 추론에 대해 기존 스키마보다 더 좋은 성능을 보이며, OWL 데이터 갱신 방법도 기존의 방법보다 더 효율적이다.

링크드 데이터를 이용한 협업적 비디오 어노테이션 및 브라우징 시스템 (A Collaborative Video Annotation and Browsing System using Linked Data)

  • 이연호;오경진;신위살;조근식
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.203-219
    • /
    • 2011
  • 최근 인터넷이 가능한 컴퓨터뿐만 아니라 스마트TV, 스마트폰과 같은 장치를 통한 동영상 형태의 멀티미디어 소비가 증가함에 따라 단순히 시청만 하는 것이 아니라 동영상 콘텐츠 사용자들은 자신이 원하는 동영상 콘텐츠를 찾거나 동영상 콘텐츠에 등장하는 객체의 부가 정보를 브라우징 하고자 하는 요구가 증대되고 있다. 이러한 사용자의 요구를 충족시키기 위해서는 노동집약적인 어노테이션 작업이 불가피하다. 동영상 콘텐츠에 등장하는 객체에 직접 부가정보를 기술하는 키워드 기반 어노테이션 연구에서는 객체에 대한 관련 정보들을 어노테이션 데이터에 모두 포함시켜 대용량 데이터를 개별적으로 직접 관리해야 한다. 이러한 어노테이션 데이터를 이용하여 브라우징을 할 때, 어노테이션 데이터에 이미 포함 되어 있는 정보만 제한적으로 검색이 된다는 단점을 가지고 있다. 또한, 기존의 객체 기반 어노테이션에서는 어노테이션 작업량을 줄이기 위해 객체 검출 및 인식, 트래킹 등의 컴퓨터 비전 기술을 적용한 자동 어노테이션을 시도하고 있다. 그러나 다양한 종류의 객체를 모두 검출해내고 인식하여, 자동으로 어노테이션을 하기에는 현재까지의 기술로는 큰 어려움이 있다. 이러한 문제점들을 극복하고자 본 논문에서는 비디오 어노테이션 모듈과 브라우징 모듈로 구성되는 시스템을 제안한다. 시맨틱 데이터에 접근하기 위해 링크드 데이터를 이용하여 다수의 어노테이션을 수행하는 사용자들이 협업적으로 동영상 콘텐츠에 등장하는 객체에 대한 어노테이션을 수행 할 수 있도록 하는 어노테이션 모듈이다. 첫 번째는 어노테이션 서버에서 관리되는 어노테이션 데이터는 온톨로지 형태로 표현하여 다수의 사용자가 어노테이션 데이터를 쉽게 공유하고 확장 할 수 있도록 하였다. 특히 어노테이션 데이터는 링크드 데이터에 존재하는 객체의 URI와 동영상 콘텐츠에 등장하는 객체를 연결하기만 한다. 즉, 모든 관련 정보를 포함하고 있는 게 아니라 사용자의 요구가 있을 때, 해당 객체의 URI를 이용하여 링크드 데이터로부터 가져온다. 두 번째는 시청자들이 동영상 콘텐츠를 시청하는 중 관심 있는 객체에 대한 정보를 브라우징 하는 모듈이다. 이 모듈은 시청자의 간단한 상호작용을 통해 적절한 질의문을 자동으로 생성하고 관련 정보를 링크드 데이터로 부터 얻어 제공한다. 본 연구를 통해 시맨틱웹 환경에서 사용자의 상호작용을 통해 즉각적으로 관심 있는 객체의 부가적인 정보를 얻을 수 있도록 함으로써 향후 개선된 동영상 콘텐츠 서비스 환경이 구축 될 수 있기를 기대한다.