• 제목/요약/키워드: 온톨로지 정보검색

검색결과 438건 처리시간 0.027초

신뢰값 기반 대용량 트리플 처리를 위한 스파크 환경에서의 RDFS 온톨로지 추론 (Spark based Scalable RDFS Ontology Reasoning over Big Triples with Confidence Values)

  • 박현규;이완곤;바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.87-95
    • /
    • 2016
  • 최근 인터넷과 디바이스의 발전으로 지식 정보의 양이 방대해 지면서 대용량 온톨로지를 이용한 추론 연구가 활발히 진행되고 있다. 일반적으로 트리플로 표현되는 빅데이터는 기계학습 프로그램이나 지식 공학자가 각 트리플의 신뢰도를 측정하여 제공한다. 하지만 수집된 데이터는 불확실한 데이터를 포함하고 있으며, 이러한 데이터를 추론하는 것은 불확실성을 내포한 추론 결과를 초래할 수 있다. 본 논문에서는 불확실성 문제를 해결하기 위해 수집된 데이터에 대한 신뢰의 정도를 나타내는 신뢰값(Confidence Value)를 이용한 RDFS 규칙 추론 방법에 대하여 설명하고, 메모리 기반의 분산 클러스터 프레임워크인 스파크(Spark)를 기반으로 데이터의 불확실성에 대한 고려를 하지 않는 기존의 추론 방법과 달리 신뢰값 계산에 대한 방법을 응용하여 RDFS 규칙을 통해 추론되는 새로운 데이터의 신뢰값을 계산하며, 계산된 신뢰값은 추론된 데이터에 대한 불확실성을 나타낸다. 제안하는 추론 방법의 성능을 검증하기 위해 온톨로지 추론과 검색 속도를 평가할 때 활용되는 공식 데이터인 LUBM을 대상으로 신뢰값을 추가하여 실험을 수행하였으며, 가장 큰 데이터인 LUBM3000을 수행하였을 때 1179초의 추론시간이 소요되었고, 초당 350K 트리플을 처리할 수 있는 성능을 보였다.

분산시각 미디어 검색 프레임워크의 성능향상을 위한 브로커 서버 우선순위를 이용한 라운드 로빈 스케줄링 기법 (A Scheduling Algorithm using The Priority of Broker for Improving The Performance of Semantic Web-based Visual Media Retrieval Framework)

  • 심준용;원재훈;김세창;김정선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.22-32
    • /
    • 2008
  • 기존의 Ontology를 이용한 이미지 검색 시스템이나 메타데이타 기반의 분산 이미지 검색 시스템들의 단점들을 극복하기 위해 이미지 제공자들의 자율성을 보장하면서, Semantic 기반의 이미지 검색을 지원하는 분산 시각미디어 검색 프레임워크인 HERMES(The Retrieval Framework for Visual Media Service)가 제안되었다. 제안된 프레임워크에서는 서비스를 사용하는 다수 사용자들이 Broker서버에 동시에 접속했을 경우 발생하는 Overhead에 대한 문제를 해결 할 수 없었기 때문에 성능의 저하와 확장성을 고려할 수 없는 문제를 안고 있다. 본 논문에서는 다수의 동시 사용자들이 접속했을 경우에도 성능의 저하 없이 비슷한 수준의 서비스를 제공하기 위해서 Broker서버를 증설하여 Monitoring System으로부터 각각의 Broker 내부 컴포넌트의 수행시간을 측정하여 저장하고, 저장된 데이타에 대하여 각 Broker들에 대한 우선순위를 결정하는 테이블을 작성한다. 사용자로부터 Query를 입력받는 User Interface는 Broker의 Ranking Table을 참조하여 다수의 Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상시킬 수 있는 Load Balancing 시스템을 제안한다. 또한 기존의 방식들과 비교실험을 통하여 제안하는 Load Balancing 시스템의 스케줄링 기법이 빠르다는 것을 보여준다.

TMDR 기반의 실시간 데이터 통합 환경 설계 (Design of The Environment for a Realtime Data Integration based on TMDR)

  • 정계동;황치곤
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1865-1872
    • /
    • 2009
  • 본 논문은 레거시를 통합 검색하기 위한 방안으로 XMDR을 확장하는 방안을 제안한다. 이러한 확장은 메타데이터의 관리를 위한 메타 시멘틱 온톨로지, 위치 정보를 위한 메타 로케이션, 그리고 시멘틱 웹을 표현하기 위한 표준 언어인 토픽맵을 결합한다. 본 논문에서는 이것을 TMDR(Topic Map MetaData Registry)이라 한다. 토픽맵은 지식계층으로 인덱스와 같은 역할을 수행한다. 그러나 토픽맵은 데이터의 변화가 빈번한 경우에는 효율이 떨어질 수 있다. 이러한 문제를 해결하기 위해 본 시스템은 메타 데이터 사이의 관계, 실제 데이터 사이의 관계 그리고 메타데이터와 실제 데이터 사이의 관계를 토픽맵으로 표현한다. 표현된 토픽맵은 메타 데이터 간의 관계로 인해 실제 데이터간의 관계 변화를 줄이는 방안을 제시한다.

군 병원을 위한 시맨틱 웹 기반 진료 의사결정지원 시스템 (Semantic Web-based Clinical Decision Support System for Armed Forces Hospitals)

  • 유동희;나민영
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.317-326
    • /
    • 2010
  • 군 병원에서는 장병들에 대한 진단과 처방 과정을 보다 효율적으로 지원하기 위해 진료 의사결정지원 시스템의 도입이 요구되고 있다. 본 논문에서는 시맨틱 웹 기술을 기반으로 구현된 군 병원을 위한 진료 의사결정지원 시스템을 제안하고자 한다. 이를 위해, 의료 지원에 사용되는 다양한 개념들과 지식들로 구성된 국방 의료 온톨로지와 국방 의료 규칙을 구축하였고, 구축된 온톨로지와 규칙이 환자 진료에 활용되는 것을 보여주기 위해 진료 의사결정지원 시스템을 구현하였다. 또한 진료 의사결정지원 시스템을 통해 작성된 진료 기록들을 활용하여 의미 기반 검색이 수행되는 과정을 설명하였다.

Non-First Normal Form에 입각한 eBook Annotation 온톨로지의 설계와 구현 (Design and Implementation of eBook Annotation Ontology Based on Non-First Normal Form)

  • 신성욱;김종석;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.361-363
    • /
    • 2005
  • 본 연구에서는 온라인 다중 사용자 환경의 eBook 어노테이션 시스템 개발에서 데이터를 의미 기반으로 관리하고, 데이터에 대하여 상호 공통적인 이해를 표현하며, 그리고 데이터에 대한 무결성 검사 등을 지원하기 위해서 eBook 어노테이션 온톨로지를 구축하였다. eBook 어노테이션 테이터에 대한 상호 공통적인 이해의 표현을 위해서 한국 전자책 문서 표준인 EBKS(Electronic Book of Korea Standard)를 기반으로 구축 하였으며 구축된 온톨로지는 Conceptual Graph(CG)를 사용하여 표현하였다. 의미 기반의 처리를 위해서 본 온톨로지에서는 다국어(Multilingua) 관계를 고려하였으며 또한 오노테이션 데이터 생성 시 중요도를 표현하기 위해서 중요성 axiom을 고려했고, $NF^2$(Non-First Normal Form)에 입각하여 온톨로지를 설계함으로서 어노테이션 데이터의 검색에 활용도를 높였다. 제안된 온톨로지는 어노테이션 데이터의 재사용성을 높일 수 있고 의미 정보를 활용함으로써 eLearning, cyberclass과 같은 다중 사용자 환경에서 효과적인 협업을 가능하게 한다. 본 연구에서는 구현한 eBook annotation 시스템은 구축한 온톨로지를 사용함으로써 의미 기반의 데이터 관리가 가능하다. 또한 어노테이션 생성 시 온톨로지 구조를 모르더라도 어노테이션을 생성할 수 있는 인터페이스를 구현하였다.

  • PDF

MDR과 온톨로지를 결합한 3계층 정보 통합 시스템 (A 3-Layered Information Integration System based on MDRs End Ontology)

  • 백두권;최요한;박성공;이정욱;정동원
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.247-260
    • /
    • 2003
  • 한 도메인 내에서 다양한 데이터베이스의 데이터를 공유하고 표준화하기 위해 MDR(Metadata Registry)을 이용하여 정보를 통합할 수 있다. 그러나 MDR을 구축하는 조직간 데이터요소 표현의 불일치 때문에 MDR간 광역적인 정보를 통합하는데 어려움이 있다. 또한 웹과 같은 다양한 데이터베이스가 존재하는 환경에서 통합된 정보를 검색하고자 하는 사용자는 각각의 데이터베이스 스키마 정보를 확보하기엔 한계가 있다. 따라서 본 논문에서는 MDR과 온톨로지(Ontology)를 결합한 3계층 정보 통합 시스템을 제안한다. MDR간 데이터요소의 관계를 사상시키고 표현의 불일치를 해결하기 위해 MDR의 표준성기능과 온톨로지의 개념과 관계기능을 결합한 정보 통합 모델을 정의하고 에이전트 기술을 적용한 계층적이고 독립적인 정보 통합 아키텍처를 제안한다. 온톨로지는 사용자의 질의에서 개념을 추출하기 위한 의미망(semantic network)의 역할과 MDR간의 데이터요소 관계를 설정하기 위한 기능으로 적용되었다. MDR과 지식베이스(Knowledge Base)는 데이터요소간 표현 불일치를 해결하기 위해 적용하였다. 이러한 핵심요소를 고려하여 제안된 아키텍처를 사용하여 MDR과 온톨로지를 결합한 3계층 정보 통합 시스템을 구현하였다.

온톨로지 기반 법령 검색시스템의 개발: 철도·교통 분야 연구개발사업을 중심으로 (A Development of Ontology-Based Law Retrieval System: Focused on Railroad R&D Projects)

  • 원민재;김동희;정해민;이상근;홍준석;김우주
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.209-225
    • /
    • 2015
  • 철도교통 분야의 연구개발사업은 여러 법령과 긴밀하게 관련되어 있기 때문에, 연구개발을 성공적으로 수행했더라도 법령에 의해 제약되어 연구개발 결과의 실질적인 사업화 또는 실용화를 이루어내지 못하는 사례가 발생하고 있다. 본 논문에서는 이러한 사례를 방지하기 위한 방편으로 철도교통 분야에서 진행되는 연구개발사업과 관련된 법령을 검색할 수 있는 법령검색시스템의 모델을 제시하였다. 사업 내용을 설명하는 연구개발계획서가 시스템에 입력되면 요약서의 내용을 대상으로 형태소 분석을 수행하여 명사들만을 남긴다. 국가법령정보센터에서 제공하는 법령정보공동활용서비스를 사용하여 명사들 중 법령용어를 분류하고, 법령용어와 해당 법령용어를 정의하는 법령과의 관계를 지능형 지식 베이스인 온톨로지에 저장한다. 온톨로지에 저장된 법령들은 본 연구에서 개발한 추가적인 지표 계산과정을 거쳐 연구개발사업과 관련된 정도를 기준으로 순위가 매겨진 후, 시스템 사용자에게 제공된다. 사용자는 연구개발에 영향을 미칠 수 있는 법령을 검색할 수 있게 되어 사업 시작 전에 연구 방향을 결정하는 데 참고하거나, 사업 진행하는 과정에서도 참고자료로 사용할 수 있다. 궁극적으로, 법령에 의해 철도교통 분야 연구개발사업이 실패하거나 실용화되지 못하는 경우를 사전에 방지함으로써, 사업에 투자한 예산에 의해 기대되는 충분한 기술적 경제적 효과를 얻을 수 있게 될 것이다.

도서관 3.0 기반 서비스에 대한 대학도서관 사서의 인식에 관한 연구 (A Study of the Awareness Focusing on the Library 3.0 for the Academic Librarians)

  • 노동조;조철현
    • 정보관리학회지
    • /
    • 제28권4호
    • /
    • pp.263-278
    • /
    • 2011
  • 본 연구는 국내 대학도서관 사서 326명을 대상으로 설문조사를 통하여 도서관 3.0 서비스에 대한 인지도 및 향후 유용성 정도, 대응전략 등에 대하여 알아보았다. 본 연구의 결과, 도서관 3.0 서비스에 대한 인지도는 (1) 모바일 도서관, (2) 시멘틱 검색, (3) 인공지능, (4) 클라우드 컴퓨팅, (5) 온톨로지, (6) 링키드 도서관의 순이었다. 도서관 3.0 서비스에 대한 유용성은 (1) 모바일 도서관, (2) 링키드 도서관, (3) 시멘틱 검색, (4) 클라우드 컴퓨팅, (5) 인공지능, (6) 온톨로지의 순이었다. 그리고 도서관 3.0 서비스에 대한 인지도가 도서관 경쟁력으로 작용하지 못하고 개인적인 경쟁력으로만 그치는 것으로 나타나 추후 개인의 경쟁력을 조직의 경쟁력으로 끌어올릴 수 있는 방안에 대한 연구가 필요하다.

지식 문서에서 도메인 온톨로지를 이용한 개념 추출 기법 (Concept Extraction Technique from Documents Using Domain Ontology)

  • 문현정;우용태
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.309-316
    • /
    • 2006
  • 본 논문에서는 도메인 온톨로지를 이용하여 XML 형식의 지식 문서를 분류하고 대표 개념을 효과적으로 추출하기 위한 기법을 제시하였다. 먼저, 도메인 온톨로지는 텍스트마이닝 기법과 통계적 기법을 이용하여 생성하였다. 이를 위해 XML 문서의 구조적인 특징을 이용하여 도메인 대표용어 집합을 구성하였다. 그리고 XML 문서를 효과적으로 분류하기 위한 DScore 기법과 지식 문서로부터 개념을 추출하기 위한 TScore 기법을 제시하였다. 본 논문에서 제안한 기법의 효율성을 검증하기 위하여 295편의 컴퓨터 관련 논문을 대상으로 실험하였다. 실험 결과, 본 연구에서 제안한 도메인 대표 용어 집합을 이용한 분류 결과가 기존의 방법보다 우수한 성능을 보였다. 특히 TScore기법에서는 문서에서 출현한 용어의 빈도수는 낮더라도 문서의 개념을 대표할 수 있는 용어를 효과적으로 추출할 수 있음을 보였다. 본 연구는 개념 기반의 검색 기법을 통하여 대량의 지식 문서를 효과적으로 관리하기 위한 지식 관리 모델에 적용할 수 있다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.