• 제목/요약/키워드: ontology language

검색결과 295건 처리시간 0.048초

Semi-Automatic Ontology Construction from HTML Documents: A conversion of Text-formed Information into OWL 2

  • Im, Chan jong;Kim, Do wan
    • International Journal of Contents
    • /
    • 제12권2호
    • /
    • pp.24-30
    • /
    • 2016
  • Ontology is known to be one of the most important technologies in achieving semantic web. It is critical as it represents the knowledge in a machine readable state. World Wide Web Consortium (W3C) has been contributing to the development of ontology for the last several years. However, the recommendation of W3C left out HTML despite the massive amount of information it contains. Also, it is difficult and time consuming to keep up with all the technologies especially in the case of constructing ontology. Thus, we propose a module and methods that reuse HTML documents, extract necessary information from HTML tags and mapping it to OWL 2. We will be combining two kinds of approaches which will be the structural refinement for making an ontology skeleton and linguistic approach for adding detailed information onto the skeleton.

An Ontology-based Knowledge Management System - Integrated System of Web Information Extraction and Structuring Knowledge -

  • Mima, Hideki;Matsushima, Katsumori
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2005년도 e-Biz World Conference 2005
    • /
    • pp.55-61
    • /
    • 2005
  • We will introduce a new web-based knowledge management system in progress, in which XML-based web information extraction and our structuring knowledge technologies are combined using ontology-based natural language processing. Our aim is to provide efficient access to heterogeneous information on the web, enabling users to use a wide range of textual and non textual resources, such as newspapers and databases, effortlessly to accelerate knowledge acquisition from such knowledge sources. In order to achieve the efficient knowledge management, we propose at first an XML-based Web information extraction which contains a sophisticated control language to extract data from Web pages. With using standard XML Technologies in the system, our approach can make extracting information easy because of a) detaching rules from processing, b) restricting target for processing, c) Interactive operations for developing extracting rules. Then we propose a structuring knowledge system which includes, 1) automatic term recognition, 2) domain oriented automatic term clustering, 3) similarity-based document retrieval, 4) real-time document clustering, and 5) visualization. The system supports integrating different types of databases (textual and non textual) and retrieving different types of information simultaneously. Through further explanation to the specification and the implementation technique of the system, we will demonstrate how the system can accelerate knowledge acquisition on the Web even for novice users of the field.

  • PDF

사용자 질의 의미 해석을 위한 온톨로지 지식베이스 스키마 구축 (Ontology Knowledge Base Scheme for User Query Semantic Interpretation)

  • 도하나;이무훈;정훈;최의인
    • 디지털융복합연구
    • /
    • 제11권3호
    • /
    • pp.285-292
    • /
    • 2013
  • 최근의 검색 형태는 키워드 기반 검색에서 보다 더 정확한 결과를 제공하기 위한 시맨틱 검색 방법으로 변화하고 있다. 하지만 일반 사용자들은 여전히 기존의 키워드 기반 검색에 익숙하기 때문에 시맨틱 검색을 위한 형식화된 구조적 질의어를 구성할 수 없다. 따라서 본 논문에서는 이러한 사용자들의 키워드 해석을 위한 온톨로지 지식 베이스 스키마를 제안한다. 제안된 스키마는 서술 논리 추론을 위해 OWL-DL을 기반으로 설계되었으며 최소한의 관계 정의와 추론 규칙 언어인 SWRL(Semantic Web Rule Language)으로 추론함으로써 보다 풍부한 개체 관계의 표현을 제공한다. 마지막으로 논문에서 제안한 사용자 질의 의미 해석 기법의 검증을 위해 키워드 유사도 실험 결과를 설명한다.

온톨로지 기반 연구개발 평가지표 선정기법 (An Ontological Approach to Select R&D Evaluation Metrics)

  • 이희정
    • 산업경영시스템학회지
    • /
    • 제33권1호
    • /
    • pp.80-90
    • /
    • 2010
  • Performance management is very popular in business area and seems to be an exciting topic. Despite significant research efforts and myriads of performance metrics, performance management today as a rigorous approach is still in an immature state and metrics are often selected based on intuitive and heuristic approach. In a R&D sector, the difficulty to select the proper performance metrics is even more increasing due to the natural characteristics of R&D such as unique or domain-specific problems. In this paper, we present a way of presenting R&D performance framework using ontology language. Based on this, the specific metrics can be derived by reusing or inheriting the context in the framework. The proposed ontological framework is formalized using OWL(Ontology Web Language) and metrics selection rules satisfying the characteristics of R&D are represented in SWRL(Semantic Web Rule Language). Actual metrics selection procedure is carried out using JESS rule engine, a plug-in to Prot$\acute{e}$g$\acute{e}$, and illustrated with an example, incorporating a prevalent R&D performance model : TVP(Technology Value Pyramid).

온톨로지 디버깅을 위한 종속 부호 기반 비논리적 공리 탐지 (Dependency Label based Causing Inconsistency Axiom Detection for Ontology Debugging)

  • 김제민;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.764-773
    • /
    • 2008
  • W3C는 시맨틱 웹 환경에서 온톨로지를 저작하고 공유하기 위해 온톨로지 구축 언어인 OWL을 발표하였다. 현재 OWL 온톨로지의 논리적 정당성을 검사하기 위해서, OWL 추론 엔진들이 소개되고 있다. 그러나 대부분의 추론 엔진들은 정당하지 못한 개념의 탐지 과정 없이 결과만을 보여준다. 본 논문에서는 온톨로지내의 정당하지 못한 개념을 디버깅하기 위해 종속 부호 기반 비논리적 공리(CIA-Causing Inconsistency Axiom) 탐색 기법을 제안한다. 비논리적 공리는 정당하지 못한 개념들을 유발하는 공리들의 집합이다. 비논리적 공리를 탐지하기 위해서는 온톨로지 내에서 비 일관성을 유발하는 공리를 찾아내야 한다. 온톨로지 저작 도구에 정확한 비논리적 공리가 제공된다면, 온톨로지 저작 도구는 온톨로지 내에서의 정당하지 못한 내용을 수정할 수 있도록 수정될 일부 내용만을 보여줄 것이다. 따라서 본 논문은 두 부분에 초점을 맞추었다. 첫 번째, 정당하지 못한 내용을 가진 온톨로지가 주어졌을 때 비 정당성을 유발하는 공리들을 도출하고, 이들의 근원을 식별한다. 두 번째 비 정당성을 유발하는 공리가 탐지되었을 때 이들만을 추출하여, 온톨로지 설계자에게 보여주는 것이다. 따라서 먼저 기존에 발표되었던 테이블로 알고리즘 기반의 결정 모듈을 소개하고, 이보다 향상된 기법인 종속 부호 기반 비논리적 공리 탐지 기법을 제안한다. 본 논문의 결과물은 현재 온톨로지 언어의 기본이 되는 SHOIN 서술 논리 응용시스템에 적용가능하다.

의미 분석을 위한 말뭉치 기반의 온톨로지 학습 (Corpus-Based Ontology Learning for Semantic Analysis)

  • 강신재
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.17-23
    • /
    • 2004
  • 본 논문은 한국어정보처리에서 단어의 의미를 결정하기 위한 말뭉치 기반의 온톨로지 학습 방법을 제시하고 있다. 먼저 이미 확보된 전자사전의 정보를 이용하여 단어의 확실한 의미를 우선 결정한 후, 아직 결정하지 못한 단어의 의미는 온톨로지를 이용하여 최종 결정하는 절차를 거친다. 온톨로지를 단어 의미 중의성 해소를 위한 지식베이스로 사용하기 위해서는, 온톨로지 내 개념들간의 상호정보가 말뭉치의 통계 정보에 근거하여 미리 계산된다. 계산된 상호정보 값을 가중치로 간주하면 온톨로지는 가중치 그래프로 생각할 수 있으므로, 개념간 최소 경로를 통하여 개념간 연관도를 알아 볼 수 있다. 실제 기계번역 시스템에서 본 방법은 온톨로지를 사용하지 않은 방법보다 9%의 성능 향상을 가져오는 결과를 얻을 수 있었다.

  • PDF

맞춤형 u-City 서비스 제공을 위한 상황인지 추론 시스템 (Context-Aware Reasoning System for Personalized u-City Services)

  • 이창훈;김지호;송오영
    • 정보처리학회논문지C
    • /
    • 제16C권1호
    • /
    • pp.109-116
    • /
    • 2009
  • 유비쿼터스 컴퓨팅 기술을 기반으로 주변 상황을 인식하고 그에 따른 상황인지 서비스를 실현하기 위한 많은 연구가 진행되고 있다. u-City에서는 도시의 곳곳의 센서 등을 통해 상황 정보가 수집되고, 개인들은 자신의 모바일기기와 도시의 정보 통신 인프라를 통하여 상황인지 서비스를 제공 받게 된다. 본 논문에서는 u-City의 네트워크에 연결된 센서나 디바이스에서의 정보를 구조화하는데 유용하고 상호 관계성 및 부분적인 상황의 정보를 표현할 수 있는 OWL(Web Ontology Language)을 사용한 온톨로지를 설계하고, 수집된 상황정보와 사용자의 의도를 기반으로 서비스를 추론하는 맞춤형 u-City 서비스 제공을 위한 상황인지 추론 시스템을 제안한다.

OWL Web Ontology Language를 위한 Ontology Parser의 설계 (A Design of Ontology Parser for OWL Web Ontology Language)

  • 이미경;박천수;손주찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.573-576
    • /
    • 2004
  • 시맨틱 웹에 이용되는 웹 온톨로지 언어들로는 RDF/RDFS, DAML+OIL, OWL 등이 있으며, 현재 W3C에서는 OWL을 웹 온톨로지 표준 언어로 삼고 있다. 기존의 웹 온톨로지 문서들의 파서는 대부분 RDF를 기반으로 한 Triple 모델을 기반으로 하여 파싱한다. 그러나 OWL의 경우는 triple 형태로 변환시키면 OWL Full의 형태를 가지게 되고 OWL 온톨로지의 표현력과 데이터의 손실을 가져오게 된다. 따라서 OWL 문서의 파싱을 위하여 우리는 OWL Abstract Syntax를 이용하여 Tree 모델을 가지는 OWL 파서를 만들고자 한다. 본 논문에서는 시맨틱 웹에서 사용되는 웹 온톨로지들을 파싱하여 온톨로지 객체 모델을 생성해주는 기능을 가지는 온톨로지 파서를 설계, 구현하였다. 논문에서 설계한 온톨로지 파서는 RDF, DAML+OIL, OWL 웹 온톨로지 문서들을 파싱하여 온톨로지 객체 모델을 생성할 때, RDF 온톨로지의 경우는 Triple 모델 형태로 파싱을 하지만, OWL 온톨로지의 경우에는 OWL Abstract Syntax Tree 모델 형태로 파싱한 후, OOM으로 변환시켜준다. 이를 위해 웹 온톨로지 언어의 종류 구분과 OWL 온톨로지의 경우, OWL Full, OWL DL, OWL Lite의 서브 타입을 구별하는 기능도 추가하였다.

  • PDF

지능형 이미지 검색 시스템을 위한 추론 기반의 웹 온톨로지 구축 (An Implementation of Inference-Based Web Ontology for Intelligent Image Retrieval System)

  • 김수경;안기홍
    • 정보관리학회지
    • /
    • 제24권3호
    • /
    • pp.119-147
    • /
    • 2007
  • 시맨틱 웹 응용의 구현에 있어 가장 중요한 기술이 시맨틱 웹의 특징을 만족하는 웹 온톨로지의 구축임에도 불구하고, 대부분 웹 온톨로지의 구축에 적용된 기법들이 시맨틱 웹과 웹 온톨로지의 특징을 만족하지 못함에 따라 시맨틱 웹 응용의 발전과 보급이 미흡하다. 따라서 본 연구는 온톨로지와 웹 온톨로지 관련 연구들을 분석하여 시맨틱 웹을 위한 웹 온톨로지의 특징들을 파악하고, 기존 온톨로지 구축과 웹 온톨로지 구축을 위해 제안된 구축 기법들을 비교 분석하여 시맨틱 웹과 웹 온톨로지의 특징에 적합한 웹 온톨로지 구축 기법을 제안한다. 실험은 제안된 방법에 따라 서술 논리와 SWRL의 표현 방법을 이용한 공리 규칙을 기반으로 온톨로지를 모델링하여 추론 기반의 웹 온톨로지를 구축하였으며, 구축된 온톨로지의 검증을 위한 온톨로지 추론 실험을 통해 온톨로지 성능을 검증하였다. 구축된 웹 온톨로지를 기반으로 하는 시맨틱 웹 응용의 예로 지능형 이미지 검색 시스템을 실험 시스템으로 구현하였다. 실험 시스템의 성능 평가를 위해 비교 대상 시스템과의 검색 실험 결과, 실험 시스템이 재현율과 정확율에 있어 우수한 성능을 보여주었다.

Design and Construction of a NLP Based Knowledge Extraction Methodology in the Medical Domain Applied to Clinical Information

  • Moreno, Denis Cedeno;Vargas-Lombardo, Miguel
    • Healthcare Informatics Research
    • /
    • 제24권4호
    • /
    • pp.376-380
    • /
    • 2018
  • Objectives: This research presents the design and development of a software architecture using natural language processing tools and the use of an ontology of knowledge as a knowledge base. Methods: The software extracts, manages and represents the knowledge of a text in natural language. A corpus of more than 200 medical domain documents from the general medicine and palliative care areas was validated, demonstrating relevant knowledge elements for physicians. Results: Indicators for precision, recall and F-measure were applied. An ontology was created called the knowledge elements of the medical domain to manipulate patient information, which can be read or accessed from any other software platform. Conclusions: The developed software architecture extracts the medical knowledge of the clinical histories of patients from two different corpora. The architecture was validated using the metrics of information extraction systems.