• 제목/요약/키워드: OWL Document

검색결과 19건 처리시간 0.03초

비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계 및 구현 (The Design and Implementation of OWL Ontology Construction System through Information Extraction of Unstructured Documents)

  • 조대웅;최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.23-33
    • /
    • 2014
  • 정보검색 분야의 발전은 많은 양의 정보를 빠르게 찾아주는 것에서 사람이 원하는 정보를 정확하게 찾아주는 연구 분야로 넓혀가고 있다. 핵심 기술로는 개인화 및 시맨틱 웹 기술을 활용하고 있다. 웹 문서에 대한 자동색인 기술과 처리능력은 연구단계를 넘어 실용 서비스로 나타나고 있다. 하지만 웹 문서 이외의 첨부된 문서 형태에 대한 문서정보검색에 관한 연구는 미진한 상황이다. 본 논문에서는 텍스트, 워드, 한글과 같은 형식으로 작성된 비정형 문서의 본문 내용을 분석하여 OWL 온톨로지로 구축하는 방법에 대해 설명한다. 문서 온톨로지의 TBox를 구축하고, 문서로부터 얻을 수 있는 자원을 선정하여, 구축된 문서 온톨로지의 인스턴스로 활용할 수 있도록 시스템으로 구현한다. 이와 같은 비정형 문서의 온톨로지 자동 구축으로 해당 문서의 시맨틱 기술을 이용한 정보검색 및 문서관리 시스템에서 효과적으로 활용 가능하다.

Extracting OWL Ontology from XML instances via XML Schema

  • Pham, Thi Thu Thuy;Lee, Young-Koo;Lee, SungYoung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.801-802
    • /
    • 2009
  • Currently, XML and its schema language have become the standard for data representation and information exchange format on the current web. Unfortunately, problems happen when integrating different data sources since XML mainly supports the document structure but lack consideration on sharing knowledge of data. Meanwhile, Semantic Web technologies, such as Web Ontology Language (OWL), can include the structure as well as the semantics of the data. Therefore, finding a way to integrate XML data as OWL ontology receives a high interest nowadays. In this paper we present a mapping notation to convert XML Schema to OWL domain knowledge and an effective method to transform XML instances into OWL individuals. While keeping the XML original structure, our work also adds more semantics for the XML document. Moreover, whole of the transformation processes are done automatically without any user interference. Further, our transforming approach provides the solution for duplicate element names in XML document which has not mentioned in the previous work. Our results in existing OWL syntaxes can be loaded immediately by OWL editors and Semantic Web applications.

OWL 데이타 검색을 위한 효율적인 저장 스키마 구축 및 질의 처리 기법 (An Efficient Storage Schema Construction and Retrieval Technique for Querying OWL Data)

  • 우은미;박명제;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.206-216
    • /
    • 2007
  • 현재 웹의 한계를 극복하기 위해 제안된 시맨틱 웹을 구축하기 위해서는 데이타에 잘 정의된 의미를 부여하는 온톨로지 언어를 사용해야 한다. W3C에서 제안한 OWL은 대표적인 온톨로지 언어이다. 시맨틱 웹 상에서 OWL 데이타를 효율적으로 검색하기 위해서는 잘 구성되어진 저장 스키마를 구축해야 한다. 본 논문에서는 효율적인 질의 처리를 위한 저장 스키마와 그에 적절한 질의 처리 기법을 제안하고자 한다. 또한 OWL 데이타는 클래스와 프로퍼티들의 상속 관계 정보를 포함한다. 따라서 질의 수행 시질의에서 나타나는 클래스와 프로퍼티들 뿐 아니라 그것들과 관련된 계층 구조에 대한 탐색이 필요하다. 본 논문은 계층 정보를 유지하는 XML 문서를 생성하여 XML 데이타베이스 시스템에 저장한다. 이때 부모/자식 관계 추출에 용이한 기존의 넘버링 기법을 기반으로 노드의 순서 정보를 XML 문서의 애트리뷰트로 유지함으로써 질의에서 나타나는 클래스와 프로퍼티의 하위 정보들을 효율적으로 추출하고자 한다. 마지막으로 실험을 통한 질의 처리 성능의 비교를 통해서 본 논문에서 제안하고자 하는 기법들이 효과적임을 보인다.

시멘틱 웹의 효율적 검색을 지원하는 저장 구조의 요소 기술 설계 (Designing Requisite Techniques of Storage Structuresupporting Efficient Retrieval in Semantic Web)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권3호
    • /
    • pp.227-236
    • /
    • 2006
  • 차세대 웹 환경을 위한 시맨틱 웹에 대한 관심이 날로 증대되고 있다. 이와 더불어 시맨틱 웹에서 자원의 의미적인 관계를 표현하기 위한 언어들에 대한 연구가 활발히 진행 중이다. 특히 이러한 연구의 시작점으로 RDF, DAML+OIL같은 여러 온톨로지 언어들이 등장하였지만 자원의 특성에 대한 기술이나 그들 간의 관계에 대한 정의를 명확하게 표현하기에는 미흡한 점이 많다. 그러나 최근에 제안된 OWL은 RDF나 RDF 스키마를 확장하여 보다 의미있는 자원의 관계를 정의할 수 있다. 본 논문에서는 OWL로 표현된 문서를 저장하기 위한 구조를 관계형 데이터베이스를 기반으로 제안한다. 본 논문에서 제안한 저장 구조는 기존의 RDF와 RDF 스키마를 위한 저장 구조를 확장하여, OWL을 통해 제공되는 클래스나 속성간의 동일성, 또는 이질성, 여러 클래스의 집합 관계 등의 추가적 기능을 지원하는데 목적을 두고 있다. 또한 제안한 저장구조를 이용한 OWL 문서의 질의 형태를 분석하고 추가 질의 형태를 제안하고, OWL 문서의 저장 모듈과 사용자 인터페이스, 질의 처리 모듈로 구성된 OWL 저장 시스템을 설계하고 구현한다.

  • PDF

OWL 문서의 변경 탐지 및 관리 기법 (Change Detection and Management Scheme of OWL Documents)

  • 김연희;김지현
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권1호
    • /
    • pp.43-52
    • /
    • 2012
  • 정보 자원에 대한 정확한 검색을 위해서는 점진적으로 변화하는 온톨로지의 변경 내용을 효율적으로 관리할 필요가 있다. 최근에는 OWL을 이용해 온톨로지를 기술하는 경우가 많기 때문에 OWL 문서로 작성된 온톨로지의 변경 내용을 관리할 수 있는 기법이 필요하다. 이러한 요구에 따라 본 논문에서는 OWL로 기술된 온톨로지의 변화를 탐지할 수 있도록 변경 가능한 요소를 분류하고 각 요소의 특성에 맞게 변경 내용을 관리할 수 있는 저장 스키마를 제안한다. 그리고 온톨로지 버전별로 클래스나 프로퍼티에 대한 정보를 제공하는 뷰를 이용하여 질의 처리 성능을 개선할 수 있는 가능성을 제시한다. 본 논문에서 제안한 저장 스키마는 각 온톨로지 버전과 관련된 메타데이터의 변경 내용도 함께 저장한다. 또한 온톨로지가 변경되면 자동적으로 추가 또는 삭제되어야 하는 메타데이터의 내용도 추론을 통해 관리할 수 있다. 따라서 본 논문에서 제안한 저장 스키마를 이용하면 온톨로지의 변경 이력에 대한 검색이 가능하고 사용자가 선택한 온톨로지 버전에 맞는 정확하고 유효한 메타데이터를 제공할 수 있다.

OWL 온톨로지 언어로의 HTML문서 변환 시스템 (A Conversion System of HTML Document into OWL Ontology language)

  • 곽현수;김수경;김영근;안기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.539-542
    • /
    • 2004
  • 텍스트 중심의 현재의 웹은 주로 시각적 효과만을 고려하여 사용되었으므로, 사용자가 원하는 정보를 효율적으로 추출하기에는 많은 문제점을 지니고 있다. 그래서 점차 메타데이타의 개념을 통하여 웹 문서에 시맨틱 정보를 덧붙이고 이를 이용하여 컴퓨터와 사람이 의사소통을 할 수 있는 시맨틱 웹이 제안되었다. 앞으로 의미 중심의 시맨틱 웹으로 발전해 나가기 위해서는 온톨로지의 구현이 필수적으로 요구되는데, 본 논문은 현재 웹에서 사용되고 있는 HTML언어를 재입력하지 않고, 온톨로지 언어 중 하나인 OWL로 자동 변환하는 시스템을 구현하고자 한다. 온톨로지를 사용함으로써 현재의 웹과 비교하여 좋은 잇점은 문서에 대한 의미와 구조를 파악하여 기계가 의미에 따라 정보를 자동 추론을 할 수 있고, 이기종간의 상호운용성을 보장한다. 또한 현재의 웹에서는 많은 문서들이 서로 동일한 내용으로 작성되는 경우가 많은데, 작성된 온톨로지를 공유하고 재사용하여 그에 따르는 시간과 비용을 줄일 수 있다.

  • PDF

OWL 온톨로지를 기반으로 하는 논문 검색 시스템에 관한 연구 (A Study on Paper Retrieval System based on OWL Ontology)

  • 선복근;위다현;한광록
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.169-180
    • /
    • 2009
  • 기존의 논문검색은 키워드 기반 검색이고, 발간된 자료의 양이 방대해 짐에 따라 사용자가 원하는 정보를 검색하는데 어려움이 가중되고 있다. 사용자의 의도에 맞는 정보를 검색하기 위해서는 인터넷 환경에서 웹 문서 자원 사이의 의미 정보를 온톨로지로 표현하고, 이 온톨로지를 컴퓨터가 이해할 수 있게 하는 시맨틱 웹의 도입이 필요하다. 따라서 본 논문에서는 OWL 온톨로지 기반의 추론을 통한 논문정보 검색시스템에 대하여 논한다. 시맨틱 웹의 새로운 온톨로지 언어로 부상한 OWL기반의 논문 온톨로지를 구축하고, 논문 속성들 간의 다양한 상관관계를 서술논리 쿼리로 작성한다. 검색시스템은 이 쿼리를 기반으로 논문 온톨로지에 대하여 추론함으로써 지능적인 정보검색이 가능하도록 하였다. 마지막으로 기존 논문 검색 방법과 본 논문의 실험 결과를 비교하였다.

A Study on Transforming ICT Research Information Service into Semantic Web Environment

  • Song, Jong-Cheol;Moon, Byung-Joo;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제5권3호
    • /
    • pp.249-253
    • /
    • 2007
  • The Research on the ICT(Information & Communication Technology) is proposed the category to IT839 strategy by Government. Government is driving to researching on technology about IT839 Strategy. By transforming this category and research information into Semantic Web environment, it is possible to search function utilizing knowledge base and information object by use of TBox and ABox. In this regard, this study proposes technology for generation of Semantic Web Document about ICT Research Information. The ontology is constructed by using category to IT839 Strategy. The features of framework proposed in this study is to have used a skill to directly map Ontology instance and in case of inability of direct mapping, proposed a skill to establish reliable Semantic Web Document by suggesting indirect mapping skill using mechanical study. In addition, it is possible to establish low cost/high quality Semantic Web Document about ICT research information.

법령 온톨로지 구축에 관한 연구 (A Study on Legal Ontology Construction)

  • 조대웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.105-113
    • /
    • 2014
  • 본 논문에서는 법령 온톨로지 구축을 위해 법령의 구조적 특징과 요소 간의 관계에 대해 분석 정리하고 정리된 내용을 바탕으로 OWL DL 수준의 매핑 규칙을 제안한다. 제안하는 매핑 규칙은 국내 법령 관계의 상-하위 구조, 법령의 고유 속성, 법률 간의 참조 관계와 같은 구조적인 관계의 TBox를 구축하는 방법과 법률 문장을 분석하여 조문 규정 별로 나타나는 문장의 패턴 유형을 선별, ABox로 구축될 수 있는 요소를 표현한다. 제안된 매핑 규칙은 일반 텍스트로 설명되고 있는 국내의 법령을 컴퓨터가 이해 가능한 수준의 정보로 변환 되어 법령 지식 베이스로 활용 가능하다.

시멘틱 웹 기반의 비교구매 에이전트를 위한 동적 웹 온톨로지에 대한 연구 (A Study of Dynamic Web Ontology for Comparison-shopping Agent based on Semantic Web)

  • 김수경;안기홍
    • 지능정보연구
    • /
    • 제11권2호
    • /
    • pp.31-45
    • /
    • 2005
  • 본 논문에서는 전자상거래 상점별로 상이하게 정의되고 표현되어 있는 디지털 캠코더에 대한 HTML 페이지의 상품 정보를 래퍼(Wrapper)기술을 이용하여 획득하고 이를 RDF 문서 변환기를 통해 RDF 트리플(triple)과 RDF 문서로 변환하여 디지털 캠코더에 대한 메타데이터 스키마를 설계한다. 설계된 메타데이터 스키마를 기반으로 OWL 웹 온톨로지로 변환하고 이를 관계형 데이터베이스로 구현된 디지털 캠코더(DC: Digital Camcoder) 도메인 온톨로지 저장소(Domain Ontology Repository)에 DCC 지식 베이스 온톨로지 (DCCKBO: DCC Knowledge Based Ontology)로 저장한다. 다음 각 상점의 RDF 트리플과 문서를 DCCKBO와 비교, 매핑 그리고 추론 과정을 통해 최적의 상품 구매 정보를 가진 상점의 DCC 정보를 구매자에게 제공하고, DCCKBO에 저장되어 있는 도메인 온톨로지를 최적의 상품 구매 정보의 내용으로 재 정의하는 동적 웹 온톨로지를 제안하고자 한다.

  • PDF