• Title/Summary/Keyword: Ontology Extraction

Search Result 76, Processing Time 0.039 seconds

Automatic Extraction and Clustering of Concepts for Domain Ontology Construction (도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링)

  • Jung, Hyun-Ki;Kim, Yu-Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

Ontology-based Semantic Information Extraction Using An Advanced Content-based Image Retrieval (향상된 콘텐츠 기반 이미지 검색을 이용한 온톨로지 기반 의미적 정보 추출)

  • Shin, Dong-Wook;Jeon, Ho-Chul;Jeong, Chan-Back;Kim, Tae-Hwan;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.348-353
    • /
    • 2008
  • 이미지의 사용이 증가함에 따라 이미지 중 사용자가 원하는 이미지를 효율적으로 검색하기 위한 방법들이 연구되어 왔다. 본 논문에서는 질의 이미지를 분석하여 이미지 특징(feature)을 추출한 후 이미지 특징에 대한 유사도 평가를 통한 이미지 검색 및 온톨로지를 기반으로 검색된 이미지들과 유사하다고 판단된 이미지와 그러한 이미지들의 의미적 정보를 추출하는 방법을 제안한다. 제안된 시스템은 질의 이미지에서 색상, 질감, 모양 등의 특징을 추출하여 유사도 평가를 통해 검색된 이미지를 제공하고, 내용기반 이미지 검색 방식을 통해 이미지를 검색하고, 온톨로지를 이용해 이미지의 의미적 정보를 추출하여 사용자에게 이미지와 관련된 의미적 정보를 제공한다.

  • PDF

Automatic People Position Information Extraction for IT-People Event Ontology (온톨로지 인스턴스 생성을 위한 인물의 직위 정보 자동 추출)

  • Park, Yun-Hee;Lee, Young-Hwa;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.183-188
    • /
    • 2007
  • 온톨로지란 프로그램과 인간이 지식을 공유하는데 도움을 주기 위해 사용된 개념적 명세서로써 지식을 정형화하는 방법을 제시하여 추론의 기반을 제공하여 준다. 온톨로지 구축에 관한 기존 연구들은 스키마의 모델링에 초점을 두었다. 그러나 자료가 대용량화 됨에 따라 인스턴스를 자동으로 추출하는 기술은 온톨로지 구축에 꼭 필요하다. 이에 본 논문에서는 문서에서 인물의 직위 정보를 자동으로 추출하였으며, 문서 내에서 인물 상호 참조 처리를 통해 인물의 축약 명칭을 복원하였다. 또한 구 단위에서의 실패한 변동된 직위 정보는 중심 술어를 대상으로 격틀 정보를 완성해 나감으로써 확장한 결과 정확률 97.6%를 얻었다.

  • PDF

Term Extraction for Ontology Concept Recognition in Wikipedia (Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출)

  • Ko, Byeong-Kyu;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.344-347
    • /
    • 2010
  • 최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

Designing Schemes to Associate Basic Semantics Register with RDF/OWL (기본의미등록기의 RDF/OWL 연계방안에 관한 연구)

  • Oh, Sam-Gyun
    • Journal of the Korean Society for information Management
    • /
    • v.20 no.3
    • /
    • pp.241-259
    • /
    • 2003
  • The Basic Semantic Register(BSR) is and official ISO register designed for interoperability among eBusiness and EDI systems. The entities registered in the current BSR are not defined in a machine-understandable way, which renders automatic extraction of structural and relationship information from the register impossible. The purpose of this study is to offer a framework for designing an ontology that can provide semantic interoperability among BSR-based systems by defining data structures and relationships with RDF and OWL, similar meaning by the 'equivalentClass' construct in OWL, the hierachical relationships among classes by the 'subClassOf' construct in RDF schema, definition of any entities in BSR by the 'label' construct in RDF schema, specification of usage guidelines by the 'comment' construct in RDF schema, assignment of classes to BSU's by the 'domain' construct in RDF schema, specification of data types of BSU's by the 'range' construct in RDF schema. Hierarchical relationships among properties in BSR can be expressed using the 'subPropertyOf' in RDF schema. Progress in semantic interoperability can be expected among BSR-based systems through applications of semantic web technology suggested in this study.

An Algorithm for Referential Integrity Relations Extraction using Similarity Comparison of RDB (유사성 비교를 통한 RDB의 참조 무결성 관계 추출 알고리즘)

  • Kim, Jang-Won;Jeong, Dong-Won;Kim, Jin-Hyung;Baik, Doo-Kwon
    • Journal of the Korea Society for Simulation
    • /
    • v.15 no.3
    • /
    • pp.115-124
    • /
    • 2006
  • XML is rapidly becoming technologies for information exchange and representation. It causes many research issues such as semantic modeling methods, security, conversion far interoperability with other models, and so on. Especially, the most important issue for its practical application is how to achieve the interoperability between XML model and relational model. Until now, many suggestions have been proposed to achieve it. However several problems still remain. Most of all, the exiting methods do not consider implicit referential integrity relations, and it causes incorrect data delivery. One method to do this has been proposed with the restriction where one semantic is defined as only one same name in a given database. In real database world, this restriction cannot provide the application and extensibility. This paper proposes a noble conversion (RDB-to-XML) algorithm based on the similarity checking technique. The key point of our method is how to find implicit referential integrity relations between different field names presenting one same semantic. To resolve it, we define an enhanced implicity referentiai integrity relations extraction algorithm based on a widely used ontology, WordNet. The proposed conversion algorithm is more practical than the previous-similar approach.

  • PDF

Ontology - Based Intelligent Rule Components Extraction (온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구)

  • Kim U-Ju;Chae Sang-Yong;Park Sang-Eon
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.237-244
    • /
    • 2006
  • 시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

  • PDF

A Concept Extraction Method for Image Based on Human's Natural Abilities (인간의 생득적 능력에 기반한 이미지의 의미정보 추출방법)

  • Park, Hyung-Kun;Lee, Yill-Byung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.307-310
    • /
    • 2011
  • 최근 멀티미디어 데이터의 급속한 증가는 그를 대상으로 하는 다양한 컴퓨팅 기술의 발전을 가져왔다. 이러한 기술이 인간과의 상호 작용에서 그 양적 범위와 질적 깊이를 더해감에 따라, 멀티미디어 데이터 특히 그 중 가장 대표적이라 할 수 있는 이미지 데이터를 의미적으로 이해할 수 있는 방법의 필요성이 대두되고 있다. 이미지의 의미를 이해하기 위해 저수준(low level)의 시각 정보만을 이용하는 경우 인간과의 상호 작용에서 의미 격차(conceptual gap) 문제가 발생할 수 있다. 이미지 객체의 시각 정보들을 가공해서 온톨로지(ontology)와 같은 형태의 지식 베이스(knowledge base)와 연동하여 보다 고수준의 의미를 부여하는 경우에는 해당 도메인을 벗어난 새로운 환경에 대해 적응력과 강인함이 떨어진다. 이러한 문제를 근본적으로 해결하기 위해서는 지식 베이스가 없는 상태에서 이미지 데이터의 형태로 주어진 대상 객체로부터 의미를 부여할 수 있는 정보들을 추출해, 구조적으로 지식 베이스를 형성해 나가고 이를 토대로 대상 이미지 객체의 의미를 이해할 수 있는 시스템이 필요하다. 본 논문에서는 발달 심리학 이론들을 바탕으로 시각과 관련된 인간의 생득적 능력을 찾고, 이를 기반으로 우선 주어진 이미지 객체로부터 의미 정보를 효과적으로 추출할 수 있는 방법을 제안한다.

A Technique for Extracting GeoSemantic Knowledge from Micro-blog (마이크로 블로그기반의 공간 지식 추출 기법연구)

  • Ha, Su-Wook;Nam, Kwang-Woo;Ryu, Keun-Ho
    • Spatial Information Research
    • /
    • v.20 no.2
    • /
    • pp.129-136
    • /
    • 2012
  • Recently international organizations such as ISO/TC211, OGC, INSPIRE (Infrastructure for Spatial Information in Europe) make an effort to share geospatial data using semantic web technologies. In addition, smart phone and social networking services enable community-based opportunities for participants to share issues of a social phenomenon based on geographic area, and many researchers try to find a method of extracting issues from that. However, serviceable spatial ontologies are still insufficient at application level, and studies of spatial information extraction from SNS were focused on user's location finding or geocoding by text mining. Therefore, a study of extracting spatial phenomenon from social media information and converting it into geosemantic knowledge is very usable. In this paper, we propose a framework for extracting keywords from micro-blog, one of the social media services, finding their relationships using data mining technique, and converting it into spatiotemopral knowledge. The result of this study could be used for implementing a related system as a procedure and ontology model for constructing geoseem antic issue. And from this, it is expected to improve the effectiveness of finding, publishing and analysing spatial issues.

Design of Formalized message exchanging method using XMDR (XMDR을 이용한 정형화된 메시지 교환 기법 설계)

  • Hwang, Chi-Gon;Jung, Kye-Dong;Choi, Young-Keun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.6
    • /
    • pp.1087-1094
    • /
    • 2008
  • Recently, XML has been widely used as a standard for a data exchange, and there has emerged the tendency that the size of XML document becomes larger. The data transfer can cause problems due to the increase in traffic, especially when a massive data such as Data Warehouse is being collected and analyzed. Therefore, an XMDR wrapper can solve this problem since it analyzes the tree structures of XML Schema, regenerates XML Schema using the analyzed tree structures, and sends it to each station with an XMDR Query. XML documents which are returned as an outcome encode XML tags according to XML Schema, and send standardized messages. As the formalized XML documents decrease network traffic and comprise XML class information, they are efficient for extraction, conversion, and alignment of data. In addition, they are efficient for the conversion process through XSLT, too, as they have standardized forms. In this paper we profuse a method in which XML Schema and XMDR_Query sent to each station are generated through XMDR(extended Meta-Data Registry) and the generation of products and XML conversion occur in each station wrapper.