• 제목/요약/키워드: Ontology Extraction

검색결과 76건 처리시간 0.022초

도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링 (Automatic Extraction and Clustering of Concepts for Domain Ontology Construction)

  • 정현기;김유섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

향상된 콘텐츠 기반 이미지 검색을 이용한 온톨로지 기반 의미적 정보 추출 (Ontology-based Semantic Information Extraction Using An Advanced Content-based Image Retrieval)

  • 신동욱;전호철;정찬백;김태환;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.348-353
    • /
    • 2008
  • 이미지의 사용이 증가함에 따라 이미지 중 사용자가 원하는 이미지를 효율적으로 검색하기 위한 방법들이 연구되어 왔다. 본 논문에서는 질의 이미지를 분석하여 이미지 특징(feature)을 추출한 후 이미지 특징에 대한 유사도 평가를 통한 이미지 검색 및 온톨로지를 기반으로 검색된 이미지들과 유사하다고 판단된 이미지와 그러한 이미지들의 의미적 정보를 추출하는 방법을 제안한다. 제안된 시스템은 질의 이미지에서 색상, 질감, 모양 등의 특징을 추출하여 유사도 평가를 통해 검색된 이미지를 제공하고, 내용기반 이미지 검색 방식을 통해 이미지를 검색하고, 온톨로지를 이용해 이미지의 의미적 정보를 추출하여 사용자에게 이미지와 관련된 의미적 정보를 제공한다.

  • PDF

온톨로지 인스턴스 생성을 위한 인물의 직위 정보 자동 추출 (Automatic People Position Information Extraction for IT-People Event Ontology)

  • 박윤희;이영화;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-188
    • /
    • 2007
  • 온톨로지란 프로그램과 인간이 지식을 공유하는데 도움을 주기 위해 사용된 개념적 명세서로써 지식을 정형화하는 방법을 제시하여 추론의 기반을 제공하여 준다. 온톨로지 구축에 관한 기존 연구들은 스키마의 모델링에 초점을 두었다. 그러나 자료가 대용량화 됨에 따라 인스턴스를 자동으로 추출하는 기술은 온톨로지 구축에 꼭 필요하다. 이에 본 논문에서는 문서에서 인물의 직위 정보를 자동으로 추출하였으며, 문서 내에서 인물 상호 참조 처리를 통해 인물의 축약 명칭을 복원하였다. 또한 구 단위에서의 실패한 변동된 직위 정보는 중심 술어를 대상으로 격틀 정보를 완성해 나감으로써 확장한 결과 정확률 97.6%를 얻었다.

  • PDF

Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출 (Term Extraction for Ontology Concept Recognition in Wikipedia)

  • 고병규;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.344-347
    • /
    • 2010
  • 최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

기본의미등록기의 RDF/OWL 연계방안에 관한 연구 (Designing Schemes to Associate Basic Semantics Register with RDF/OWL)

  • 오삼균
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.241-259
    • /
    • 2003
  • 기본의미등록기(BSR)는 전자상거래 및 EDI 관련 시스템 사이의 상호연동을 가능하게 하기 위한 등록기이다. XML 기반 BSR 등록개체들의 구조정보나 다양한 관계의 자동추출은 현재 불가능하다. 이 연구에서는 BSR에 등록되는 정보를 자원기술-프레임웍(RDF)과 웹온톨로지언어(OWL)에 기반하는 기계가독형으로 정의한 대표적인 예를 제시하고 결론적으로 5개의 기본 권고안을 도출하였다. 즉 BSR 컴포넌트 소속의 클래스 정의에서 동의어의 표현에는 OWL의 'sameAs', 유사어 표현에는 OWL의 'equivalenlClass', BSR 개념들 간의 상.하 관계 표현은 RDF 스키마의 'subClassOF', BSR의 의미단위(BSU)에 관한 정의는 RDF 스키마의 'label', 인스턴스 용례에 관한 설명은 RDF 스키마의 'comment', 각 BSU의 클래스 소속에 관한 정의는 RDF 스키마의 'domain', BSU가 취할 수 있는 데이터유형에 대한 정의는 RDF 스키마의 'range'등을 적용하며, 나아가 BSR 데이터요소의 정의에 XML 스키마의 데이터 유형을 접목시키고 BSU들 간의 상.하 관계 표현에 RDF 스키마의 'subPropertyOF'를 적용할 것을 추천하였다.

유사성 비교를 통한 RDB의 참조 무결성 관계 추출 알고리즘 (An Algorithm for Referential Integrity Relations Extraction using Similarity Comparison of RDB)

  • 김장원;정동원;김진형;백두권
    • 한국시뮬레이션학회논문지
    • /
    • 제15권3호
    • /
    • pp.115-124
    • /
    • 2006
  • XML은 정보 교환과 표현을 위해 빠르게 발전해 오고 있는 기술이다. XML을 통한 시멘틱 모델링 방법론, 보안, 다른 모델들과의 상호 운용성을 위한 변환과 같은 많은 연구들이 이슈화 되었다. 특히, 실질적인 응용분야의 가장 중요한 이슈는 XML 모델과 관계형 모델들과의 상호 운용성을 위해 많은 방법들에 제기되어 왔다. 하지만, 여전히 몇 가지 문제점이 있다. 대부분의 기존의 방법들은 묵시적인 참조 무결성 관계를 고려하지 않기 때문에, 부정확한 데이터 전달이 야기된다. 데이터베이스에서 하나의 의미가 정의 될 때 오직 하나의 이름만 가진다는 제약조건하에서 위의 문제를 해결하기 위한 한 가지 방법이 제안되었다. 하지만, 실제 데이터베이스에서 응용과 확장을 위해서 이 제약사항을 적용할 수는 없다. 그래서 이 논문에서는 유사성 검사 기법을 기반하는 한 RDB-to-XML 변환 알고리즘을 제안한다. 이 방법의 핵심은 하나의 같은 의미에 대해 다른 이름으로 표현되는 속성들 간의 묵시적인 참조 무결성 관계를 추출하는 알고리즘을 정의하였다. 제안된 변환 알고리즘은 이전의 유사한 접근 방법 보다 더욱 실질적이다.

  • PDF

온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구 (Ontology - Based Intelligent Rule Components Extraction)

  • 김우주;채상용;박상언
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.237-244
    • /
    • 2006
  • 시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

  • PDF

인간의 생득적 능력에 기반한 이미지의 의미정보 추출방법 (A Concept Extraction Method for Image Based on Human's Natural Abilities)

  • 박형근;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.307-310
    • /
    • 2011
  • 최근 멀티미디어 데이터의 급속한 증가는 그를 대상으로 하는 다양한 컴퓨팅 기술의 발전을 가져왔다. 이러한 기술이 인간과의 상호 작용에서 그 양적 범위와 질적 깊이를 더해감에 따라, 멀티미디어 데이터 특히 그 중 가장 대표적이라 할 수 있는 이미지 데이터를 의미적으로 이해할 수 있는 방법의 필요성이 대두되고 있다. 이미지의 의미를 이해하기 위해 저수준(low level)의 시각 정보만을 이용하는 경우 인간과의 상호 작용에서 의미 격차(conceptual gap) 문제가 발생할 수 있다. 이미지 객체의 시각 정보들을 가공해서 온톨로지(ontology)와 같은 형태의 지식 베이스(knowledge base)와 연동하여 보다 고수준의 의미를 부여하는 경우에는 해당 도메인을 벗어난 새로운 환경에 대해 적응력과 강인함이 떨어진다. 이러한 문제를 근본적으로 해결하기 위해서는 지식 베이스가 없는 상태에서 이미지 데이터의 형태로 주어진 대상 객체로부터 의미를 부여할 수 있는 정보들을 추출해, 구조적으로 지식 베이스를 형성해 나가고 이를 토대로 대상 이미지 객체의 의미를 이해할 수 있는 시스템이 필요하다. 본 논문에서는 발달 심리학 이론들을 바탕으로 시각과 관련된 인간의 생득적 능력을 찾고, 이를 기반으로 우선 주어진 이미지 객체로부터 의미 정보를 효과적으로 추출할 수 있는 방법을 제안한다.

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

XMDR을 이용한 정형화된 메시지 교환 기법 설계 (Design of Formalized message exchanging method using XMDR)

  • 황치곤;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1087-1094
    • /
    • 2008
  • 최근 들어 XML은 데이터 교환을 위한 표준으로 널리 사용되고 있으며, XML 문서의 크기가 커지는 경향이 나타나고 있다. 특히, 데이터 웨어하우스와 같이 대량의 데이터를 수집하여 분석하는 경우 데이터 이동은 트래픽의 증가로 인해 문제점이 발생할 수 있다. 따라서 이러한 문제를 해결하기 위해 XMDR 래퍼는 XML Schema의 트리 구조를 분석하고, 분석된 트리 구조를 통해 XML Schema를 재생성하여 XMDR_Query와 함께 각 스테이션에 전송한다. 결과로 반환되는 XML 문서는 XML Schema에 따라 XML 태그를 코드화하여 정형화된 메시지를 전달한다. 정형화된 XML 문서는 네트워크의 트래픽을 감소시키고, XML 계층정보를 포함하고 있어 데이터 추출, 변환 및 정렬에 효율적 이라는 장점을 가진다. 뿐만 아니라 정형화된 형식 이므로 XSLT를 통한 변환과정에서도 효율적이다. 각 스테이션에 전송되는 XML Schema와 XMDR_Query는 XMDR(eXtended Meta-Data Registry)을 통해 생성하고, 각 스테이션의 래퍼에서 결과 생성 및 XML 변환이 이루어지도록 하는 방법을 제안한다.