• 제목/요약/키워드: 온톨로지 추출

검색결과 200건 처리시간 0.024초

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

자질별 관계 패턴의 다변화를 통한 온톨로지 확장 (Incremental Enrichment of Ontologies through Feature-based Pattern Variations)

  • 이신목;장두성;신지애
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.365-374
    • /
    • 2008
  • 본 논문에서는 패턴의 다변화를 통하여 관계를 점진적으로 추출함으로써 온톨로지를 확장하는 모델을 제안한다. 패턴 다변화 과정에서 위키피디아로부터 추출한 관계 패턴 후보를 자질별로 다변화시킨다. 다변화된 패턴 후보로부터 말뭉치 빈도수에 따른 신뢰도를 이용하여 패턴을 선별한다. 선별된 패턴은 위키피디아로부터 관계를 추출하는 데 사용되며, 추출된 관계는 다시 관계 패턴 확장에 사용된다. 본 논문에서는 점진적 학습 과정에서의 패턴 다변화를 통하여 패턴 선택의 범위를 확장함으로써, 선택되는 패턴이 점진적으로 정제되는 모델을 제시한다. 이를 통하여, 관계의 확장성과 정확도를 향상시키고자 하였다. 단일 자질 패턴 모델에 대한 실험을 통하여, 어휘, 중심어, 상위어 정보는 신뢰도에, 품사, 구문 정보는 확장성에 유리하며, 구문 단위 유형별로 필요한 자질 유형이 다름을 관찰하였다. 이와 같은 특성에 기반하여 현재 연구 진행 중인복합 자질 패턴 모델을 제안한다.

형식개념분석기법 기반의 온톨로지 분석도구(OWL Analyzer)의 개발 (On developing OWL Analyzer based on Formal Concept Analysis)

  • 김동순;황석형;김홍기;양경모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.7-10
    • /
    • 2006
  • 온톨로지는 시멘틱 웹의 상호운용성에 있어서 가장 중요한 역할을 하고 있으며, 다양한 분야에서 지식의 공유 및 재사용을 목적으로 사용되고 있다. 현재 대부분의 온톨로지들은 도메인 전문가나 온톨로지 개발자들이 $Prot\acute{e}g\acute{e}$와 같은 도구를 사용하여 수작업으로 구축되어 지고 있다. 비록 전문가들이 $Prot\acute{e}g\acute{e}$와 같은 도구를 사용할지라도, OWL등과 같은 언어로 구축된 온톨로지가 실용적이고 도메인의 정보를 정확하게 반영하였음을 검증하는 것은 쉽지 않다. 따라서 본 연구에서는 형식개념분석기법(Formal Concept Analysis)을 사용하여, OWL로 구축된 온톨로지의 소스로부터 온톨로지의 주요 요소들을 추출, 분석하여 구조적 문제점을 파악 할 수 있는 OWL온톨로지 분석도구(OWL Analyzer)의 개발에 대하여 설명한다. 본 연구에서 개발된 OWL Analyzer를 사용함으로써, 구축된 온톨로지내에 포함된 오류를 수월하게 파악할 수 있고, 온톨로지 개발자에게 보다 좋은 개념계층구조를 갖는 온톨로지를 제안할 수 있다.

  • PDF

도메인지식의 계층화를 통한 온톨로지 인스턴스의 속성정보 추출 (An Extraction of Property of Ontology Instance Using Stratification of Domain Knowledge)

  • 장문수;강선미
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.291-296
    • /
    • 2007
  • 최근에 여러 분야에서 구축되고 있는 온톨로지는 기계가 이해할 수 있는 지식을 축적하는 것을 목표로 하고 있다. 기계가 온톨로지를 이용하여 정보의 관리 및 해석을 스스로 하는 것이 가능할 것으로 본다. 본 논문에서는 온톨로지의 인스턴스를 구성하는 속성을 기존 웹 문서의 구조정보로부터 추출하는 알고리즘을 제안하였다. 특히, 속성 정보로 구성하는 도메인 지식을 계층화함으로써 속성 추출 알고리즘을 개선하고, 추출 결과의 품질을 향상시킨다. 2만 문서를 대상으로 제안된 알고리즘을 적용한 결과 약 83%의 신뢰도의 속성 정보를 추출할 수 있었다.

온톨로지를 이용한 건축 도면데이터 레포지터리 구성 (Construction of Construction Drawing Data Repository using Ontology)

  • 이희재;유상봉;김인한
    • 한국전자거래학회지
    • /
    • 제9권3호
    • /
    • pp.79-94
    • /
    • 2004
  • W3C는 웹 어플리케이션의 온톨로지 활용을 위한 RDF 표준을 개발해 왔다. 이 논문은 도면 데이터의 온톨로지를 추출하고 적용한다. 설계 파일에 포함된 도면의 문서정보와 관리 정보를 주 예로 삼는다. 도면 데이터의 관계를 분석함으로써 RDF 스키마를 먼저 디자인 한다. 스키마를 기반으로 온톨로지가 추출되어 XML 파일로 저장이 된다. 온톨로지 저장을 위한 어플리케이션으로서 재구성 가능한 도면 데이터 레포지터리를 구성할 수 있다. 이 논문의 예제로 사용자는 관심을 항목의 뷰를 선택할 수 있다 (예를 들어. 프로젝트, 도면, 또는 디자이너). 도면 데이터의 다양한 관점으로 사용자는 특정 데이터에 보다 효율적으로 접근 할 수 있다.

  • PDF

EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링 (Verb Clustering for Defining Relations between Ontology Classes of Technical Terms Using EM Algorithm)

  • 김미훈;남상협;이용훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.233-240
    • /
    • 2007
  • 온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.

  • PDF

ERB 필터를 이용한 시맨틱 온톨로지 음성 인식 성능 향상 (Semantic Ontology Speech Recognition Performance Improvement using ERB Filter)

  • 이종섭
    • 디지털융복합연구
    • /
    • 제12권10호
    • /
    • pp.265-270
    • /
    • 2014
  • 기존의 음성 인식 알고리즘은 어휘들 간의 순서가 정해져 있지 않으며, 음성 인식 환경 변화에 따른 잡음으로 인한 음성 검출이 정확하지 못한 단점을 가지며, 검색 시스템은 키워드의 의미가 다양하여 정확한 정보를 인지하지 못한다. 본 연구에서는 사건 기반 시맨틱 온톨로지 추론 모델을 제안하였으며, 제안된 시스템에서 음성 인식 특징을 추출하기 위해 ERB 필터를 이용하여 특징 추출하는 모델을 구축하였다. 제안된 모델은 성능 평가를 위해 지하철역, 지하철 잡음을 사용하였고 잡음 환경의 SNR -10dB, -5dB 신호에서 잡음 제거를 수행하여 왜곡도를 측정한 결과 2.17dB, 1.31dB의 성능이 향상됨을 확인하였다.

비모수적 상관계수를 이용한 시맨틱 온톨로지 음성 정보 추출 (Semantic Ontology Speech Information Extraction using Non-parametric Correlation Coefficient)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.147-151
    • /
    • 2013
  • 질의 키워드의 출현 빈도수가 높은 문서를 검색하면 키워드의 의미가 다양하여 정확한 정보를 인지하지 못하며, 기존 검색 시스템의 온톨로지 구성만으로는 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가진다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인사관리에서 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 이들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 시스템을 제안한다. 또한, 이를 기반으로 비모수적 상관 계수를 이용하여 음성 정보를 추출하는 방법을 사용하여 평균 SNR이 0.752dB 감소됨을 보임으로써 제안한 방법의 우수성을 확인하였다.

온톨로지 학습을 이용한 쿨벤더의 미래유망기술 키워드 추출 (Extracting keyword of emerging technology using ontology learning in cool vendor)

  • 이태균;신건철;김수경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.75-76
    • /
    • 2016
  • 최근 많은 기업 중에서 가트너는 매년 미래유망기술과 쿨벤더를 발표한다. 우리는 쿨벤더에서 제공하는 여러 정보들을 분석하여 미래유망기술에 대한 키워드를 찾고 이것을 실제 기술명과 연관짓고자 한다. 이 모든 과정의 전체적인 그림이 온톨로지 모델에 담긴다. 이 연구는 향후 어떤 집단의 미래를 이끌어갈 핵심 기술을 찾고자 하는 결정권자들에게 도움이 될 것이다.

  • PDF

OWL 온톨로지 파서와 추론 시스템 설계 및 구현

  • 황명권;공현장;김판구
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.290-294
    • /
    • 2005
  • 의미적인 정보검색을 위한 시맨틱 웹에 대한 연구가 본격화되었다. 시맨틱 웹을 위한 핵심은 개념과 개념들 사이의 관계를 정의한 온톨로지이다. 온톨로지를 분석하고, 분석된 결과에 포함되어 있는 새로운 사실들을 추론하여 가능한 많은 결과를 이끌어 내는 것이 의미적인 정보검색의 기반이라 할 수 있다. 본 논문은 이러한 온톨로지에 정의된 개념들을 분석하는 범용적이고 빠른 파서와 파서를 통해 분석된 사실을 바탕으로 더욱 많은 새로운 사실을 추출할 수 있는 온톨로지 기반의 추론(Inference) 시스템을 설계하고 구현하였다.

  • PDF