• 제목/요약/키워드: 온톨로지 추출

검색결과 200건 처리시간 0.025초

도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링 (Automatic Extraction and Clustering of Concepts for Domain Ontology Construction)

  • 정현기;김유섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출 (Term Extraction for Ontology Concept Recognition in Wikipedia)

  • 고병규;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.344-347
    • /
    • 2010
  • 최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

도메인 모델을 이용한 온톨로지 모델로부터 시스템 모델 생성 (An System Model Construction from the Ontology Model Using the Domain Model)

  • 남숭환;임재현;김치수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.237-240
    • /
    • 2007
  • 지식을 재사용하는 온톨로지 모델은 재사용 수준을 높여줄 수 있는 지식 모델이라 할 수 있다. 본 논문에서는 소프트웨어의 재사용 보다 지식을 재사용하기 위해 개발프로세스에서 지식과 소프트웨어모델 사이에 관련성 있는 매핑을 만들고자 한다. 또한 UML을 온톨로지 모델 언어로 사용하여 UML 기반 온톨로지 모델로부터 시스템 모델을 추출하기위해 온톨로지 도메인 시스템 방법을 제안한다.

  • PDF

폭소노미에서 위치태그 분석을 통한 공간관계 추출 기법 (Extraction method of spatial relation by analyzing location tag in folksonomy)

  • 최윤희;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1043-1054
    • /
    • 2009
  • 최근 시맨틱 웹에 대한 관심과 필요성이 높아지면서 시맨틱 웹의 핵심기술인 온톨로지 역시 다양한 분야에서 많은 연구가 진행되고 있다. 온톨로지는 웹 2.0환경에서 널리 인용되는 폭소노미의 문제들을 해결하기 위한 대안이 되고 있다. 이에 본 연구에서는 웹 2.0 환경의 폭소노미 기술이 가지는 단점을 보완하고자 폭소노미 기반의 데이터를 온톨로지로 변환해주는 위치 정보 온톨로지 자동 구축 시스템을 제안한다. 제안된 기법은 폭소노미 기반 웹 서비스인 Flickr에 온톨로지 기술을 적용하여 Flickr의 이미지 데이터들과 이들의 메타데이터인 태그들로부터 위치정보 태그와 공간 관계를 추출하고 OWL형태의 온톨로지로 자동 구축한다. 위치정보 태그와 의미적 공간 관계를 분석하고 추출하기 위해 여러 웹 서비스에서 제공하는 공개질의정보 API(이하 openAPI)를 사용하였다. 따라서 본 연구에서 구현한 시스템은 폭소노미 데이터를 온톨로지의 의미적인 정보로 연결해 줌으로써 개념적인 관계를 보완하고 더욱 정확한 검색결과를 제공 할 수 있도록 한다.

  • PDF

텍스트 내용 지식 기반의 철학 온톨로지 구축 (Implementation a Philosophy Ontology based on Knowledge of Text Contents)

  • 김정민;최병일;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.275-283
    • /
    • 2005
  • 시맨틱 웹이나 지식기반 시스템에서 지식 검색의 핵심 컴포넌트는 온톨로지이다. 하지만 현재 실용적인 온톨로지가 구축된 경우를 찾아보기는 어렴다. 실용적인 온톨로지 구축을 위해서는 특정 도메인의 지식 전문가에 의한 지식의 개념화와 온톨로지 설계자에 의한 지식의 명세화가 필요하며 이를 바탕으로 개발 팀원들 사이에 공유할 수 있는 자세한 온톨로지 생성 가이드라인이 필요하다. 그러나 기존의 온톨로지 생성 방법론은 은톨로지 구축 프로세스의 단계들을 상위 수준에서 나열하는 절차 중심의 방법론이다 본 논문에서는 철학 학문의 지식을 구조화하는 실용적인 온톨로지를 구축하는 방법으로서 텍스트 내용에 들어있는 지식을 온톨로지로 생성하는 토픽맵 기반의 덱스트 온톨로지 방법론을 제시하였다. 이 방법론은 지식 자원으로부터 지식을 분석하고 추출하는 온톨로지 모델링 단계와 형식 언어와 데이타 모델을 이용하여 온톨로지를 생성하는 온톨로지 구현 단계로 구성된다. 방법론과 함께 본 논문에서는 철학 온톨로지에 기반한 철학 지식 검색의 효율성을 보이기 위해 철학 지식 포털을 구현하였다.

대규모 범죄 수사 기록을 활용한 온톨로지 기반 분석 서비스 구현 (Implementation of Ontology-based Analytics Service by Exploiting Massive Crime Investigation Records)

  • 고건우;김선우;박성진;노윤주;최성필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.477-481
    • /
    • 2018
  • 본 논문은 범죄 수사 기록 문서로부터 추출한 정보를 트리플로 구성하여 특정 분야의 온톨로지를 구축하고, 더 나아가 온톨로지 기반의 검색 서비스를 구현하는 일련의 과정을 설명한다. 특히 비정형 데이터로 부터 얻어낸 정보를 통해 온톨로지를 구축하고, 이를 토대로 실제 사용할 수 있는 레벨의 서비스를 구현하는 것이 특징이다. 서비스의 성능을 확인하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정 실험을 수행하였으며, 실험 결과 완전 일치 실험에서는 약 93.52%, 유사 필드 활용 실험에서는 약 88.91%의 결과를 얻어낼 수 있었다.

  • PDF

프레임넷을 통한 디비피디아 온톨로지 인스턴스 생성의 커버리지 개선 (DBpedia Ontology Population Coverage Enhancement with FrameNet)

  • 함영균;서지우;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.32-37
    • /
    • 2014
  • 비구조 텍스트로부터 지식을 추출하여 온톨로지 기반 지식베이스를 구축하는 연구가 최근 국내외로 다양하게 진행되고 있다. 이러한 목적을 달성하기 위해서는 자연어 텍스트에서 나타난 지식요소들의 다양한 속성들을 표현할 수 있는 온톨로지를 필요로 한다. 디비피디아 역시 위키피디아의 지식들을 표현하기 위하여 디비피디아 온톨로지를 사용한다. 그러나 디비피디아 온톨로지는 위키피디아의 인포박스에 기반한 온톨로지로서, 요약된 정보를 설명하기에는 적합할 수 있으나 자연어 텍스트로 표현된 다양한 지식표현을 충분히 커버하는 것은 보증되지 않는다. 본 논문에서는 자연어 텍스트로 쓰여진 지식을 디비피디아 온톨로지가 충분히 표현할 수 있는지를 검토하고, 또한 그 불완전성을 프레임넷이 어느정도까지 보완할 수 있는지를 살핀다. 이를 통해 한국어 텍스트로부터 지식베이스를 자동구축하는 온톨로지 인스턴스 자동생성 연구의 방향으로서 디비피디아 온톨로지와 프레임넷의 효용성을 전망한다.

  • PDF

내용기반 문서분류 전문가시스템을 위한 온톨로지 연구 (An Ontology for a Content-Based Expert System Document Categorization)

  • 서래원
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.47-56
    • /
    • 1998
  • 본 논문은 내용기반 문서분류 전문가시스템 개발을 위한 온톨로지 개념 도입과 구축에 관한 연구이다. 전문가시스템 개발에 있어서 온톨로지가 미치는 영향에 대해 알아보고, 온톨로지 개념을 정립하고자 한다. 정립된 온톨로지의 개념에 입각하여 특정 영역인 미술 분야에 있어서 내용기반 문서분류 전문가시스템 개발 시 필요한 개념소를 추출하며 온톨로지 계통도를 제시한다.

  • PDF

온톨로지 기반 지식검색 시스템의 시맨틱 서비스 (Semantic Service in Ontology-based Knowledge Search System)

  • 홍광희;박제현;박주영;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.383-387
    • /
    • 2006
  • 본 논문은 시맨틱 웹의 온톨로지 기술을 이용하여 온톨로지 기반 시맨틱 검색 시스템과 서비스 시스템에 대한 구현을 위하여 문헌 정보를 대상으로 온톨로지를 OWL로 구성하였다. 여기에서 제안한 시스템은 효율적인 관리가 가능하도록 웹(Web) 환경에서 구현하였으며, 데이터의 의미와 구문 및 구조의 통일을 위해 메타데이터의 상호운용성을 고려하며 기술언어로는 XML를 사용한다. 웹 문서에서 특정정보를 추출하고 RDF 메타데이터를 생성하며, 웹 문서의 내용을 정확하게 분류하기 위해 온톨로지(Ontology)를 기반으로 한 지식검색 시스템의 시맨틱 서비스시스템을 제안한다.

  • PDF

이형 온톨로지 언어의 속성 및 계층구조 매핑 (Mapping of Characteristics and Hierarchy between Heterogeneous Ontology Languages)

  • 홍현술
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.131-136
    • /
    • 2007
  • 토픽맵은 RDF에 기반을 둔 OWL과 많은 유사점을 갖지만, 양자는 역사적, 기술적, 의도하는 목적에서 차이가 있다. 토픽맵은 ISO 표준이지만, OWL은 W3C의 온톨로지 개발 표준언어로서 양자는 각각의 제약언어, 데이터 모델, 그리고 일련의 구문들을 별개로 갖는다. 그러나 토픽맵과 OWL 양자는 지식을 표현하는 온톨로지 언어라는 공통적 특성을 가지며, 술어로직에 기반을 두고 있고, XML포맷이기 때문에 상호간에 매핑이 가능하다. 논문의 목적은 토픽맵과 OWL의 메타모델로부터 온톨로지 정보자원의 공유, 교환, 통합에 접근시킨다. 따라서 각각의 메타모델에서 주요 요소를 추출하고, 이들의 의미적인 측면과 구조적인 측면의 요소들의 손실이 발생되지 않도록 매핑을 수행한다.

  • PDF