• 제목/요약/키워드: 온톨로지 추출

검색결과 200건 처리시간 0.029초

온톨로지 자동추출도구의 기능적 성능 평가를 위한 평가지표의 개발 및 적용 (Measurement Criteria for Ontology Extraction Tools)

  • 박진수;조원진;노상규
    • 지능정보연구
    • /
    • 제14권4호
    • /
    • pp.69-87
    • /
    • 2008
  • 이제 인터넷은 시맨틱 웹(Semantic Web)의 형태로 진화 발전하고 있다. 그 결과 시맨틱 웹의 지식을 표현하는 백본 인 온톨로지가 매우 중요하게 인식되고 있다. 그러나 온톨로지를 구축하는 것은 많은 시간과 자원을 필요로 하는 작업이다. 이로 인해 온톨로지 추출도구(ontology extraction tool)에 대한 개발의 필요성이 지난 십여 년간 제기되어 왔으며, 온톨로지를 자동으로 추출하거나 온톨로지 구축을 돕는 도구들이 개발되었다. 그러나 여러 온톨로지 자동추출도구들 중에 구축하고자 하는 온톨로지의 사용자 요구사항에 적합한 자동추출도구를 선택하기 위해서는 이런 도구들에 대한 평가지표가 필요하다. 하지만, 현재 이런 도구들을 평가하기 위한 포괄적인 평가 프레임워크(comprehensive evaluation framework)가 존재하지 않는다. 본 연구에서는, 문헌연구를 수행하여 온톨로지 자동추출도구가 갖춰야 할 핵심 요소들을 찾고, 온톨로지 추출도구들을 평가하기 위한 일련의 평가지표들을 개발했다. 또한 본 연구에서 제안하는 평가지표에 따라 온톨로지 자동추출도구인 OntoLT, Text-To-Onto, TERMINAE, OntoBuilder를 평가해 보았다.

  • PDF

6단계 상향식 방법에 의한 국방 온톨로지 추출 (Extraction of Military Ontology Using Six-Step Bottom-up Approach)

  • 나민영;양경용
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.17-26
    • /
    • 2009
  • 국방 분야에서 기존에 구축된 정보시스템은 대부분 대용량의 정보처리 등 단순한 정보처리 중심이었기 때문에 정보의 지적인 수행 능력이나 지식의 표현기술에 대한 능력은 부족한 실정이다. 따라서 기존의 국방정보시스템이 효율적 정보검색 및 관리를 가능케 하는 지능형 국방정보시스템으로 변화되기 위해서는 지식 구축의 핵심이 되는 국방 온톨로지 구축이 필수적이다. 본 논문에서는 6단계 상향식 방법을 이용한 온톨로지 추출 방안을 기술하고, 이를 국방교육훈련 분야에 적용하여 국방 온톨로지 프로토타입을 추출한 후 대표적인 온톨로지 개발 툴인 $Prot\acute{e}g\acute{e}$를 이용하여 구현하였다.

온톨로지 파싱 속도향상을 위한 온톨로지 파서 설계 (Ontology Parser Design for Speed Improvement of Ontology Parsing)

  • 김원필;공현장
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.96-101
    • /
    • 2010
  • 시맨틱 웹에서 핵심 연구는 온톨로지 파싱의 효율성이다. 온톨로지의 효율적 파싱과 추론은 시맨틱 웹의 궁극적인 목적인 의미적인 정보검색의 기반이 된다. 그러나 기존의 온톨로지 저작도구들은 온톨로지 파싱속도에 있어 효율적이지 못하고 있는 실정이다. 따라서, 본 연구에서는 온톨로지가 기술하는 모든 사실을 빠르게 추출하기 위해 2단계에 걸친 온톨로지 파서를 설계 하였다. 정확하고 빠른 파서의 설계를 위해 토큰 추출기에서 온톨로지의 구문의 토큰을 1단계로 추출하고, 이를 바탕으로 트리플 추출기에서 Statement를 추출한다. 이에 본 연구에서 설계한 파서의 속도는 기존의 도구들의 파서보다 빠른 처리가 이루어 짐을 확인할 수 있었다.

뉴로-심볼릭 구조 기반 온톨로지 생성기 제안 (Developing the Deep Text-to-Ontology Generator based on Neuro-Symbolic Architecture)

  • 박형철;윤은수;김민정;배희재;신유진;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.672-674
    • /
    • 2023
  • 본 논문은 뉴로-심볼릭 구조를 바탕으로 일반 텍스트로부터 온톨로지 생성이 가능한 심층 신경망 기반 온톨로지 추출기를 제안한다. 온톨로지 추출 단계를 (i) 온톨로지 학습 및 (ii) 온톨로지 생성의 2 단계로 상정, (i) 일반 텍스트로부터 문장 구조 및 논리적 관계를 학습하는 트랜스포머 기반 심층 생성 신경망 출력을 이용하여 (ii) 계층적으로 결합한 심볼릭 추론기로 온톨로지를 생성하는 뉴로-심볼릭 구조 온톨로지 추출기를 구현하였다. 1800 개 훈련 집합으로 학습 후 200 개 테스트 집합으로 평가한 결과, 정확도 91.9%, Precision 100%, Recall 99.1%로 비교 모델 OpenIE 의 성능에 비해서 각각 83.8%, 1.8%, 3.5% 개선된 것을 확인하였다. 정성적 품질에 있어서, 복잡한 문장 (예: 관계대명사, 접속사, 중첩 구조)에서도 비교 모델에 비해 더 정밀한 온톨로지 생성 결과를 보였다.

온톨로지 통합기반의 상위 온톨로지 추출에 관한 연구 (A Study on Upper Ontology Extraction Based on Ontology Integration)

  • 이지윤;양진혁;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.481-484
    • /
    • 2005
  • 같은 도메인 내에 서로 다른 관점을 다루고 중복되는 정보를 포함하는 온톨로지들이 증가함에 따라서, 이들 사이에 재사용 및 공유를 위한 통합이 중요한 과제로 떠오르게 되었다. 또한 도메인 온톨로지로부터 상위 온톨로지를 추출하는 방법에 관한 연구도 온톨로지의 재사용과 공유를 목적으로 진행되고 있다. 본 논문에서 우리는 맵핑을 이용한 온톨로지 통합을 바탕으로 상위 온톨로지 생성 방법을 제안하고, 이를 정형화된 형태의 일반적인 목적을 가지는 온톨로지(general-purpose ontology)로 확장시켜 나가는 방안에 대해 살펴본다. 본 논문에서 제안된 온톨로지들 사이의 매핑은 개념들 간의 관계를 효율적으로 만들고, 해당 도메인에 대한 일반화된 온톨로지는 추후 사용자들의 공유를 용이하게 한다.

  • PDF

시드를 이용한 도메인 관련 복합어 추출 기법 (Extracting Domain Related Multi-word Terms using Seeds)

  • 조성원;최종필;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.166-168
    • /
    • 2004
  • 복합어 추출 기법은 최근 활발한 연구가 진행되고 있는 온톨로지 구축과 정보 검색에 중요한 기법으로 연구되어 왔다. 초기의 연구는 주로 언어학적인 필터 기법이나 통계적 기법을 사용하였지만, 최근 문맥정보와 의미 사전 등을 이용하여 용어를 추출하는 방법으로 발전해 오고 있다. 또한 정보검색 분야와 온톨로지 분야에서도 모든 용어를 추출하는 방법보다 문서 집합의 도메인에 적합하다고 판단되는 용어들을 추출하는 방법이 그 성능을 향상시킬 수 있다. 본 논문에서는 통계학적 방법을 이용하여 도메인에 적합한 시드 용어의 추출을 하고, 그 시드 용어를 이용해 가중치를 정제하는 방법과 시드 용어로부터 관련된 용어를 추출해 나가는 방법을 적용하여 문서 집합의 도메인에 맞는 용어들을 추출하고자 한다.

  • PDF

온톨로지 디버깅을 위한 MEXS 추출 및 저장 기법 (MEXS Extracting and Storing for Ontology Debugging)

  • 김제민;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.366-373
    • /
    • 2008
  • 현재 온톨로지를 구축하는데 있어 OWL을 온톨로지 표현 언어로 많이 사용하는 추세이다. OWL 온톨로지의 내제된 정보(클래스간의 계층구조, 인스턴스의 정확한 타입)를 추론하기 위해, 현재 많은 온톨로지 추론엔진이 개발되어지고 있다. 그러나 대부분의 온톨로지 추론 엔진들은 단순히 추론 결과만 명시할 뿐, 그 과정을 표현하지는 않는다. 따라서 본 논문에서는 논리적으로 정당하지 못한 은톨로지를 디버깅 하기위한 MEXS(Minimum Expression Axiom Set) 추출과 저장에 대한 기법을 제안한다. MEXS를 추출하기 위해서는 온톨로지 내에서 논리적인 오류를 유발하는 Axiom들을 찾아내는 방법은 매우 중요하다고 할 수 있다. 이에 본 논문은 두 가지 부분에 초점을 맞추어 연구를 진행하였다. 첫 번째, 논리적으로 정당하지 못한 온톨로지가 주어졌을 때, 논리적 오류를 유발하는 핵심 Axiom을 찾아내고, 이와 연관이 되는 Axiom들을 찾아낸다. 두 번째, 논리적으로 정당하지 못한 온톨로지를 디버깅하기 위한 MEXS를 구성한다. 본 연구 결과는 서술 논리에 기반을 둔 모든 어플리케이션에 적용이 가능하다.

온톨로지 기반 친족관계 추출 방법 (A Method on Relative Relation Extraction based on Ontology)

  • 황명권;최동진;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.289-290
    • /
    • 2009
  • 시맨틱 웹의 발전과 더불어 소셜 네트워크 자동 구축에 대한 연구가 활발히 진행되고 있다. 본 논문은 온톨로지를 기반의 소셜 정보 추출에 대한 방법을 다루고 있으며, 특히, 이에 필요한 온톨로지 모델링, 사람들 사이의 관계 추출을 위한 패턴 정의에 대해 기술하고 있다. 온톨로지와 패턴을 기반으로 역사적 인물들의 친족관계를 파악함으로써 소설 정보의 추출에 대한 가능성을 미리 짐작해 본다.

온톨로지 인스턴스 구축을 위한 주제 중심 웹문서 수집에 관한 연구 (A Study on Focused Crawling of Web Document for Building of Ontology Instances)

  • 장문수
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.86-93
    • /
    • 2008
  • 복잡한 의미관계를 정의하는 온톨로지를 구축하는 일은 매우 정밀하고 전문적인 작업이다. 잘 구축된 온톨로지를 응용 시스템에 활용하기 위해서는 온톨로지 클래스에 대한 많은 인스턴스 정보를 구축해야 한다. 본 논문은 온톨로지 인스턴스 정보 추출을 위하여 방대한 양의 웹 문서로부터 주어진 주제에 적합한 문서만을 추출하는 주제 중심 웹 문서 수집 알고리즘을 제안하고, 이 알고리즘을 바탕으로 문서 수집 시스템을 개발한다. 제안하는 문서 수집 알고리즘은 URL의 패턴을 이용하여 주제에 적합한 링크만을 추출함으로써 빠른 속도의 문서 수집을 가능하게 한다. 또한 링크 블록 텍스트에 대한 퍼지집합으로 표현된 주제 적합도는 문서의 주제 관련성을 지능적으로 판단하여 주제 중심 문서 수집의 정확도를 향상시킨다.

온톨로지 기반 개인 미디어 메타데이터 자동 생성 (Ontology-based Metadata Automated Generation for Personal Media)

  • 최정화;서희철;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.340-345
    • /
    • 2006
  • 개인 디지털 콘텐츠 증가에 따른 개인 미디어의 관리를 위해 대량의 메타데이터를 자동으로 생성하는 연구가 반드시 필요하다. 본 논문에서는 온톨로지 기반의 추론을 이용하여 개인 미디어 메타데이터를 자동으로 생성하는 방법을 제안한다. 제안한 방법은 부족한 정보로부터 적합한 의미를 추출하여 메타데이터를 자동 생성하므로 콘텐츠관리의 어려운 문제점을 해결한다. 본 논문에서 제안하는 방법을 사용자가 메모를 부착하기만 하면, 온톨로지 기반 추론을 통해 메타데이터를 자동 생성하는 방법으로 다음과 같은 세가지 기술과 특징을 갖는다. 첫째, 개인 미디어 온톨로지를 정의한다. 둘째, 미디어 메타데이터 표준을 정의한다. 미디어의 종류가 다르더라도 정의한 표준의 키워드만 추출할 수 있다면 미디어의 통합관리가 가능하다. 셋째, 메타데이터 자동 생성 기술을 연구한다. 단순히 온톨로지에 정의된 키워드의 의미만을 보지 않고, 온톨로지 기반의 추론엔진을 이용하여 사용자를 중심으로 관련 키워드의 관계를 고려한 메타데이터 생성의 정확성을 높인다. 이러한 기술을 기반으로 시맨틱 검색도 가능하며, 기존의 메타데이터 저작도구와 비교하여 보다 정확한 메타데이터 자동생성과 검색이 가능하다.

  • PDF