• 제목/요약/키워드: schema transformation method

검색결과 24건 처리시간 0.019초

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

주소해석 및 검색을 위한 우편주소파일 설계 (Design of Postal Address File for Address Interpretation and Retrieval)

  • 장태우;김호연;임길택
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.74-88
    • /
    • 2007
  • 우편물을 배달순서대로 정렬하는 순로구분의 자동화를 위해서는 우편물에 표기된 주소를 인식해야 하며, 이 과정에서 표준화된 우편주소 데이터베이스는 필수적이다. 우편주소 데이터베이스는 주소인식뿐만 아니라 우편물 정보처리 등 다양한 측면에서 사용 가능하여 우편물 처리의 자동화와 정보화에 매우 중요하다. 본 연구는 우편주소 데이터베이스에서의 정보체계 표준을 위한 스키마 및 이에 따른 우편주소파일의 설계 방법과 설계된 스키마에 따른 주소해석 과정 및 방법에 관한 것이다. 주소를 표준화된 형태로 변환하는 데에 필요한 정보를 분석하여 이를 우편주소파일 설계과정에 포함시킴으로써 향후 순로구분 자동화를 위한 한글 주소인식 시스템과 고객 바코드 인증을 위한 주소 데이터베이스 매칭 및 주소검색 시스템에 활용할 수 있도록 하기 위해 우편주소파일을 설계하였다.

  • PDF

추론적 기법을 사용한 객체지향 데이터베이스의 지능적인 질의 처리 (Intelligent Query Processing in Deductive and Object-Oriented Databases)

  • Kim, Yang-Hee
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.251-267
    • /
    • 2003
  • 객체지향 데이터 베이스에서는 지능 정보시스템에서 요구하는 것을 만족하기 위하여 보다 지능적인 질의 처리 기법이 필요하다. 본 논문에서는 추론적 기법을 사용하여, 객체지향 데이터베이스에서의 지능적인 질의 처리하는 방법에 대하여 논의한다. 논문에서 제시하는 방법을 사용하여, 객체지향 데이터베이스에서 주어진 질의에 대한 답을 추상적으로 표현하는 지능적인 답을 얻을 수 있다. 본 논문에서 제안하는 지능적인 질의 처리 방법은 규칙 표현, 규칙 재편성, 전 분석, 분석의 네 단계로 구성된다. 규칙 표현 단계에서는 객체지향 데이터베이스 스키마를 사용하여 추론 규칙을 생성한다. 규칙 재편성 단계에서는 규칙에서 순환을 제거한다. 전 분석 단계에서는 유일한 내포적 문자를 얻기 위하여 규칙변환이 이루어진다. 분석 단계에서는 SLD-분석을 사용하여 내포적 답을 구한다.

  • PDF

가중치가 적용된 공분산을 이용한 2D-LDA 기반의 얼굴인식 (Improved Face Recognition based on 2D-LDA using Weighted Covariance Scatter)

  • 이석진;오치민;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제17권12호
    • /
    • pp.1446-1452
    • /
    • 2014
  • Existing LDA uses the transform matrix that maximizes distance between classes. So we have to convert from an image to one-dimensional vector as training vector. However, in 2D-LDA, we can directly use two-dimensional image itself as training matrix, so that the classification performance can be enhanced about 20% comparing LDA, since the training matrix preserves the spatial information of two-dimensional image. However 2D-LDA uses same calculation schema for transformation matrix and therefore both LDA and 2D-LDA has the heteroscedastic problem which means that the class classification cannot obtain beneficial information of spatial distances of class clusters since LDA uses only data correlation-based covariance matrix of the training data without any reference to distances between classes. In this paper, we propose a new method to apply training matrix of 2D-LDA by using WPS-LDA idea that calculates the reciprocal of distance between classes and apply this weight to between class scatter matrix. The experimental result shows that the discriminating power of proposed 2D-LDA with weighted between class scatter has been improved up to 2% than original 2D-LDA. This method has good performance, especially when the distance between two classes is very close and the dimension of projection axis is low.