• 제목/요약/키워드: 시맨틱 파싱

검색결과 5건 처리시간 0.022초

제한된 타입 시그니처 기반의 시맨틱 파싱 (Semantic parsing with restricted type signatures)

  • 남대환;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.569-571
    • /
    • 2020
  • 시맨틱 파싱은 주어진 자연어 발화를 domain specific language(DSL)를 따르는 프로그램으로 변환하는 방법이다. 시맨틱 파서가 다형성을 가지는 DSL을 사용할 경우, 적은 수의 토큰으로 다양한 프로그램을 출력할 수 있지만, 탐색 공간이 넓어진다는 문제가 있다. 본 연구에서는 해당 문제를 완화하기 위해 다형성을 가지는 DSL의 타입 시그니처를 제한하는 방법을 제안한다. 해당 방법은 sequence-to-sequence 기반의 시맨틱 파싱 성능을 향상시키는데 효율적임을 보였다.

  • PDF

OWL Web Ontology Language를 위한 Ontology Parser의 설계 (A Design of Ontology Parser for OWL Web Ontology Language)

  • 이미경;박천수;손주찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.573-576
    • /
    • 2004
  • 시맨틱 웹에 이용되는 웹 온톨로지 언어들로는 RDF/RDFS, DAML+OIL, OWL 등이 있으며, 현재 W3C에서는 OWL을 웹 온톨로지 표준 언어로 삼고 있다. 기존의 웹 온톨로지 문서들의 파서는 대부분 RDF를 기반으로 한 Triple 모델을 기반으로 하여 파싱한다. 그러나 OWL의 경우는 triple 형태로 변환시키면 OWL Full의 형태를 가지게 되고 OWL 온톨로지의 표현력과 데이터의 손실을 가져오게 된다. 따라서 OWL 문서의 파싱을 위하여 우리는 OWL Abstract Syntax를 이용하여 Tree 모델을 가지는 OWL 파서를 만들고자 한다. 본 논문에서는 시맨틱 웹에서 사용되는 웹 온톨로지들을 파싱하여 온톨로지 객체 모델을 생성해주는 기능을 가지는 온톨로지 파서를 설계, 구현하였다. 논문에서 설계한 온톨로지 파서는 RDF, DAML+OIL, OWL 웹 온톨로지 문서들을 파싱하여 온톨로지 객체 모델을 생성할 때, RDF 온톨로지의 경우는 Triple 모델 형태로 파싱을 하지만, OWL 온톨로지의 경우에는 OWL Abstract Syntax Tree 모델 형태로 파싱한 후, OOM으로 변환시켜준다. 이를 위해 웹 온톨로지 언어의 종류 구분과 OWL 온톨로지의 경우, OWL Full, OWL DL, OWL Lite의 서브 타입을 구별하는 기능도 추가하였다.

  • PDF

시맨틱 웹을 위한 온톨로지 파서의 설계 (A Design of Ontology Parser for Semantic Web)

  • 이미경;박천수;손주찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.1109-1112
    • /
    • 2003
  • 시맨틱 웹은 웹 상의 정보에 의미를 부여하여 컴퓨터가 문서의 의미를 해석할 수 있도록 하기 위한 목적으로 제안된 것이다. 시맨틱 웹의 잘 정의된 의미를 다루기 위해서 RDF/RDFS, DAML+OIL, OWL 등의 웹 온톨로지 언어가 필요하다. 본 논문에서는 시맨틱 웹에서 사용되는 온톨로지 문서들을 이용하는 온톨로지 기반 지식 엔진 시스템에서 코어 엔진의 Ontology Access Layer에 해당되는 부분으로 웹 온톨로지 문서를 읽어서 Ontology Object Model로 생성해주는 기능을 하는 온톨로지 파서를 설계하였다. 논문에서 설계한 온톨로지 파서는 RDF, DAML+OIL, OWL 웹 온톨로지 문서들을 파싱하여 Ontology Object Model 을 생성한다. 그리고 파싱에 필요한 API를 제공해주며 문서를 읽고 저장해준다. 온톨로지 문서들의 Triple 값을 필요로 하는 시스템을 위해서 문서들의 Triple 형태의 결과 값도 제공해준다.

  • PDF

온톨로지 파싱 속도향상을 위한 온톨로지 파서 설계 (Ontology Parser Design for Speed Improvement of Ontology Parsing)

  • 김원필;공현장
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.96-101
    • /
    • 2010
  • 시맨틱 웹에서 핵심 연구는 온톨로지 파싱의 효율성이다. 온톨로지의 효율적 파싱과 추론은 시맨틱 웹의 궁극적인 목적인 의미적인 정보검색의 기반이 된다. 그러나 기존의 온톨로지 저작도구들은 온톨로지 파싱속도에 있어 효율적이지 못하고 있는 실정이다. 따라서, 본 연구에서는 온톨로지가 기술하는 모든 사실을 빠르게 추출하기 위해 2단계에 걸친 온톨로지 파서를 설계 하였다. 정확하고 빠른 파서의 설계를 위해 토큰 추출기에서 온톨로지의 구문의 토큰을 1단계로 추출하고, 이를 바탕으로 트리플 추출기에서 Statement를 추출한다. 이에 본 연구에서 설계한 파서의 속도는 기존의 도구들의 파서보다 빠른 처리가 이루어 짐을 확인할 수 있었다.

데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법 (A Distributed SPARQL Query Processing Scheme Considering Data Locality and Query Execution Path)

  • 김병훈;김대윤;고건식;노연우;임종태;복경수;이병엽;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.275-283
    • /
    • 2017
  • 시맨틱 웹 서비스의 증가로 인해 RDF 데이터가 대용량화되고 있다. 대용량 RDF 데이터를 효율적으로 활용하기 위하여 다양한 분산 저장 및 질의 처리기법들이 연구되고 있다. 본 논문에서는 대용량 RDF 데이터의 데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법을 제안한다. 제안하는 기법은 질의 처리 시의 조인 비용 및 통신비용을 감소시키기 위해 분산 저장된 RDF 데이터의 지역성 및 질의 수행 경로를 고려한다. 분산 환경에서 SPARQL 질의를 처리할 때 데이터 지역성을 고려하여 WHERE절을 기준으로 해당 질의를 여러 개의 서브 질의로 분할한다. 제안하는 기법은 분할된 서브 질의들을 인덱스를 통해 연관 노드들끼리 그룹화 하여 처리함으로써 데이터 통신비용을 감소시킬 수 있다. 또한 그룹 화된 서브 질의 처리 시 불필요한 조인 및 대기 시간을 감소시키기 위해 데이터 파싱 비용, 노드별 데이터 통신량 및 대기 시간 등을 고려한 효율적인 질의 수행 경로를 생성한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다.