• 제목/요약/키워드: 온톨로지 추출

검색결과 200건 처리시간 0.027초

포인터 생성 네트워크를 이용한 패러프레이즈 생성 (Generation Paraphrase using Pointer Generation Network)

  • 박다솔;김영길;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.535-539
    • /
    • 2020
  • 다양한 발화를 모델링하는 요구는 자연어 처리 분야에서 꾸준히 있었으며 단어, 구 또는 문장과 동등한 의미 콘텐츠를 자동으로 식별하고 생성하는 것은 자연어 처리의 중요한 부분이다. 본 논문에서는 포인터 생성 네트워크(Pointer Generate Nework)를 이용하여 패러프레이즈 생성 모델을 제안한다. 제안한 모델의 성능을 측정하기 위해 사람이 직접 구축한 유사 문장 코퍼스를 이용하였으며, 토큰 단위의 BLEU-4 0.250, ROUGE_L 0.455, CIDEr 2.190의 성능을 보였다. 하지만 입력 문장과 동일한 문장을 출력하는 문제점이 존재하여 빔서치(beam search)를 적용하여 입력 문장과 비교하여 생성 문장을 선택하는 방식을 적용하였다. 입력 문장과 동일한 문장을 제외한 문장으로 평가를 진행했으며, 토큰 단위의 BLEU-4 0.234, ROUGE_L 0.459, CIDEr 2.041의 성능을 보였으나, 패러프레이즈 생성 데이터 양이 크게 증가하였다. 본 연구는 문장 간의 의미적으로 동일한 정보를 정확하게 추출할 수 있게 됨으로써 정보 추출, 온톨로지 생성에 도움이 될 것이다. 또한 이러한 기법이 챗봇에서 사용자의 의도 탐지 및 MRC와 같은 자연어 처리의 여러 분야에 유용한 자원으로 사용될 것이다.

  • PDF

온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구 (Ontology - Based Intelligent Rule Components Extraction)

  • 김우주;채상용;박상언
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.237-244
    • /
    • 2006
  • 시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

  • PDF

지식 문서에서 도메인 온톨로지를 이용한 개념 추출 기법 (Concept Extraction Technique from Documents Using Domain Ontology)

  • 문현정;우용태
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.309-316
    • /
    • 2006
  • 본 논문에서는 도메인 온톨로지를 이용하여 XML 형식의 지식 문서를 분류하고 대표 개념을 효과적으로 추출하기 위한 기법을 제시하였다. 먼저, 도메인 온톨로지는 텍스트마이닝 기법과 통계적 기법을 이용하여 생성하였다. 이를 위해 XML 문서의 구조적인 특징을 이용하여 도메인 대표용어 집합을 구성하였다. 그리고 XML 문서를 효과적으로 분류하기 위한 DScore 기법과 지식 문서로부터 개념을 추출하기 위한 TScore 기법을 제시하였다. 본 논문에서 제안한 기법의 효율성을 검증하기 위하여 295편의 컴퓨터 관련 논문을 대상으로 실험하였다. 실험 결과, 본 연구에서 제안한 도메인 대표 용어 집합을 이용한 분류 결과가 기존의 방법보다 우수한 성능을 보였다. 특히 TScore기법에서는 문서에서 출현한 용어의 빈도수는 낮더라도 문서의 개념을 대표할 수 있는 용어를 효과적으로 추출할 수 있음을 보였다. 본 연구는 개념 기반의 검색 기법을 통하여 대량의 지식 문서를 효과적으로 관리하기 위한 지식 관리 모델에 적용할 수 있다.

Geo Semantic Web 시스템의 개발 (Development of a Geo Semantic Web System)

  • 김정준;신인수;한기준
    • Spatial Information Research
    • /
    • 제18권5호
    • /
    • pp.83-92
    • /
    • 2010
  • 최근 상호운용성과 지능화 및 개인화가 강조되는 IT 기술 추세에 맞추어 Geospatial Web이 Semantic Web과 접목되면서 다양한 지리 공간 정보와 일반 웹상의 방대한 비공간 정보를 효율적으로 연계 및 통합하여 사용자에게 보다 적합한 정보를 제공할 수 있는 지능적인 지리 정보 웹 서비스 기술인 Geo Semantic Web이 제시되었다. 이러한 Geo Semantic Web 서비스를 위해서는 웹 환경에 산재한 지식 및 정보를 컴퓨터가 자동으로 처리할 수 있게 하기 위한 Geo Ontology 처리 기술의 개발이 필요하다. 그러나 아직까지 Geo Ontology 처리 기술에 관한 표준은 제정되어 있지 않고 표준화 기구와 여러 단체 및 기관 등에서 관련 연구를 진행 중이다. 본 논문에서는 그동안 진행되었던 Geo Ontology와 관련된 다양한 기반 이론 및 기술들을 적용하여 Geo Semantic Web 시스템을 설계 및 구현하였다. Geo Semantic Web 시스템은 Geo Semantic 질의를 분석 및 처리하고 세션을 관리하기 위한 질의 처리 관리자, Geo Ontology를 생성 및 질의하고 공간/비공간 데이타를 추출하기 위한 온톨로지 관리자, 그리고 클라이언트로 구성된다. 마지막으로, 본 논문에서는 이러한 Geo Semantic Web 시스템을 Geo Semantic 질의가 필요한 가상 시나리오에 적용해 봄으로써 시스템의 효용성을 검증하였다.

BIM과 온톨로지를 활용한 표준내역항목 추론 자동화 (Automatic Inference of Standard BOQ(Bill of Quantities) Items using BIM and Ontology)

  • 이슬기;김가람;유정호
    • 한국건설관리학회논문집
    • /
    • 제13권3호
    • /
    • pp.99-108
    • /
    • 2012
  • BIM(Building Information Model) 기반으로 기본설계를 수행한 경우에도 개략적인 설계 정보만 제공되므로, 내역작성에 필요한 충분한 정보를 설계도면으로부터 확보하는 것이 어렵다. 하지만 대부분 BIM기반 공사비산정 관련 연구들은 물량산출 자동화 또는 BIM 기반 물량산출결과의 정확도 향상을 위한 방안 제시하는 것이 대부분이며, 건설사업의 공사비산정에서 요구되고 있는 표준품셈 및 일위대가에 대한 고려가 미흡하다. 따라서 본 연구에서는 BIM 활용의 장점을 활용하고 여기에 온톨로지 기술을 접목하여, BIM 기반의 기본설계 정보로부터 내역서 생성에 필요한 작업내역을 자동으로 추출하는 프로세스를 제시한다. 이 프로세스를 적용할 경우, BIM 정보의 활용성이 더욱 향상될 것으로 기대되며, 견적자의 자의적 판단이 개입되던 문제를 해결하여 동일한 BIM이라면 동일한 견적결과를 얻을 수 있는 일관성 있는 내역작성 방법 개발의 기초가 될 것으로 기대된다.

기본의미등록기의 RDF/OWL 연계방안에 관한 연구 (Designing Schemes to Associate Basic Semantics Register with RDF/OWL)

  • 오삼균
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.241-259
    • /
    • 2003
  • 기본의미등록기(BSR)는 전자상거래 및 EDI 관련 시스템 사이의 상호연동을 가능하게 하기 위한 등록기이다. XML 기반 BSR 등록개체들의 구조정보나 다양한 관계의 자동추출은 현재 불가능하다. 이 연구에서는 BSR에 등록되는 정보를 자원기술-프레임웍(RDF)과 웹온톨로지언어(OWL)에 기반하는 기계가독형으로 정의한 대표적인 예를 제시하고 결론적으로 5개의 기본 권고안을 도출하였다. 즉 BSR 컴포넌트 소속의 클래스 정의에서 동의어의 표현에는 OWL의 'sameAs', 유사어 표현에는 OWL의 'equivalenlClass', BSR 개념들 간의 상.하 관계 표현은 RDF 스키마의 'subClassOF', BSR의 의미단위(BSU)에 관한 정의는 RDF 스키마의 'label', 인스턴스 용례에 관한 설명은 RDF 스키마의 'comment', 각 BSU의 클래스 소속에 관한 정의는 RDF 스키마의 'domain', BSU가 취할 수 있는 데이터유형에 대한 정의는 RDF 스키마의 'range'등을 적용하며, 나아가 BSR 데이터요소의 정의에 XML 스키마의 데이터 유형을 접목시키고 BSU들 간의 상.하 관계 표현에 RDF 스키마의 'subPropertyOF'를 적용할 것을 추천하였다.

검색 키워드 확장을 이용한 온톨로지 자동 생성 시스템 개발 (The Development of Automatic Ontology Generation System Using Extended Search Keywords)

  • 심준;이홍철
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1220-1228
    • /
    • 2009
  • 시맨틱 웹의 핵심인 온톨로지는 주로 특정 도메인에 한정되거나 휴리스틱에 의존해 의미와 관계를 정의하여 생성하고 있다. 하지만 온톨로지의 생성은 매우 어려울 뿐만 아니라 많은 시간이 소요되는 작업이다. 특정 분야에서 사용되는 온톨로지와 달리 웹에서 사용되는 온톨로지는 지식 및 정보 표현의 범위가 한정적이지 않기 때문에 기존의 온톨로지 생성 방식으로는 정보를 표현하기가 어렵다. 따라서 온톨로지의 자동 생성은 시맨틱 웹의 구현에 있어서 매우 중요한 부분을 차지하게 된다. 본 논문에서는 웹 온톨로지를 자동으로 생성하기 위해서 형태소 분석을 이용하여 검색엔진에서 사용자들이 입력하는 검색 키워드로부터 색인어를 추출하고, 이와 관련된 키워드를 확장시켜 온톨로지를 생성하고 갱신하는 방법에 대하여 제안한다.

PSR : 효율적인 웹 서비스 컴포지션 검색을 위한 RDBMS 기반의 선 계산 기법 (PSR: Pre-Computing Solutions in RDBMS for Efficient Web Services Composition Search)

  • 권준호;박규호;이대욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.333-344
    • /
    • 2008
  • 최근 웹 서비스 컴포지션이 많은 관심을 받고 있다. 웹 서비스 컴포지션을 통해서, 현재 존재하는 웹 서비스를 이용하여 저장소에 존재하지 않는 새로운 웹 서비스를 제공할 수 있다. 이 논문에서는 웹 서비스 컴포지션 검색을 구성하기 위해서 관계형 데이타베이스(RDBMS)를 사용한 PSR 시스템을 제안한다. 웹 서비스 컴포지션을 선 계산하기 위한 조인과 인덱스를 사용하는 알고리즘을 제안한다. 또한 웹 서비스에서 추출한 온톨로지 정보도 테이블로 저장하고, PSR 시스템이 이를 사용하여 온톨로지 매칭 정도에 따라 사용자 질의와의 유사도를 통한 결과를 반환하도록 하였다. 실험을 통하여 RDBMS 상에서 웹 서비스 컴포지션을 선 계산하는 접근 방법이 많은 수의 웹 서비스와 사용자 질의를 처리할 때 빠른 실행 시간과 좋은 확장성을 가지고 있음을 보였다.

정보시스템에서 퍼지용어의 확장된 AHP를 사용한 레벨화와 유사성 측정 (A Leveling and Similarity Measure using Extended AHP of Fuzzy Term in Information System)

  • 류경현;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.212-217
    • /
    • 2009
  • 특정 분야의 용어를 표현하는 전문용어 사이의 계층관계를 학습하는 방법은 규칙기반학습방법, 통계기반학습방법 등이 있다. 본 논문에서는 문서에서 추출된 퍼지용어 정보를 바탕으로 한 온톨로지 구조를 카테고리화하여 퍼지용어의 전문성을 이용하여 주어진 퍼지용어의 상위어 후보를 레벨화한 후 퍼지용어 의미유사도를 계산하여 선택된 후보들 중에서 최적의 상위어후보를 결정한다. 즉, 퍼지용어의 전문성을 레벨화하기 위한 확장된 AHP방법은 퍼지용어사이의 비교를 통해 가중치나 상대적 중요성을 결정한 후 퍼지집합의 Min연산자와 다이스계수, Min+다이스계수방법들을 비교한다. 이 방법들은 퍼지용어 의미유사도에 따라 문서들이 가지는 의미론적 내용과 관계의 식별을 바탕으로 보다 더 정확하게 문서를 분류할 수 있고 자연어처리 등 많은 분야에 활용될 수 있을 것이다.

관계형 데이터베이스를 OWL 2 웹 온톨로지로 사용하기 위한 OWL/관계형 매핑 규칙 (OWL/Relational Mapping Rules to Use Relational Databases as OWL 2 Web Ontologies)

  • 최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.35-47
    • /
    • 2011
  • 본 논문은 관계형 데이터베이스로부터 OWL 온톨로지를 자동으로 생성할 수 있는 규칙을 제안한다. 이 규칙의 목적은 기존 관계형 데이터베이스 데이터를 데이터베이스 스키마 변형과 데이터 마이그레이션과 같은 별도의 과정을 거치지 않고도 시맨틱 웹 환경에서 사용할 수 있도록 하는 것이다. 즉, 이 규칙은 RDBMS가 웹 온톨로지 저장소 역할을 동시에 수행하는 것을 돕는다. 그러나 기존의 관계형 데이터베이스와 OWL 사이의 매핑 규칙들을 본 연구의 목적을 위하여 사용하고자 할 경우 다음과 같은 문제가 발생한다. 첫째, 특정 구조의 테이블이 존재하는 데이터베이스로부터는 OWL 온톨로지를 생성할 수 없다. 둘째, 하나의 개체 추출을 위하여 높은 비용의 데이터베이스조인 연산 혹은 여러 개의 SQL 질의가 불필요하게 수반된다. 반면에 본 논문에서 제안하는 규칙은 이러한 문제들을 방지하도록 설계되었으며, 데이터베이스 스키마로부터 OWL 클래스와 프로퍼티를 생성하며, 데이터베이스 인스턴스로 부터 OWL 개체를 생성한다. 또한 이 규칙을 적용하여 생성한 OWL 온톨로지는 OWL 2 DL 사양을 만족시킨다.