• 제목/요약/키워드: 의미베이스

검색결과 336건 처리시간 0.028초

의미 정보를 이용한 한국어 복합명사 분석 (Analysis of Korean Compound Noun using Semantic Information)

  • 김수남;원상현;권혁철;주종철;이상기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.195-197
    • /
    • 1998
  • 복합명사 분석은 조합이 자유롭고 제한이 없으므로 여러 가지 모호성을 발생시킨다. 이러한 모호성을 해결하는 기존 방법으로 사전을 이용하는 방법[2]과 통계적 정보를 이용하는 방법[3,4]이 있다. 본 논문에서는 하위 범주화된 어휘 정보를 가진 전자사전을 이용하여 복합명사를 분석한다. 그리고 어휘 정보만으로 처리했을 때 의미상으로 잘못된 분석이 발생할 수 있으므로 본 논문은 복합명사를 구성하는 어휘의 정보와 특정단어의 의미에 따른 복합명사 제약조건을 규칙베이스로 구축하여 분석에 이용한다. 또한 분석에 실패한 복합명사의 유형을 분석하여 각 유형에 따른 교정 방법도 제시한다. 실험 데이터는 부산일보, 교과서, 그리고 각종 문서에서 무작위로 추출한 27,945개의 복합명사를 사용하였다. 본 논문에서 제시한 의미적 제약조건을 이용하여 분석했을 때 복합명사로 잘못 쓴 어절의 검사율이 21% 향상되었다.

  • PDF

단어 간 지배 관계 및 연관 관계를 이용한 한국어 교열 시스템 (A Korean Revision System Using the governal and collocational relation between words)

  • 심철민;김민정;이영식;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.303-316
    • /
    • 1993
  • 스펠러와 같은 오류 처리 기법은 한 어절 사이의 처리에 국한되거나, 또는 수사 처리와 같이 일부 제한된 품사 영역에서만 어절을 넘어선 처리가 행해지고 있다. 한편 교열과 같은 어절 단위를 넘어선 오류 처리는 완벽한 통사 분석과 의미 해석을 반드시 필요로 한다고 생각되어져 왔다. 그리고 현재 한국어 처리에서는 완벽한 통사적, 의미적 처리가 불가능하기 때문에 교열 시스템 또는 어절 단위를 넘어선 오류 처리에 대한 연구가 거의 전무한 실정이다. 본 논문은 어절을 넘어선 오류의 유형을 분류하고, 문장 단위로 관련된 단어 사용오류를 검사하는 기법과 관련 단어 처리를 위한 규칙 데이타 베이스의 구조를 제안한다. 단어 사이에 존재하는 통사적, 의미적 지배 관계와 연관 관계를 어휘선택 제약으로 이용함으로써 완벽한 통사 분석과 의미 분석이 없이도 교열이 가능하게 하였다.

  • PDF

B2B상에서 메타 데이터의 의미값을 이용한 다른 기증간 데이터 베이스 통합 구조 (Using Semantic Values of Meta Data for Heterogeneous Database Integration Architecture on B2B)

  • 이진수;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.286-288
    • /
    • 2001
  • 본 논문에서는 기존에 개발된 데이터베이스내의 데이터 소스를 공유하기 위해 통합 라이브러리를 구축하고 이를 통해 데이터베이스내의 소스 데이터에 대한 의미적인 통합을 위한 구조를 제안한다. 데이터의 의미적인 통합을 위해 데이터 스키마가 가지고 있는 실질적인 의미값을 기존의 각 데이터베이스 시스템에서 참조하고 데이터 공유에 대한 동의를 갖도록 메타 데이터를 이용하였다. 따라서 먼저 통합 라이브러리를 구축하여 메타 데이터에 대한 정보와 메타 데이터간에 존재하는 함수적인 관계를 변경 함수로 함께 구현하였으며. 데이터 통합을 위한 참고 자료는 각 시스템마다 온톨로지(Ontology)를 작성하여 활용하였다. 본 논문에서 제안하는 방법은 기존의 방법에 비해 메타데이터의 수정과 주가가 간단하며 새로운 시스템을 통합 라이브러리로 합병하는 비용이 현저히 감소되었다.

  • PDF

상접한 공간 객체의 무결성 지원을 위한 공간 연산 트리거의 설계 및 구현 (Design and Implementation of a Spatial-Operation-Trigger for Supporting the Integrity of Meet-Spatial-Objects)

  • 안준순;조숙경;정보흥;이재동;배해영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.127-140
    • /
    • 2002
  • 공간 데이타베이스 시스템에서 데이타베이스의 일관성 유지를 위해 의미적 무결성을 지원해야 한다. 실세계의 경계(boundary) 레이어에서 경계는 주위의 공간 객체들과 항상 접해 있어야만 하는 상접(meet)한 성질과 두개 이상의 다른 공간 객체가 동일한 이름을 가질 수 없는 성질을 가진다. 이 성질은 실세계에서 묵시적으로 인지되는 개념이다. 따라서 공간 객체의 갱신으로 인해 레이어에 대한 묵시적인 개념이 위배될 경우 무결성 유지가 필요하다. 따라서 본 논문에서는 이 레이어에 대한 공간 객체의 무결성을 유지하기 위한 공간 연산 트리거를 제안한다. 제안한 기법은 SQL-3를 기반으로 공간 연산 트리거 정의어를 정의하고, 레이어에 대한 무결성 제약조건이 위배될 때 수행되며, 공간 연산 트리거 수행 전략으로 동일 레이어에 대한 공간과 비공간 데이타 트리거로 나누어 수행되고, 다른 레이어에 대한 비공간 데이타 트리거를 수행하는 기법이다. 공간 연산 트리거 관리기는 사용자에게 의해 정의된 공간 연산 트리거 정의어는 공간 연산 트리거 처리기를 통해 파스트리를 생성하여 카탈로그 관리기를 통하여 데이타베이스에 저장되며, 갱신 질의시 공간 연산 트리거 수행 처리기를 통해 공간 데이타베이스의 일관성을 유지시켜주는 구조를 가지고 있다. 공간 연산 트리거는 상접성을 유지해야 하는 공간 객체들의 의미적 무결성을 위해 공간과 비공간 데이타에 대하여 3 단계 수행으로 공간 객체에 대한 의미적 무결성 유지와 자동 보정으로 사용자 편의성을 제공한다.

다단계 보안을 위한 확장 릴레이션의 운영 의미론 (The Operational Semantics of Extended Relations for Multilevel Security)

  • 조완수;배해영
    • 한국정보처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.87-94
    • /
    • 1996
  • 본 논문에서는 다단계 보안을 지원하는 관계 데이타베이스 관리 시스템을 설계 하기 위하여 표준 관계 모델을 확장하고, 새로운 다단계 무결성 제약조건을 제시 하며, 이를 지원하는 다단계 릴레이션의 운영 의미를 제시한다. 확장된 관계 모델과 새로운 무결성 제약조건은 다단계 데이타베이스를 일관된 상태로 유지시키며, 다중사례를 지원하면서 이의 허용에 따른 엔티티 및 관계 표현의 모호성을 제거할 수 있는 기반을 제공한다. 확장된 다단계 릴레이션에 대한 다단계 갱신 연산은 서로 다른 보안 분류의 요소를 동시 에 처리할 수 있는 다단계 입력 및 갱신 트랜잭션을 지원하여 갱신 연산의 효율성을 증가시킨다. 또한 다단계 릴레이션의 분해를 위한 알고리즘 구현의 기초를 제시한다.

  • PDF

퍼지 객체 추론 모델의 정형화 (A Formal Specification of Fuzzy Object Inference Model)

  • 양재동;양형정
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.141-150
    • /
    • 2000
  • 기존의 퍼지 규칙 기반 전문가 시스템 언어에는 크게 세 가지 단점들이 있다. 첫째, 복합 객체 추론 기능이 없으며, 둘째, 의미적으로 이해하기 쉽고 개념적으로 사용하기 용이한 퍼지 추론을 지원하지 못할 뿐 아니라, 세째, 지식 표현과 추론 방식이 기존의 데이터베이스 모텔과 구문이나 의미에서 현격 한 차이를 보이고 있기 때문에 서로 통합되기 어렵다. 본 논문에서는 이 세가지 단점들을 해결하기 위한 퍼지 객체 추론 모델의 정형화를 보이고, GIS 응용을 예로 들어 제시하는 모델이 데이타베이스내 GIS 복합 객체들을 자연스럽게 모델링하고, 이들 사이의 퍼지 추론을 성공적으로 수행함을 보인다.

  • PDF

구문 관계 정보를 이용한 한국어 질의-응답 시스템 (Korean Question-Answering System using Syntactic-Relation Information)

  • 신승은;이대연;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위한 동사의 구문 관계 정보를 이용한 한국어 질의-응답 시스템에 대해 기술한다. 구문 관계 정보는 동사의 원형, 사용 패턴, 각 문장 성분들의 의미 속성, 유의 동사 등의 정보를 담고 있다. 문장 및 구에 대한 구문분석은 구문관계 정보에 나타난 동사에 의존적인 문장 성분들의 의미속성과 동사의 일반적인 사용 패턴을 활용한다. 또한 정답후보 문장들의 구문분석을 위해 구문 관계 정보를 사용하고, 질의문의 격 슬롯(case slot)으로부터 정답을 찾기 위해 구문관계 정보를 사용한다. 실험에서 동사의 구문 관계 정보의 이용이 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위해 한국어 질의-응답 시스템에 효율적으로 활용될 수 있음을 보였다.

  • PDF

언어정보 DB 구축을 위한 문법적 주석 상의 몇 문제 - 기존 국어사전의 어휘 정보 수용과 관련된 문제를 중심으로 (Problems in Syntactic Annotation for Building a LDB in Korean)

  • 신선경;한영균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.73-81
    • /
    • 1992
  • 한 언어에 대한 포괄적인 언어정보 데이타베이스의 구축에 있어서는 수집된 텍스트에 대한 상세한 문법정보의 주석이 일차적 작업 대상이 된다. 이는 통사적 정보가 단순히 구문 분석상의 문제들을 해결하기 위한 정보를 제공해주는 것일 뿐 아니라 형태소 해석 및 문장 의미의 파악등 자연언어 이해시스템 전반의 성능을 향상시키는 데에 중요한 물을 차지하기 때문이다. 각개 단어의 문법적 기능에 대한 주석은 사전적 정의에 따른다면 "품사"로 표현할 수 있을 것이다. 그런데 품사는 각개 단어가 지니는 고유한 어휘의미적 정보이기보다는 구문구조에 의존적인 양상을 보인다. 이는 사전에 따라서 각개 단어에 대한 품사 정보가 달리 나타나는 점에서도 간취할 수 있는데, 한편으로 한국어 언어정보 데이타베이스 구축을 위한 문법적 주석에 있어서는 기존 사전의 품사정보에만 의존할 수는 없다는 문제점이 제기된다. 따라서 각 어휘들의 구문정보(흑은 품사정보)를 어떻게 기술할 것인가가 해결되어야 하는 것이다. 본 연구에서는 일차적으로 각 어휘들의 문장 안에서의 기능을 바탕으로 한 주석체계를 설정하고 그에 따라서 약 12만개의 문장에 대한 일차적 형식화를 수작업으로 처리하였다. 이는 향후 자동적으로 문법적 주석이 가능하도록 해주는 시스템의 개발을 지원하기 위한 언어정보의 수집에 목적을 둔 것인데, 이를 통해서 기존 국어사전에서의 언어정보상의 미비점을 수정 보완할 몇 가지 근거를 마련할 수 있었다.

  • PDF

관계형 데이타베이스 기반의 RDF와 OWL의 저장 및 질의처리 (RDF and OWL Storage and Query Processing based on Relational Database)

  • 정호영;김정민;정준원;김종남;임동혁;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권5호
    • /
    • pp.451-457
    • /
    • 2005
  • 컴퓨터의 발전에도 불구하고 수많은 전자 문서가 범람하는 현재와 같은 상황에서 원하는 정보를 얻기는 더욱 어려워지고 있다. 이와 같은 상황에서 데이타를 얼마나 빠르게 처리하는지 보다 얼마나 의미 있는 정보를 얻을 수 있는지가 중요한 문제가 되고 있다. 이에 웹 자원에 대해 지식기반의 메타 데이타를 기술하고 이를 이용한 지능적인 정보 처리를 목적으로 하는 것이 시멘틱 웹이다 또한 시멘틱 웹이 발전함에 따라 웹 자원 못지않게 지식자원에 대한 중요성도 커질 수 밖에 없다. 본 논문에서는 시멘틱 웹을 기술하는 W3C표준 언어인 OWL에 대해 효율적이고 의미 있는 질의처리를 제공할 수 있는 데이터 베이스의 저장 시스템 및 OWL-QL 질의 처리기를 제공한다.

묵시적 참조 무결성을 고려한 관계형 스키마 모델의 XML 스키마 모델 변환 알고리즘 (An Algorithm for Translation from RDB Schema Model to XML Schema Model Considering Implicit Referential Integrity)

  • 김진형;정동원;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.526-537
    • /
    • 2006
  • XML 데이타의 효율적인 저장을 위한 가장 대표적인 접근방법은 XML 데이타를 관계형 데이타베이스에 저장하는 것으로 대부분의 데이타가 여전히 관계형 데이타베이스에 저장되어 있다는 현실적 상황을 쉽게 수용할 수 있다는 장점을 지닌다. 이러한 접근 방법은 XML 데이타를 관계형 데이타로 혹은 관계형 데이타를 XML 데이타로 변환 과정이 필수적으로 요구하며, 변환 과정에서 가장 중요한 점은 관계형 스키마 모델의 구조적, 의미적 관계 정보를 XML 스키마 모델에 정확히 반영하는 것이다 지금까지 많은 변환 방법들이 제안되었으나 구조적 의미를 반영하지 못하거나 단순히 명시적으로 정의된 참조 무결성 관계(Referential Integrity Relations)만을 지원하는 문제점을 지닌다. 이 논문에서는 관계형 스키마 모델의 XML 스키마 모델로의 변환 시 초기 관계형 데이타베이스의 묵시적 참조 무결성 관계를 자동적으로 추출하여 이를 변환에 반영할 수 있는 알고리즘을 제안한다. 제안된 알고리즘은 초기 관계형 데이타베이스에 명시적으로 정의되어 있는 참조 무결성 관계는 물론 묵시적인 참조 무결성 관계까지 변환 과정에 반영함으로써 보다 정확한 XML 데이타 모델 생성을 가능하게 한다.