• 제목/요약/키워드: 의미 모호성

검색결과 200건 처리시간 0.034초

벡터를 사용한 2단계 영한 대역어 선택 (2-Level English-Korean Target Word Selection Using Vectors)

  • 이기영;박상규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.473-476
    • /
    • 2003
  • 영한 자동번역 시스템에서 대역어 선택 모듈은 어휘 변환을 수행한다. 일반적으로 영어 단어는 다양한 한국어 단어로 번역될 수 있는 의미적 모호성을 지니고 있으며, 고품질의 영한 자동번역 결과를 제공하기 위해서는, 해당 문맥에 가장 적합한 한국어 단어가 선택되어야 한다. 본 논문에서는 영어의 명사 어휘에 대하여, 벡터를 사용하는 2 단계 영한 대역어 선택 기법을 제안한다. 벡터를 사용하는 2 단계 대역어 선택 방식은 첫 번째 단계에서, 원문에서 사용된 영어 명사의 의미를 결정하고, 두 번째 단계에서, 해당 의미를 지니는 유사 한국어 대역어 가운데, 생성될 한국어 문맥에 맞는 적합한 한국어 대역어를 선택한다. 또한 제안하는 방법의 타당성을 검증하기 위해 현재 우리가 개발중인 Tellus-EK 영한 자동번역 시스템에 적용한 결과를 논한다.

  • PDF

VAE를 이용한 의미적 연결 관계 기반 다중 문서 요약 기법 (Multi-Document Summarization Method Based on Semantic Relationship using VAE)

  • 백수진
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.341-347
    • /
    • 2017
  • 많은 양의 문서 데이터가 증가됨에 따라 사용자는 해당 문서를 이해하기 위한 요약된 정보를 필요로 한다. 그러나, 기존 문서 요약 연구 방법들은 지나치게 단순한 통계에 의존함으로써 문장의 모호성 및 의미 있는 문장 생성을 위한 다중 문서 요약 연구가 미흡한 실정이다. 본 논문에서는 의미적 연결 관계에 대한 파악 및 불필요한 정보를 처리하기 위한 전처리 과정을 거치며, 어휘 의미 패턴 정보를 기반으로 VAE를 이용하여 문장 간의 의미적 연결성을 높인 다중 문서 요약 기법을 제안하였다. 문장을 이루고 있는 단어 벡터들을 이용하여, 잠재된 변수로 생성된 압축된 정보와 속성 판별기로부터 학습을 한 후 문장을 재구성함으로써 의미적 연결 처리가 자연스러운 요약문을 생성하였다. 제안된 방법과 다른 문서 요약 방법을 비교했을 시 미세하지만 더 향상된 성능을 나타냈으며, 이는 의미적 문장 생성 및 연결성을 높일 수 있음을 증명하였다. 앞으로, 다양한 속성 설정 값을 가지고 실험하여 의미적 연결 관계를 확장할 수 있는 방법을 연구하고자 한다.

갱신 의미 보존 객체-지향 뷰 (Update Semantic Preserving Object-Oriented View)

  • 나영국
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.32-43
    • /
    • 2001
  • 데이터 모델링 능력이 한정되고 뷰 갱신 모호성 문제에 기인하여, 관계형 뷰는 공학 응용에 제한적으로 사용되어 왔다. 반면에 객체지향 데이터베이스의 뷰는 관계형 뷰의 이 두 가지 단점을 극복하기 때문에, 공학 응용을 위한 맞춤 인터페이스를 정의하는데 중요한 역할을 할 것이다. 특히 공학 응용을 위한 데이터베이스 인터페이스는 갱신을 충분히 지원하여 한다. 좀더 자세히 말하면, 인터페이스에 대한 갱신이 모호성이 없이 정의되어야 하며 이 정의는 베이스 스키마에 대한 갱신 행동과 일치하여야 한다. 이를 위하여 객체지향 뷰가 베이스 데이터 모델과 같은 갱신 행동을 보이기 위한 제반 조건 - 갱신 의미 보존(update semantic preserving)-을 정의하였다. 그리고 이 갱신 의미 보존 특성의 실현 가능성을 보이기 위하여 CAD에 특화된 객체지향 뷰 시스템, 멀티 뷰(MultiView), 을 선정하여 그 시스템의 뷰 모델에 대한 갱신 의미 보존 갱신 행동을 정의하고 구체적인 구현 알고리즘을 제시하였다. 이 연구는 객체지향 데이터베이스에서 가장 클래스를 모았을 때 단순한 클래스의 모임이 아니라 isa계층을 갖는 '스키마'가 될 수 있게하기 위해서는 가상 클래스에 대한 갱신 의미가 클래스간 isa 관계를 위반해서는 안된다는 것을 발견하였다. 그리고 이의 충분조건으로 '뷰 스키마가 베이스 스키마처럼 보이도록'하는 가상 클래스의 갱신 의미와 가상 클래스간 스키마 형성 가능 조건을 발견하였다. 이는 객체 지향 데이터베이스에서 뷰를 클래스 수준에서 스키마 수준으로 정의하는 충분조건을 발견하고 구현한 최초의 논문이다.

  • PDF

술어 기반 문형 정보를 이용한 한국어의 의미 구조 생성에 관한 연구 (A Study on the Generation of Semantic Structure of Korean using Sentence Pattern Information based on Predicates)

  • 박인철;배우정;안동언;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.43-49
    • /
    • 1995
  • 대부분 자연 언어 이해 시스템이나 중간 언어 방식을 이용한 기계 번역 시스템에서 자연 언어 문장을 이해하고 번역하기 위해서는 대량의 지식을 이용한 의미 구조의 생성이 요구된다. 따라서 개념 그래프를 이용하여 한국어 문장의 내부 의미 구조를 생성하기 위해서는 각 단어에 해당하는 개념과 개념들 사이의 개념적 관계를 나타내는 지식들이 요구된다. 그러나 이를 위한 의미 구조 생성 방법과 요구되는 지식 베이스를 정확하게 구축하는 것은 어렵고 응용 도메인에 종속한다는 문제가 있다. 본 논문에서 우리는 문형 이론을 도입하여 문형을 중심으로 의미 구조 생성을 위한 변환 규칙을 설계하고 이를 이용하여 방대한 지식 베이스의 구축없이 의미 구조를 생성할 수 있는 방법에 논의한다. 또한 본 논문에서 문형을 이용하면 몇 가지 모호성 문제를 해결할 수 있음을 보이고 문형의 한계에 대해서도 살펴본다.

  • PDF

잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구 (Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier)

  • 박부영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.163-166
    • /
    • 2004
  • 텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.

  • PDF

퍼지제어이론의 산업용 응용사례 조사연구 (A Survey on the Industrial Applications of the Fuzzy Control Theory)

  • 정태진;유종준
    • 전자통신동향분석
    • /
    • 제9권3호
    • /
    • pp.139-151
    • /
    • 1994
  • 퍼지집합은 언어의 의미와 개념속에 포함되어 있는 모호성을 정량적으로 표현하기 위한 집합개념으로서 매우 자연스럽고 어느 누구나 쉽게 이해할 수 있는 이론이다. 일반적으로 퍼지집합은 기존의 Crisp 집합을 확장한 것으로서 부분집합과 정의함수를 1대 1로 대응시키는 것이다. 본 고는 퍼지집합론과 퍼지논리에 대한 기본적인 개념과 퍼지제어이론을 적용한 산업용 응용사례에 대하여 기술한다.

신문 기사 요약문 생성을 위한 구문 분석기 구현 (Implementation of a [parser for news summarization)

  • 정영규;이현주;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.379-381
    • /
    • 2001
  • 본 논문은 문서요약 시스템의 일부로써 신문기사의 문장을 효율적으로 구문 분석할 수 있는 구문 분석기를 구현한다. 요약의 대상인 신문기사의 문장은 보조동사, 화용조사, 인용동사 등 많은 동사들을 가지며, 이와 같은 동사들은 구문분석을 할 때 많은 문제점을 발생시킨다. 본 논문은 이러한 동사들을 단위화하고, 여기서 발생하는 주어 생략과 모호성 문제를 해결하는 방법을 제시한다. 그리고 단위화의 결과로 나온 의미적 중심용언을 이용하여 문장의 필수 성분을 추출한다.

  • PDF

소프트웨어 프로덕트라인 가변성 기술 기법: OVDL (A Variability Description Technique for Software Product Line: OVDL)

  • 이지현;강성원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권11호
    • /
    • pp.739-746
    • /
    • 2013
  • 소프트웨어 프로덕트라인에서 가변성은 프로덕트라인의 멤버제품들을 차별화하는 특성으로, 가변성의 기술은 의미가 명확하고 선택이 용이하도록 가시화되어야 하며 관리하기 용이하여야 한다. 가변성 기술은 크게 개발 모델에 통합하는 방법과 개발 모델과는 독립적으로 기술하는 방법으로 나눌 수 있다. OVDL (Orthogonal Variability Description Language)은 독립적 가변성 기술 방법이면서 타 방법들의 가지는 의미의 모호성을 개선하기 위하여 제안된 가변성 표현 언어이다. 이 논문은 독립적 가변성 기술 방법의 기반을 제공한 OVM (Orthogonal Variability Model)으로 기술된 IWF (Inter-Working Function) 프로덕트라인의 가변성이 OVDL로 번역될 수 있는지 확인하는 방식으로 OVDL의 가변성 기술 역량을 검증한다.

의미패턴에 기반한 대화체 한영 기계 번역 (Machine Translation of Korean-to-English spoken language Based on Semantic Patterns)

  • 정천영;서영훈
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2361-2368
    • /
    • 1998
  • 본 논문에서는 한국어대화체를 분석하고 의미패턴에 기반한 대화체 한영 기계번역 시스템에 대하여 기술한다. 한영 기계번역에서 구문정보를 이용한 한국어 모호성은 의미패턴을 이용하여 해결할 수 있다. 따라서 대화체 번역을 위하여 한국어 스케쥴링 도메인으로부터 추출된 의미패턴에 기반한 시스템을 구성한다. 번역의 강건함을 위하여 한국어 문장 분석시 음절을 건너뛰어 분석할 수 있도록 하였으며, 패턴수를 줄이기 위하여 의미패턴에 옵션을 부가하였다. 실험을 위하여 사용된 데이터는 스케쥴링 도메인으로 실험결과 88%의 번역율을 보인다.

  • PDF

중력이상을 이용한 한반도 모호면 추출에 관한 연구

  • 김정우;조진동;김원균;민경덕;황재하;이윤수;박찬홍;황종선
    • 대한자원환경지질학회:학술대회논문집
    • /
    • 대한자원환경지질학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.258-264
    • /
    • 2003
  • 중력이상 및 수치고도모델을 이용하여 한반도 모호면 심도를 추출하였다 중력이상값은 인공위성고도레이더 관폭값을 주로 이용한 전지구 모델을 이용하여 데이터영역 뿐 만 아니라 주파수영역에서도 자료의 균질성을 확보하였다. 모호면 추출은 Kim et al. [2000a]에 의해 제안된 스펙트럼 대비법 및 후리에급수를 이용한 파워스펙트럼분석법을 이용하였다. 전자는 지각근형을 전제로, 지형에 의한 중력효과와 후리에어 중력이상을 파동수영역에서 대비하여 모호면의 심도를 계산하는 방법이고, 후자는 완전부우게 중력이상으로부터 푸리에변환을 이용하여 지하 밀도 변화층의 심도를 계산하는 방법이다. 이 두 모호면은 서로 0.53의 상관관계를 갖고 있으며, 이는 모호면 산출의 방법론적인 차이 및 계산상의 오차인 것으로 사료된다. 이렇게 두 가지 독립적인 방법으로 추출된 모호면을 하나로 통합하기 위한 한 방법으로, 두 모호면의 차이를 계산한 후, 이를 최소자승법을 이용, 두 모호면을 보정하였다. 결과적으로 한반도의 최종 모호면의 평균심도는 32.0km, 표준편차는 2.5km 이며, 최소, 최대 심도는 20.3, 36.6km으로 나타났다. 이 경우 지형에 의한 중력효과는 스펙트럼대비법에 의해 제거된 결과이나, 한반도의 지각이 완전한 지각판 내에 놓여 있어서 Airy-Heiskanin 지각균형설의 가정이 타당성이 있는가, 혹은 국부적인 응력장에 의해 한반도의 지각이 과연 얼마나 지지되고 있는가 하는 것에 대한 추가적인 연구가 필요하며, 이에 앞서, 일정한 밀도차를 갖는 연속적인 밀도변화층이 존재한다는 가정이 반드시 필요하다.에는 관련성을 갖고 있으며, 이는 유류 분해정도를 파악하는 지시자로써 특정 무기 오염물질을 이용할 수 있을 가능성이 있으므로 좀더 이들 관계성에 대한 연구가 진행될 필요성이 있다고 판단된다.고 과학적으로 분석할 수 있는 방법이 될 수 있을 것으로 기대된다. 의미를 되새기는 것으로 짧은 연구를 시작하겠다. 등은 활성 값이 70% 이상으로 퇴적물 독성이 상대적으로 낮았다. 이중나선 DNA 함량은 28.4 % - 49%로 대조군에 비해서 감소가 크다. 대부분의 정점이 대조군의 30% 내외로 정점 간의 차이는 크지는 않다. 그러나 다른 측정자료와 같이 정점 22에서 18%로 최소치를 나타내고, 정점 2, 12에서 20% 내외의 값을 보인다. 종합적으로 볼 때 오염물질의 유입이 크고, 광양제철 인근 정점 들이 모두 다른 정점에 비해서 낮아서, 퇴적물 독성이 높은 정점으로 조사되었다.hiwo의 광합성 능력은 낮은 농도들에서는 대조구와 유사하였으나, 5 $\mu\textrm{g}$/l의 높은 농도에서는 초기에 매우 낮은 광합성 능력을 보이다가 시간이 경과하면서 대조군보다 더 높은 경향을 나타냈다. 이러한 결과는 식물플랑크톤이 benso[a]pyrene의 낮은 농도에서 노출될 때는 이 물질을 탄소원으로 사용할 가능성이 있음을 시사한다. 본 연구의 결과들은 연안해역에 benso[a]pyrene과 같은 지속성 유기오염물질이 유입되었을 때 내정여부에 따라 식물플랑크톤 군집내 종 천이와 일차생산력에 크게 영향을 미칠 수 있음을 시사한다.TEX>5.2개)였으며, 등급별 회수율은 각각 GI(8.5%), GII

  • PDF