• 제목/요약/키워드: 어의 애매성 해결

검색결과 10건 처리시간 0.032초

구문관계에 기반한 단서의 결정 리스트를 이용한 지도학습 어의 애매성 해결 방법 (A Method of Supervised Word Sense Disambiguation Using Decision Lists Based on Syntactic Clues)

  • 김권양
    • 한국지능시스템학회논문지
    • /
    • 제13권2호
    • /
    • pp.125-130
    • /
    • 2003
  • 본 논문은 구문관계에 기반한 단서의 결정 리스트를 이용한 지도학습 어의 애매성 해결 방법을 제시한다. 이 방법은 주어진 단어의 어의 애매성을 해결하기 위해 애매한 의미를 가지는 단어와 문맥 내 주변 단어들 사이의. 구문적 관계에 비중을 두며, 모든 단서들을 통합하는 대신에 주어진 문맥 내에서 애매성 해결에 최상이 되는 단일 증거를 규명하고 이용함으로써 올바른 의미를 결정한다. 10개의 한국어 동사에 대한 실험 결과 주변 문맥 단어 외에 구문적인 단서를 추가한 방법이 정확도 성능에 있어서 기준 정확도보다 33% 향상됨을 보였으며, 결정 리스트를 사용한 방법이 모든 애매성 해결에 대한 단서들을 통합하는 방법보다 3%의 정확도 성능 개선을 보였다.

구문 지시자를 통합한 통계적 어의애매성 해결 (A Statistical Word Sense Disambiguation Using Combinations of Syntactic Indicators)

  • 김권양;최재혁
    • 컴퓨터교육학회논문지
    • /
    • 제5권2호
    • /
    • pp.11-19
    • /
    • 2002
  • 본 논문에서는 지도학습 알고리즘에 기반한 한국어 타동사의 어의 애매성 해결을 위한 통계적방법을 제안한다. 본 논문에서 제안한 어의 애매성 해결 방법은 주어진 동사와 문맥 내에서 이들 동사의 주변 단어들과의 구문적 관계에 기반한 지시자들을 결합한 방법이다. 비교적 애매성이 심한 한국어 타동사 10개에 대한 어의 애매성 해결 실험 결과, 구문 관계에 기반한 지시자를 사용한 어의 애매성 해결 방법이 기준 정확도 성능 평가보다 27%의 정확도 성능 개선을 보였으며, 지시자 유형에 대해 가중치를 부여한 방법이 문맥 내에 무순서적인 주변 단어에 대한 정보만을 사용하는 방법에 비해 12% 정확도 성능 개선을 보였다.

  • PDF

상위어 시퀀스의 클러스터링을 이용한 단어의 의미 애매성 해소 (Word Sense Disambiguation using Hypernym Sequence Clustering)

  • 정창후;최윤수;최성필;윤화묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.935-936
    • /
    • 2009
  • 본 논문에서는 과학기술문서에 존재하는 기술용어와 이들 간의 연관관계를 설명하는 디스크립터를 찾아서 [subject predicate object] 형태의 트리플을 생성하는 애플리케이션을 개발할 때 발생하는 단어 의미 애매성 해소 문제를 다룬다. 기술용어가 가지고 있는 연관관계를 결정하기 위해서 워드넷의 신셋 정보를 사용하는데 이 방법은 동사를 워드넷에 매핑할 때와 상위어 관계로 전이할 때 여러 개의 의미에 매핑되는 문제점이 발생한다. 이것을 해결하기 위해서 상위어 시퀀스 클러스터링을 이용한 단어의 의미 애매성 해결 방안을 제시한다. 이 방법을 사용함으로써 워드넷 매핑과 상위어 전이 시에 발생하는 다중 매핑 문제를 동시에 해결할 수 있다.

대명사의 종류에 따른 참조해결과정

  • 이재호;이만영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.104-111
    • /
    • 1990
  • 대명사의 종류에 따른 대명사의 어휘적 특성이 대용어 참조해결에 미치는 효과를 살펴보기 위해서 두개의 실험을 수행하였다. 실험 1에서는 대명사 문장의 읽기시간과 선행어에 대한 어휘판단과제를 통해서 복수가 단수에 비해 읽기시간은 빠르지만, 어휘판단시간은 단수가 빠른 경향을 보였다. 그리고 단수는 애매성에 따라 반응시간의 차이를 보였다. 실험 2에서는 단수가 복수에 비해 어휘판단이 빠름을 반복하였다. 그리고 단수는 여전히 성별단서의 애매성에 대한 차이를 보였다. 이러한 결과는 대용어의 참조해결에 미치는 여러 요인 중에서 대명사의 어휘적 특성이 한 요인임을 증명하였다. 결론적으로 대명사의 종류에 따라 참조해결과정이 다르게 일어 날 가능성과 표상되는 글 모형도 달라질 수 있는 가능성을 제시하였다.

  • PDF

동사의 애매성 해소를 위한 시소러스의 이용과 한계 (Using Thesaurus for Disambiguation and if's limit)

  • 송영빈;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.255-261
    • /
    • 2000
  • 동사의 애매성 해소는 언어학의 여러 부문 중에서도 가장 실체가 불명확한 의미를 다루는 것이기 때문에 언어학뿐만 아니라 자연언어처리에 있어서도 가장 해결하기 어려운 문제 중에 하나이다. 애매성은 언어학에서 말하는 동음이의어와 다의어를 동시에 포괄하는 개념으로 정의된다. 단일어를 대상으로 한 이와 같은 분류는 비교적 명확한 반면 두 개의 언어 이상의 다국어를 대상으로 하는 기계번역용 사전과 같은 대역사전에 있어서는 동음이의어와 다의어의 구별은 경계가 불명확하여 의미에 기반한 대역어의 작성에 도움이 되지 않는다. 그 원인은 의미를 구성하는 세 가지 요소인 [실체], [개념], [표현]의 관점에서 [실체]와 [개념]은 어느 언어를 막론하고 보편적인 반면 [실체]와 [개념]을 최종적으로 실현하는 형태인 [표현]의 경우 각각의 언어에 따라 그 형태가 다르게 표출된다고 하는 사실 때문이다. [나무]라는 [실체]가 있다고 할 때 [나무]에 대한 [실체]와 [개념]은 언어를 초월해서 공통적이라고 할 수 있다. 한편 [개념]을 표현하는 실체인 [표현]은 언어에 따라 [namu](한국어_, [ki](일본어),[tree](영어) 등과 같이 언어에 따라 자의적으로 [개념]을 표현하고 있다. [namu], [ki], [tree]가 같은 뜻을 나타낸다고 인식할 수 있는 것은 [개념]이 같기 때문이지 이들 각각의 [표현]이 의미적 연관성을 갖고 있기 때문은 아니다. 지금까지 의미를 다루는 연구에서는 이와 같은 관점이 결여됨으로 인해 의미의 다양성을 정확히 파악하는 데 한계가 있었으며 애매성 해소에 관한 연구도 부분적 시도에 그친 면이 적지 않다. 본고에서는 다국어를 대상으로 한 대역사전의 구축에 있어서 다의어와 동음이의어에 대한 종래의 분류의 문제점을 지적하고 나아가 애매성 해소의 한 방법론으로 활발히 이용되고 있는 시소러스의 분류체계의 한계를 지적한다. 나아가 이의 해결책을 한국어와 일본어의 대역사전의 구축에서 얻어진 경험을 바탕으로 제시한다.

  • PDF

동사의 애매성 해소를 위한 시소러스의 이용과 한계 (Using Thesaurus for Disambiguation and it's limit)

  • 송영빈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-261
    • /
    • 2000
  • 동사의 애매성 해소는 언어학의 여러 부문 중에서도 가장 실체가 불명확한 의미를 다루는 것이기 때문에 언어학뿐만 아니라 자연언어처리에 있어서도 가장 해결하기 어려운 문제 중에 하나이다. 애매성은 언어학에서 말하는 동음이의어와 다의어를 동시에 포괄하는 개념으로 정의된다. 단일어를 대상으로 한 이와 같은 분류는 비교적 명확한 반면 두 개의 언어 이상의 다국어를 대상으로 하는 기계번역용 사전과 같은 대역사전에 있어서는 동음이의어와 다의어의 구변은 경계가 불명확하여 의미에 기반한 대역어의 작성에 도움이 되지 않는다. 그 원인은 의미를 구성하는 세 가지 요소인 [실체], [개념], [표현]의 관점에서 [실체]와 [개념]은 어느 언어를 막론하고 보편적인 반면 [실체]와 [개념]을 최종적으로 실현하는 형대인 [표현]의 경우 각각의 언어에 따라 그 형태가 다르게 표출된다고 하는 사실 때문이다. [나무]라는 [실체]가 있다고 할 때 [나무]에 대한 [실체]와 [개념]은 언어를 초월해서 공통적이라고 할 수 있다. 한편, [개념]을 표현하는 실체인 [표현]은 언어에 따라 [namu](한국어), [ki](일본어), [tree](영어) 등과 같이 언어에 따라 자의적으로 [개념]을 표현하고 있다. [namu], [ki], [tree]가 같은 뜻을 나타낸다고 인식할 수 있는 것은 [개념]이 같기 때문이지 이들 각각의 [표현]이 의미적 연관성을 갖고 있기 때문은 아니다. 지금까지 의미를 다루는 연구에서는 이와 같은 관점이 결여됨으로 인해 의미의 다양성을 정확히 파악하는 데 한계가 있었으며 애매성 해소에 관한 연구도 부분적 시도에 그친 면이 적지 않다. 본고에서는 다국어를 대상으로 한 대역사전의 구축에 있어서 다의어와 동음이의어에 대한 종래의 분류의 문제점을 지적하고 나아가 애매성 해소의 한 방법론으로 활발히 이용되고 있는 시소러스의 분류체계의 한계를 지적한다. 나아가 이의 해결책을 한국어와 일본어의 대역사전의 구축에서 얻어진 경험을 바탕으로 제시한다.

  • PDF

일한 기계 번역의 성능 향상을 위한 조동사 れる/られる의 애매성 해결 (Disambiguation of Auxiliary Verbs "reru/rareru" in Japanese-Korean MT System)

  • 한명수;문경희;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.188-190
    • /
    • 2000
  • 본 논문은 고품질의 일한 기계 번역 시스템의 개발을 위해서, 코퍼스에서 높은 빈도로 나타나는 일본어 조동사 れる/られる의 애매성 해소 방법을 제안한다. 조동사 れる/られる는 동사와 접속하여 가능, 자발, 피동, 존경의 네 가지 의미로 사용되며, 문맥에 따라서 그 의미가 결정된다. 본 논문에서는 특히, 한국어에는 존재하지 않는 간접 피동과 여격 및 대격을 동시에 가지는 수여동사의 이중피동에 중점을 두어, 동사의 결합가 정보와 구문분석을 통한 패턴 매칭 방법을 이용하여 애매성을 해소하였다. 코퍼스로부터 용법별로 추출된 300 문장을 실험 대상으로 기존의 방법과 논문의 방법을 비교, 평가한 결과 33%의 번역률 향상을 보였다.

  • PDF

피봇 기계번역시스템에서의 한국어생성을 위한 문제선정 (Style Selection for Korean Generation under the Pivot MT System)

  • 이종혁
    • 인지과학
    • /
    • 제1권2호
    • /
    • pp.279-291
    • /
    • 1989
  • 피봇 기계번역 시스템하에서 자연스런 출력문 생성을 위한 문체선정 문제는 표층 구문정보를 배제한 언어에 의존하지 않는 중간표현의 특성과 언어마다 문화적 차이에서 기인한 사고.발상의 차이로 인해 큰 어려움을 갖는다.본논문은 이들 문제점들을 해결하기 위한 시도로 첫째,출력문의 자연스런 문장구조를 크게 좌우하는 태의 화용적.문체적 결정과 한국어의 심한 피동 제약 가운데서의 태의 생성,둘째,한국어 특유의 표현양식을 위한 문장구조 변경,마지막으로 출력문에서 기능어의 의미 애매성을 제거하기 위한 실질어를 이용한 의미보완 등을 논한다.

TMS320F240 칩을 이용한 전동차의 퍼지 주행 제어기에 대한 연구 (Study on Fuzzy Control of Electric Car via TMS320F240)

  • 손진우;최석민;송동국;김종건;배종일;이만형
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2381-2383
    • /
    • 1998
  • 직류직권모터는 전동지게차와 같은 물류용 전동차에서 사용되는데, 우수한 기동 토오크를 가지는 반면에 파라미터의 열적, 변화가 심하고 마찰과 부하의 비선형성이 존재해 기존의 제어기로는 만족할 만한 성능을 내지 못한다. 본 논문에서는 이를 해결하기 위해 퍼지제어기를 사용한다. 퍼지제어기는 변수의 애매성에 바탕을 두고 제어하기 때문에 이러한 비선형성에 대해 강인하나, 소속함수의 결정과 퍼지규칙의 선정이 어려우며, 체계적인 방법이 존재하지 않는다. 이러한 퍼지제 어의 결점을 해결하기 위해 소속함수는 유전 알고리즘을 통해 자기동조 시키며 퍼지규칙은 오차와 오차변화율의 위상평면을 이용하여 결정한다. 실용성을 검증하기 위해 TI사의 DSP TMS320F240을 이용해 실시스템에 적용했으며, 이를 통해 부하의 변동 및 기준 속도의 변화에도 잘 대처함을 알 수가 있었다.

  • PDF

퍼지 추론에 의한 자연언어 정보 검색 (Natural Language Information Retrieval by Fuzzy Inference)

  • 박현규;오종훈;김명호;최기선;이광형
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.243-250
    • /
    • 2001
  • 인터넷 전자 상거래 시스템에서 주로 일어나는 정보 검색은 사용자의 상품정보 요구라고 할 수 있다. 이와 같이 사용자가 원하는 상품 정보를 웹 환경에서 검색하기 위해서는 편리한 검색 환경의 제공뿐만 아니라, 검색 성능의 효율성 또한 우수해야 한다. 인터넷 인구와 온라인 쇼핑몰의 급격한 증가로 인해 다양한 조건 검색에 의한 상품검색 요구가 증대되고 있다. 또한, 이러한 상품의 검색 결과는 사용자의 의도와 의미상으로 밀접한 관계를 가져야 한다. 자연언어 정보검색은 이러한 요구의 중요한 대안으로 대두되고 있으나, 자연언어 자체가 가지는 애매한 의미의 해석 등으로 인하여 상용 시스템에 적용하는데 많은 어려움이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 퍼지추론을 이용한다. 입력된 자연언어 질의에서 형태소 분석을 통하여 데이터베이스 질의에 사용될 수 있는 의미어(content word)를 추출한 후, 의미어들을 재구성하여 템플릿을 작성한다. 작성된 템플릿은 퍼지 추론을 통하여 의미의 애매성을 해소하고 데이터베이스 질의로 변환하여 사용자의 질의 의도와 부합되는 검색 결과를 제시한다.

  • PDF