• Title/Summary/Keyword: 애매어

Search Result 21, Processing Time 0.026 seconds

An Expansion of Vector Space for Document Classifications (문서 분류에 이용 가능한 벡터 공간의 확장 방법)

  • Lee, Samuel Sangkon;Yoo, Kyungseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.782-784
    • /
    • 2015
  • 본 논문에서는 한국어 문서의 분류 정밀도 향상을 위해 애매어와 해소어 정보를 이용한 확장된 벡터 공간 모델을 제안하였다. 벡터 공간 모델에 사용된 벡터는 같은 정도의 가중치를 갖는 축이 하나 더 존재하지만, 기존의 방법은 그 축에 아무런 처리가 이루어지지 않았기 때문에 벡터끼리의 비교를 할 때 문제가 발생한다. 같은 가중치를 갖는 축이 되는 단어를 애매어라 정의하고, 단어와 분야 사이의 상호정보량을 계산하여 애매어를 결정하였다. 애매어에 의해 애매성을 해소하는 단어를 해소어라 정의하고, 애매어와 동일한 문서에서 출현하는 단어 중에서 상호정보량을 계산하여 해소어의 세기를 결정하였다. 본 논문에서는 애매어와 해소어를 이용하여 벡터의 차원을 확장하여 문서 분류의 정밀도를 향상시키는 방법을 제안하였다.

Korean Document Classification Using Extended Vector Space Model (확장된 벡터 공간 모델을 이용한 한국어 문서 분류 방안)

  • Lee, Samuel Sang-Kon
    • The KIPS Transactions:PartB
    • /
    • v.18B no.2
    • /
    • pp.93-108
    • /
    • 2011
  • We propose a extended vector space model by using ambiguous words and disambiguous words to improve the result of a Korean document classification method. In this paper we study the precision enhancement of vector space model and we propose a new axis that represents a weight value. Conventional classification methods without the weight value had some problems in vector comparison. We define a word which has same axis of the weight value as ambiguous word after calculating a mutual information value between a term and its classification field. We define a word which is disambiguous with ambiguous meaning as disambiguous word. We decide the strengthness of a disambiguous word among several words which is occurring ambiguous word and a same document. Finally, we proposed a new classification method based on extension of vector dimension with ambiguous and disambiguous words.

Design of Fuzzy SQL System Using User Interface (사용자 인터페이스를 이용한 Fuzzy SQL 시스템의 설계)

  • 윤희석;김병섭;박순철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.365-367
    • /
    • 1998
  • 기존의 관계형 데이터베이스에서는 정확한 조건을 만족시키는 부율형태의 질의만을 제공해왔다. 그러나 사용자들은 정확한 질의뿐만 아니라 애매한 질의에 대한 결과도 함께 요구하기 때문에 퍼지 질의어(FSQL)에 대한 연구가 활발히 추진되고 있다. 이에 본 논문에서는 퍼지 질의어 처리를 위한 이론적 배경과 비연속적인 퍼지집합 처리를 위한 시스템의 설계를 통해서 애매한 질의어 처리의 가능성을 보여준다.

Design and Prototype Implementation of FSQL System in Relational Databases (관계형데이터베이스에서 FSQL 시스템의 설계 및 프로토타입 구현)

  • 김병섭;박순철;김창석
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1997.11a
    • /
    • pp.39-52
    • /
    • 1997
  • 데이터베이스에 대한 사용자의 요구는 증가하는 반면에 기존의 관계형 데이터베이스에서 사용하는 질의어들은 사용자로 하여금 정확한 조건을 알아야만 하는 부울 형태의 질의만을 제공하는 제약이 있다. 그러나, 사용자들은 조건을 확실하게 모르는 애매한 질의에 대한 결과를 요구하며, 이러한 이유로 퍼지 질의어(FSQL)에 대한 연구가 계속되고 있다. 이에 본 논문에서는 새로운 퍼지 질의어 형태를 정의하고, 정의한 퍼지 질의어를 구현하기 위해서MetaDatabase를 사용하는 방법을 소개한다. 이러한 방법을 이용하여 기존의 관계형 데이터베이스를 유지하면서 퍼지 질의어를 제공할 수 있는 FSQL(Fuzzy SQL) 시스템의 프로토타입을 개발하였다.

  • PDF

Pattern Recognition by Section Detection Using Speech Word (음성 단어를 이용한 구간검출에 의한 패턴인식)

  • Choi, Jae-Seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

Design and Implementation of Graphical Field Recognizer (그래픽컬한 분야인식기의 설계 및 구현)

  • 이원휘;김도연;이상곤
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.769-771
    • /
    • 2004
  • 사람은 문서를 읽을때 문서 전체를 읽지 않더라도 대표적인 단어를 보는 것만으로 정치, 경제, 교육, 스포츠 등의 분야를 정확히 인지한다. 이러한 단어를 분야연상어로 정의하고, 빈도수 조사를 통해 전자사전에 자동으로 구축한다. 이러한 분야연상 어는 문서의 초기인식 시 어느 분야인지 분명하지 않거나 애매한 경우에도 문서를 읽어가면서 분야를 인지할 수 있도록 도와준다. 본 논문에서는 이러한 특성을 가지고 있는 분야연상어를 이용하여 시스템에 새로운 문서가 주어질 때 해당 문서의 분야정보를 추출하고 분야연상어의 분포정보를 인간에게 그래픽컬 하게 보여줄 수 있도록 분야인식기를 설계하고 구현한다.

  • PDF

A Processing of Progressive Aspect in Japanese-Korean Machine Translation (일한번역시스템에서 진행형의 번역처리)

  • 김정인;문경희;이종혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.185-187
    • /
    • 2000
  • 일본어에서 "てぃる"형태는 동작진행과 상태진행을 모두 나타내지만 한국어에서는 "고 있다"와 "어 있다"로 나누어 표기한다. 양 언어간의 상적인 의미 대응은 간단하지 않지만, 술부의 의미정보, 부사와 부사어의 의미정보 등을 이용하여 "てぃる"형태의 상적인 의미를 결정하는 것이 가능하다. "てぃる"형태의 적절한 대역어 선정을 위하여, 사전 속의 모든 일본어 술어에 다섯 종류의 의미코드를 입력한다. 즉, "1:동작진행만으로 사용되는 술어", "2:일반적으로는 동작진행으로 사용되지만, 수동인 경우에는 상태진행의 형태로도 사용되는 술어", "3:상태진행으로만 사용되는 술어", "4:동작진행, 상태진행의 구별이 애매한 술어", "5:기타"등의 상적인 의미분류코드를 술어별로 입력한다. 그리고 "2", "4" 형태의 술어로부터 진행형을 구별하기 위하여 부사와 부사어를 사용하는 방법을 제안한다.uot;5:기타"등의 상적인 의미분류코드를 술어별로 입력한다. 그리고 "2", "4" 형태의 술어로부터 진행형을 구별하기 위하여 부사와 부사어를 사용하는 방법을 제안한다.여 부사와 부사어를 사용하는 방법을 제안한다.

  • PDF

van McGee's Counterexample, Probability, and Equivocation (반 멕기의 반례, 확률, 그리고 애매성)

  • Choi, Wonbae
    • Korean Journal of Logic
    • /
    • v.19 no.2
    • /
    • pp.233-251
    • /
    • 2016
  • In their recent paper published in this journal Shin Kim and Jinyong Lee have attacked some previous studies on the counterexample to modus ponens. Among their arguments I would like to discuss the following two; first, those attempts to explain van McGee's example by reference to conditional probability do not accord with van McGee's position, second, van McGee'e example is to be best seen as an argument containing the fallacy of equivocation. I show that the first argument is not correct, the second one is not so persuasive as it seemed first.

  • PDF

Recognition of Foreign Nouns using Syllable Frequency (음절 빈도를 이용한 외래어 명사의 인식)

  • 강승식;전영진
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.408-411
    • /
    • 2003
  • 정보 검색에서 우리가 자주 쓰는 단어는 표준어인 경우도 있고 통신어인 경우도 있고 외국어인 경우도 있다. 그러나 표준어가 아닌 다른 언어로 검색을 하면 다른 결과가 나타날 수 있다. 예를 들어 컴퓨터에 관한 정보를 찾을 때 ‘컴퓨타’로 검색을 하면 다른 검색 결과가 나오게 된다. 우리나라에서 현재 쓰이고 있는 말들은 이런 애매한 발음의 외래어가 많이 생성되고 소멸된다. 그러므로 이런 외래어들을 전부 사전에 등록할 수는 없고 설사 등록한다 하더라도 용량과 검색시간만 늘어나게 된다. 본 논문에서는 검색엔진에서 이런 외래어에 대한 인식 성능을 높이기 위해 외래어 사전 없이 외래어를 인식하는 방안을 제시한다.

  • PDF

A Method of Supervised Word Sense Disambiguation Using Decision Lists Based on Syntactic Clues (구문관계에 기반한 단서의 결정 리스트를 이용한 지도학습 어의 애매성 해결 방법)

  • Kim, Kweon-Yang
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.2
    • /
    • pp.125-130
    • /
    • 2003
  • This paper presents a simple method of supervised word sense disambiguation using decision lists based on syntactic clues. This approach focuses on the syntactic relations between the given ambiguous word and surrounding words in context for resolving a given sense ambiguity. By identifying and utilizing only the single best disambiguation evidence in a given context instead of combining a set of clues, the algorithm decides the correct sense. Experiments with 10 Korean verbs show that adding syntactic clues to a basic set of surrounding context words improves 33% higher performance than baseline accuracy. In addition, our method using decision lists is 3% higher than a method using integration of all disambiguation evidences.